Czym jest uczenie maszynowe?

Uczenie maszynowe jest podzbiorem sztucznej inteligencji (AI), w którym komputery uczą się na podstawie danych i ulepszają z doświadczeniem bez jawnego programowania.

Szczegółowa definicja uczenia maszynowego

Uczenie maszynowe jest podzbiorem sztucznej inteligencji (AI). Skupia się na nauczaniu komputerów, jak uczyć się na danych i doskonalić w miarę zdobywania doświadczenia. Procesy uczenia i doskonalenia się nie są zaprogramowane. W uczeniu maszynowym algorytmy są trenowane pod kątem znajdowania wzorców i korelacji w dużych zbiorach danych oraz podejmowania najlepszych decyzji i formułowania prognoz na podstawie wyników takiej analizy. Systemy wykorzystujące uczenie maszynowe z czasem stają się coraz skuteczniejsze, a im lepszy mają dostęp do danych, tym większą wykazują dokładność.

 

Technologie uczenia maszynowego znajdują zastosowanie we wszystkich obszarach codziennego życia — w naszych domach, koszykach zakupowych, multimediach i opiece zdrowotnej.

Jak uczenie maszynowe wiąże się ze sztuczną inteligencją?

Uczenie maszynowe – i jego elementy składowe głębokiego uczenia się i sieci neuronowych – wszystkie pasują jako koncentryczne podzbiory sztucznej inteligencji. Sztuczna inteligencja przetwarza dane w celu podejmowania decyzji i prognoz. Algorytmy uczenia maszynowego pozwalają sztucznej inteligencji nie tylko przetwarzać te dane, ale także wykorzystywać je do uczenia się i zwiększania ich inteligencji, bez konieczności dodatkowego programowania. Sztuczna inteligencja jest elementem nadrzędnym wszystkich podzbiorów uczenia maszynowego pod nią. W pierwszym podzbiorze jest uczenie maszynowe; w tym głębokim uczeniu się, a następnie sieci neuronowe w tym.

Czym jest sieć neuronowa?

 

Sztuczna sieć neuronowa (ang. artificial neural network, ANN) jest modelowana na podstawie neuronów w biologicznym mózgu. Sztuczne neurony, nazywane „węzłami”, są pogrupowane w liczne warstwy, które działają równolegle. Kiedy sztuczny neuron otrzymuje sygnał numeryczny, przetwarza go i przekazuje tę informację do pozostałych neuronów, które są z nim połączone. Podobnie jak w ludzkim mózgu, wzmocnienie neuronów umożliwia lepsze rozpoznawanie wzorców, gromadzenie wiedzy fachowej i ogólnie — uczenie się.

 

Czym jest głębokie uczenie?

 

Ten rodzaj uczenia maszynowego nazywany jest „głębokim”, ponieważ angażuje wiele warstw sieci neuronowej i wykorzystuje ogromne ilości złożonych, rozproszonych danych. W przypadku uczenia głębokiego (ang. deep learning) system uruchamia wiele warstw sieci, uzyskując stopniowo wyniki na coraz wyższym poziomie dokładności. Przykładem może być system uczenia głębokiego przetwarzający obrazy roślin i szukający wśród nich stokrotki pospolitej. W pierwszej warstwie rozpozna on roślinę. Przechodząc przez kolejne warstwy sieci neuronowej, zidentyfikuje kwiat, następnie stokrotkę i wreszcie stokrotkę pospolitą. Uczenie głębokie jest stosowane między innymi przy rozpoznawaniu mowy, klasyfikowaniu obrazów i analizie farmaceutycznej.

Jak działa uczenie maszynowe?

Uczenie maszynowe składa się z różnych typów modeli uczenia maszynowego, przy użyciu różnych technik algorytmicznych. W zależności od charakteru danych i pożądanego wyniku można zastosować jeden z czterech modeli uczenia się: nadzorowany, nienadzorowany, częściowo nadzorowany lub wzmacniający. W każdym z tych modeli może być zastosowana jedna lub więcej technik algorytmicznych – w odniesieniu do używanego zbioru danych i zamierzonych wyników. Algorytmy uczenia maszynowego są zasadniczo zaprojektowane do klasyfikowania rzeczy, znajdowania wzorców, przewidywania wyników i podejmowania świadomych decyzji. Algorytmy mogą być używane pojedynczo lub łączone, aby osiągnąć najlepszą możliwą dokładność, gdy chodzi o złożone i bardziej nieprzewidywalne dane.

Jak działa proces uczenia maszynowego

Na czym polega uczenie nadzorowane?

 

Uczenie nadzorowane to pierwszy z czterech modeli uczenia maszynowego. W algorytmach uczenia nadzorowanego nauka opiera się na przykładach. Modele uczenia nadzorowanego obejmują pary danych „wejściowych” i „wyjściowych”, przy czym dane wyjściowe są oznaczone oczekiwaną wartością. Załóżmy na przykład, że celem jest nauczenie systemu odróżniania stokrotek od bratków. Para danych wejściowych zawiera obraz stokrotki i obraz bratka. Oczekiwany wynik dla tej konkretnej pary to stokrotka, więc obraz stokrotki jest wstępnie oznaczony jako prawidłowa odpowiedź.

 

W ramach algorytmu system kompiluje dane treningowe i z czasem zaczyna określać korelatywne podobieństwa, różnice i inne elementy logiczne. Wreszcie jest w stanie przewidzieć, który obraz zostanie oznaczony jako stokrotka. Odpowiednikiem tego procesu jest dawanie dziecku zestawu zadań z kluczem odpowiedzi, a następnie proszenie, aby przedstawiło wyniki swojej pracy i wyjaśniło sposób dochodzenia do rozwiązania. Modele uczenia nadzorowanego znajdują zastosowanie w wielu mechanizmach, które znamy z życia codziennego, na przykład rekomendacjach produktów czy aplikacjach do analizy ruchu (takich jak Waze), które przewidują najszybszą trasę o różnych porach dnia.

 

Na czym polega uczenie nienadzorowane?

 

Uczenie nienadzorowane to drugi z czterech modeli uczenia maszynowego. W modelach uczenia nienadzorowanego nie ma klucza odpowiedzi. System bada dane wejściowe, z których większość nie jest oznaczona ani uporządkowana, i zaczyna identyfikować wzorce oraz korelacje, wykorzystując do tego wszystkie istotne, dostępne dane. Pod wieloma względami uczenie nienadzorowane przypomina sposób, w jaki ludzie obserwują świat. Posługujemy się intuicją i doświadczeniem, aby łączyć dostrzegane zjawiska w grupy. W miarę jak napotykamy kolejne przykłady, rośnie nasza zdolność do dokładnego kategoryzowania i identyfikowania pojęć. W przypadku maszyn nabywane w ten sposób „doświadczenie” definiuje się ilością danych wejściowych i udostępnionych. Typowymi przykładami zastosowania uczenia nienadzorowanego w praktyce są funkcje rozpoznawania twarzy, analiza sekwencji genów, badania rynkowe i mechanizmy bezpieczeństwa cybernetycznego.

 

Na czym polega uczenie częściowo nadzorowane?

 

Uczenie częściowo nadzorowane to trzeci z czterech modeli uczenia maszynowego. W idealnym świecie wszystkie dane byłyby uporządkowane i oznaczone odpowiednią etykietą, zanim zostałyby wprowadzone do systemu. Nie jest to jednak możliwe do zrealizowania, dlatego w przypadku ogromnych ilości surowych, nieuporządkowanych danych dobrym rozwiązaniem okazuje się uczenie częściowo nadzorowane. Ten model obejmuje wprowadzanie do systemu małych ilości oznakowanych danych w celu wzbogacenia zbiorów danych bez etykiety. Oznakowane dane mają za zadanie uruchomić proces. Mogą też znacznie poprawić szybkość i dokładność uczenia się. Algorytm uczenia częściowo nadzorowanego poleca systemowi analizowanie oznakowanych danych pod kątem właściwości korelatywnych, które można by zastosować do danych bez etykiety.

 

Jak dogłębnie omówiono w dokumencie badawczym MIT Press, istnieje jednak ryzyko związane z tym modelem, w którym wady oznakowanych danych są poznawane i replikowane przez system. Firmy, które z największym powodzeniem korzystają z częściowo nadzorowanych szkoleń, zapewniają wdrożenie protokołów najlepszych praktyk. Nauczanie półnadzorowane jest wykorzystywane w analizie mowy i językowej, złożonych badaniach medycznych, takich jak kategoryzacja białek i wykrywanie oszustw na wysokim poziomie.

 

Na czym polega uczenie ze wzmocnieniem?

 

Uczenie ze wzmocnieniem to czwarty model uczenia maszynowego. W uczeniu nadzorowanym system otrzymuje klucz odpowiedzi i uczy się poprzez znajdowanie korelacji między wszystkimi prawidłowymi wynikami. Model uczenia ze wzmocnieniem nie uwzględnia klucza odpowiedzi, lecz posługuje się zbiorem dozwolonych działań, reguł i potencjalnych stanów końcowych. Gdy oczekiwany cel algorytmu jest jednoznaczny bądź binarny, system może się uczyć na przykładach. Jednak w przypadku, w którym oczekiwany rezultat jest zmienny, niezbędne jest wykorzystanie doświadczeń i nagród. W modelach uczenia ze wzmocnieniem „nagroda” jest numeryczna i zaprogramowana w algorytmie jako coś, co system stara się zebrać.

 

Pod wieloma względami model ten przypomina uczenie kogoś gry w szachy. Z pewnością niemożliwe byłoby pokazanie takiej osobie każdego możliwego ruchu. Zamiast tego wyjaśnia się zasady i pozwala szlifować umiejętności w praktyce. Nagrody przybierają formę nie tylko wygrania gry, ale również zdobywania figur przeciwnika. Do zastosowań uczenia ze wzmocnieniem należą mechanizmy zautomatyzowanego składania ofert cenowych dla nabywców przestrzeni reklamowej online, opracowywanie gier komputerowych oraz gra na giełdzie przy wysokich stawkach.

Uczenie maszynowe w przedsiębiorstwach — w praktyce

Algorytmy uczenia maszynowego rozpoznają wzorce oraz korelacje, co oznacza, że bez problemu przeanalizują również własny wskaźnik zwrotu z inwestycji. W firmach inwestujących w technologie uczenia maszynowego pozwala to niemal natychmiast ocenić wpływ takich inwestycji na działalność. Przedstawione poniżej obszary zastosowania uczenia maszynowego w przedsiębiorstwach to tylko niewielka próbka coraz obszerniejszego zbioru możliwości.

  • Mechanizmy rekomendacji: w latach 2009–2017 liczba gospodarstw domowych w Stanach Zjednoczonych, w których wykupiono subskrypcję w serwisach streamingowych, wzrosła o 450%. W artykule z 2020 roku magazyn Forbes donosi o dalszym wzroście zainteresowania takimi usługami — nawet o 70%. Mechanizmy rekomendacji są stosowane przez wiele platform zakupowych, ale w usługach strumieniowego przesyłania muzyki i filmów zdecydowanie grają pierwsze skrzypce. ­

  • Dynamiczny marketing: tworzenie i wykorzystywanie okazji do sprzedaży wymaga gromadzenia i analizowania jak największych ilości danych o klientach. Interakcje ze współczesnymi konsumentami generują ogromny wolumen zróżnicowanych i nieuporządkowanych informacji — od transkrypcji czatów po przesyłane obrazy. Zastosowanie mechanizmów opartych na uczeniu maszynowym pomaga specjalistom ds. marketingu zrozumieć te dane i wykorzystać je do personalizowania treści marketingowych oraz pozyskiwania klientów i okazji do sprzedaży w czasie rzeczywistym.

  • ERP i automatyzacja procesów: bazy danych ERP zawierają szerokie i różne zbiory danych, które mogą obejmować statystyki wydajności sprzedaży, przeglądy konsumentów, raporty dotyczące trendów rynkowych i rekordy zarządzania łańcuchem dostaw. Algorytmy uczenia maszynowego mogą być używane do wyszukiwania korelacji i wzorców w takich danych. Te analizy mogą być następnie wykorzystywane do informowania praktycznie każdego obszaru działalności, w tym do optymalizacji przepływów pracy urządzeń Internetu rzeczy (IoT) w sieci lub najlepszych sposobów automatyzacji powtarzalnych lub podatnych na błędy zadań.

  • Przeglądy zapobiegawcze: nowoczesne łańcuchy dostaw i inteligentne fabryki coraz częściej sięgają po urządzenia i systemy IoT, a do komunikacji między flotą i procesami wykorzystują chmurę. Awarie i brak sprawności mogą skutkować ogromnymi kosztami oraz zakłóceniami. Gdy dane dotyczące konserwacji i napraw są gromadzone ręcznie, niemal niemożliwe jest przewidywanie potencjalnych problemów — nie mówiąc już o automatyzacji procesów w celu ich przewidywania i zapobiegania im. Tymczasem nawet wiekowe systemy analogowe można wyposażyć w czujniki bramy IoT, aby zapewnić widoczność i efektywność w całej firmie.

Wyzwania dotyczące uczenia maszynowego

W poświęconej fałszywym korelacjom książce Spurious Correlations Tyler Vigan, absolwent Uniwersytetu Harvarda i naukowiec zajmujący się analizą danych, zauważa, że nie wszystkie korelacje wskazują na faktyczny związek przyczynowo-skutkowy. W ramach przykładu prezentuje wykres pokazujący rzekomą silną korelację między konsumpcją margaryny a liczbą rozwodów w amerykańskim stanie Maine. Wykres ma oczywiście charakter humorystyczny, ale uczenie maszynowe rzeczywiście jest podatne na błędy i stronniczość zarówno ludzi, jak i algorytmów. A ze względu na skłonność takich systemów do uczenia się i adaptacji błędy oraz fałszywe korelacje mogą szybko się rozpowszechniać i zniekształcać wyniki w całej sieci neuronowej.

 

Dodatkowe wyzwanie stanowią modele uczenia maszynowego, w których algorytm i jego wyniki okazują się zbyt złożone, aby mogły zostać wyjaśnione oraz zrozumiane przez człowieka. Tak zwany model „czarnej skrzynki” może stanowić zagrożenie dla firmy, która nie będzie w stanie ustalić, w jaki sposób i dlaczego algorytm doszedł do konkretnego wniosku lub decyzji.

 

Na szczęście rośnie nie tylko złożoność zbiorów danych i algorytmów uczenia maszynowego, ale i dostępność narzędzi oraz zasobów do zarządzania ryzykiem. Najlepsze firmy starają się eliminować błędy i potencjalną stronniczość systemów, określając szczegółowe, stale aktualizowane wytyczne dotyczące nadzoru nad technologią AI oraz protokoły oparte na sprawdzonych metodach postępowania.

Często zadawane pytania na temat uczenia maszynowego

Uczenie maszynowe jest podzbiorem AI i nie może istnieć bez tej technologii. AI wykorzystuje i przetwarza dane w celu podejmowania decyzji i formułowania przewidywań — jest to mózg systemu komputerowego i jego „inteligencja”. Algorytmy uczenia maszynowego w ramach AI, jak również inne aplikacje oparte na sztucznej inteligencji, pozwalają systemowi nie tylko przetwarzać te dane, ale także wykorzystywać je do wykonywania zadań, tworzenia prognoz, uczenia się i rozwijania inteligencji, bez konieczności stosowania dodatkowego programowania. Dzięki nim AI może praktycznie wykorzystać swoją inteligencję oraz dane w konkretnym celu.

Tak, ale należy to potraktować jako przedsięwzięcie obejmujące całą firmę, a nie tylko jako modernizację infrastruktury informatycznej. Firmy, które osiągają najlepsze wyniki dzięki projektom transformacji cyfrowej, przeprowadzają rzetelną ocenę istniejących zasobów oraz zestawów umiejętności i upewniają się, że dysponują odpowiednimi systemami podstawowymi, zanim przejdą do działania.

W odniesieniu do uczenia maszynowego nauka danych jest podzbiorem; koncentruje się na statystykach i algorytmach, wykorzystuje techniki regresji i klasyfikacji oraz interpretuje i przekazuje wyniki. Uczenie maszynowe koncentruje się na programowaniu, automatyzacji, skalowaniu oraz uwzględnianiu i magazynowaniu wyników.

Uczenie maszynowe analizuje wzorce i korelacje; uczy się na nich i podlega optymalizacji w miarę upływu czasu. Eksploracja danych jest wykorzystywana jako źródło informacji dla uczenia maszynowego. Techniki eksploracji danych wykorzystują złożone algorytmy i mogą pomóc dostarczać lepiej zorganizowane zbiory danych do wykorzystania przez system uczenia maszynowego.

Połączone neurony ze sztuczną siecią neuronową nazywane są węzłami, które są połączone i zgrupowane w warstwach. Gdy węzeł odbiera sygnał numeryczny, następnie sygnalizuje inne istotne neurony, które działają równolegle. Głębokie uczenie się wykorzystuje sieć neuronową i jest „głębokie”, ponieważ wykorzystuje bardzo duże ilości danych i angażuje się w wiele warstw w sieci neuronowej jednocześnie.

Uczenie maszynowe to pojęcie łączące różne modele, techniki i technologie uczenia się, które mogą obejmować statystykę. Sama statystyka koncentruje się na wykorzystaniu danych do formułowania prognoz i tworzenia modeli do analizy.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel