Przejdź do zawartości
Technologia uczenia maszynowego rozpoznająca pojazdy

Czym jest uczenie maszynowe?

Uczenie maszynowe jest podzbiorem sztucznej inteligencji (AI). Skupia się na nauczaniu komputerów, jak uczyć się na danych i doskonalić się w miarę zdobywania doświadczenia. Procesy uczenia i doskonalenia się nie są zaprogramowane. W uczeniu maszynowym algorytmy są trenowane pod kątem znajdowania wzorców i korelacji w dużych zbiorach danych oraz podejmowania najlepszych decyzji i formułowania prognoz na podstawie wyników takiej analizy. Systemy wykorzystujące uczenie maszynowe z czasem stają się coraz skuteczniejsze, a im lepszy mają dostęp do danych, tym większą wykazują dokładność. Technologie uczenia maszynowego znajdują zastosowanie we wszystkich obszarach codziennego życia — w naszych domach, koszykach zakupowych, multimediach i opiece zdrowotnej.

Wyjaśnienie pojęcia uczenia maszynowego

Jak uczenie maszynowe wiąże się ze sztuczną inteligencją?

Uczenie maszynowe — i jego elementy, czyli technologia uczenia głębokiego oraz sieci neuronowe — stanowią nakładające się koncentrycznie podzbiory AI. AI przetwarza dane w celu podejmowania decyzji i formułowania prognoz. Algorytmy uczenia maszynowego pozwalają AI dodatkowo uczyć się na podstawie tych danych i rozwijać inteligencję bez konieczności stosowania dodatkowego programowania. Sztuczna inteligencja jest kategorią nadrzędną wobec wszystkich podzbiorów uczenia maszynowego. Pierwszy podzbiór stanowi uczenie maszynowe, kolejnym w jego obrębie jest głębokie uczenie, a wewnątrz niego znajdują się sieci neuronowe.

Schemat zależności między AI a uczeniem maszynowym

Schemat różnic między AI a uczeniem maszynowym

Czym jest sieć neuronowa?

 

Sztuczna sieć neuronowa (ang. artificial neural network, ANN) jest modelowana na podstawie neuronów w biologicznym mózgu. Sztuczne neurony, nazywane „węzłami”, są pogrupowane w liczne warstwy, które działają równolegle. Kiedy sztuczny neuron otrzymuje sygnał numeryczny, przetwarza go i przekazuje tę informację do pozostałych neuronów, które są z nim połączone. Podobnie jak w ludzkim mózgu, wzmocnienie neuronów umożliwia lepsze rozpoznawanie wzorców, gromadzenie wiedzy fachowej i ogólnie — uczenie się.

 

Czym jest głębokie uczenie?

 

Ten rodzaj uczenia maszynowego nazywany jest „głębokim”, ponieważ angażuje wiele warstw sieci neuronowej i wykorzystuje ogromne ilości złożonych, rozproszonych danych. W przypadku uczenia głębokiego system uruchamia wiele warstw sieci, uzyskując stopniowo wyniki na coraz wyższym poziomie dokładności. Przykładem może być system uczenia głębokiego przetwarzający obrazy roślin i szukający wśród nich stokrotki pospolitej. W pierwszej warstwie rozpozna on roślinę. Przechodząc przez kolejne warstwy sieci neuronowej, zidentyfikuje kwiat, następnie stokrotkę i wreszcie stokrotkę pospolitą. Uczenie głębokie jest stosowane między innymi przy rozpoznawaniu mowy, klasyfikowaniu obrazów i analizie farmaceutycznej.

Jak działa uczenie maszynowe?

Uczenie maszynowe obejmuje różne modele i różne techniki algorytmiczne. W zależności od charakteru danych i oczekiwanego wyniku można wykorzystać jeden z czterech modeli uczenia się: nadzorowany, nienadzorowany, częściowo nadzorowany lub ze wzmocnieniem. W każdym z tych modeli można zastosować co najmniej jedną technikę algorytmiczną — zależnie od używanych zbiorów danych i planowanych wyników. Algorytmy uczenia maszynowego są zasadniczo zaprojektowane pod kątem klasyfikowania danych, wyszukiwania wzorców, przewidywania wyników i podejmowania uzasadnionych decyzji. Algorytmy mogą być stosowane pojedynczo lub łącznie w celu uzyskania najwyższej możliwej dokładności, gdy dane są złożone i w dużym stopniu nieprzewidywalne. 

Jak działa proces uczenia maszynowego

Schemat działania uczenia maszynowego

Na czym polega uczenie nadzorowane?

 

Uczenie nadzorowane to pierwszy z czterech modeli uczenia maszynowego. W algorytmach uczenia nadzorowanego nauka opiera się na przykładach. Modele uczenia nadzorowanego obejmują pary danych „wejściowych” i „wyjściowych”, przy czym dane wyjściowe są oznakowane oczekiwaną wartością. Załóżmy na przykład, że celem jest nauczenie systemu odróżniania stokrotek od bratków. Para danych wejściowych zawiera obraz stokrotki i obraz bratka. Oczekiwany wynik dla tej konkretnej pary to stokrotka, więc obraz stokrotki jest wstępnie określony jako prawidłowa odpowiedź.

 

W ramach algorytmu system kompiluje dane treningowe i z czasem zaczyna określać korelatywne podobieństwa, różnice i inne elementy logiczne. Wreszcie jest w stanie przewidzieć, który obraz zostanie oznaczony jako stokrotka. Odpowiednikiem tego procesu jest dawanie dziecku zestawu zadań z kluczem odpowiedzi, a następnie proszenie, aby przedstawiło wyniki swojej pracy i wyjaśniło sposób dochodzenia do rozwiązania. Modele uczenia nadzorowanego znajdują zastosowanie w wielu mechanizmach, które znamy z życia codziennego, na przykład rekomendacjach produktów czy aplikacjach do analizy ruchu (takich jak Waze), które przewidują najszybszą trasę o różnych porach dnia.

 

Na czym polega uczenie nienadzorowane?

 

Uczenie nienadzorowane to drugi z czterech modeli uczenia maszynowego. W modelach uczenia nienadzorowanego nie ma klucza odpowiedzi. System bada dane wejściowe, z których większość nie jest oznakowana ani uporządkowana, i zaczyna identyfikować wzorce oraz korelacje, wykorzystując do tego wszystkie istotne, dostępne dane. Pod wieloma względami uczenie nienadzorowane przypomina sposób, w jaki ludzie obserwują świat. Posługujemy się intuicją i doświadczeniem, aby łączyć dostrzegane zjawiska w grupy. W miarę jak napotykamy kolejne przykłady, rośnie nasza zdolność do dokładnego kategoryzowania i identyfikowania pojęć. W przypadku maszyn nabywane w ten sposób „doświadczenie” definiuje się ilością danych wejściowych i udostępnionych. Typowymi przykładami zastosowania uczenia nienadzorowanego w praktyce są funkcje rozpoznawania twarzy, analiza sekwencji genów, badania rynkowe i mechanizmy bezpieczeństwa cybernetycznego.

 

Na czym polega uczenie częściowo nadzorowane?

 

Uczenie częściowo nadzorowane to trzeci z czterech modeli uczenia maszynowego. W idealnym świecie wszystkie dane byłyby uporządkowane i oznaczone odpowiednią etykietą, zanim zostałyby wprowadzone do systemu. Nie jest to jednak możliwe do zrealizowania, dlatego w przypadku ogromnych ilości surowych, nieuporządkowanych danych dobrym rozwiązaniem okazuje się uczenie częściowo nadzorowane. Ten model obejmuje wprowadzanie do systemu małych ilości oznakowanych danych w celu wzbogacenia zbiorów danych bez etykiety. Oznakowane dane mają za zadanie uruchomić proces. Mogą też znacznie poprawić szybkość i dokładność uczenia się. Algorytm uczenia częściowo nadzorowanego poleca systemowi analizowanie oznakowanych danych pod kątem właściwości korelatywnych, które można by zastosować do danych bez etykiety.

 

Model ten wiąże się jednak z ryzykiem (omówionym dokładniej w tym opracowaniu MIT Press) przyjęcia — i replikowania — przez system błędnych informacji, czyli danych, które zostały nieprawidłowo oznakowane. Firmy, które z największym powodzeniem wykorzystują uczenie częściowo nadzorowane, dbają o stosowanie protokołów opartych na sprawdzonych metodach. Uczenia częściowo nadzorowanego używa się w analizie mowy i analizie językowej, złożonych badaniach medycznych (na przykład dotyczących kategoryzowania białek) oraz wykrywaniu zaawansowanych oszustw.

 

Na czym polega uczenie ze wzmocnieniem?

 

Uczenie ze wzmocnieniem to czwarty model uczenia maszynowego. W uczeniu nadzorowanym system otrzymuje klucz odpowiedzi i uczy się poprzez znajdowanie korelacji między wszystkimi prawidłowymi wynikami. Model uczenia ze wzmocnieniem nie uwzględnia klucza odpowiedzi, lecz posługuje się zbiorem dozwolonych działań, reguł i potencjalnych stanów końcowych. Gdy oczekiwany cel algorytmu jest jednoznaczny bądź binarny, system może się uczyć na przykładach. Jednak w przypadku, w którym oczekiwany rezultat jest zmienny, niezbędne jest wykorzystanie doświadczeń i nagród. W modelach uczenia ze wzmocnieniem „nagroda” jest numeryczna i zaprogramowana w algorytmie jako coś, co system stara się zebrać.

 

Pod wieloma względami model ten przypomina uczenie kogoś gry w szachy. Z pewnością niemożliwe byłoby pokazanie takiej osobie każdego możliwego ruchu. Zamiast tego wyjaśnia się zasady i pozwala szlifować umiejętności w praktyce. Nagrody przybierają formę nie tylko wygrania gry, ale również zdobywania figur przeciwnika. Do zastosowań uczenia ze wzmocnieniem należą mechanizmy zautomatyzowanego składania ofert cenowych dla nabywców przestrzeni reklamowej online, opracowywanie gier komputerowych oraz gra na giełdzie przy wysokich stawkach.

Uczenie maszynowe w przedsiębiorstwach — w praktyce

Algorytmy uczenia maszynowego rozpoznają wzorce oraz korelacje, co oznacza, że bez problemu przeanalizują również własny wskaźnik zwrotu z inwestycji. W firmach inwestujących w technologie uczenia maszynowego pozwala to niemal natychmiast ocenić wpływ takich inwestycji na działalność. Przedstawione poniżej obszary zastosowania uczenia maszynowego w przedsiębiorstwach to tylko niewielka próbka coraz obszerniejszego zbioru możliwości.

Zacznij już dziś

Zobacz inteligentne technologie SAP w działaniu, w tym AI oraz uczenie maszynowe.

  • Mechanizmy rekomendacji: w latach 2009–2017 liczba gospodarstw domowych w Stanach Zjednoczonych, w których wykupiono subskrypcję w serwisach streamingowych, wzrosła o 450%. W artykule z 2020 roku magazyn Forbes donosi o dalszym wzroście zainteresowania takimi usługami — nawet o 70%. Mechanizmy rekomendacji są stosowane przez wiele platform zakupowych, ale w usługach strumieniowego przesyłania muzyki i filmów zdecydowanie grają pierwsze skrzypce. ­
  • Dynamiczny marketing: tworzenie i wykorzystywanie okazji do sprzedaży wymaga gromadzenia i analizowania jak największych ilości danych o klientach. Interakcje ze współczesnymi konsumentami generują ogromny wolumen zróżnicowanych i nieuporządkowanych informacji — od transkrypcji czatów po przesyłane obrazy. Zastosowanie mechanizmów opartych na uczeniu maszynowym pomaga specjalistom ds. marketingu zrozumieć te dane i wykorzystać je do personalizowania treści marketingowych oraz pozyskiwania klientów i okazji do sprzedaży w czasie rzeczywistym.
  • ERP i automatyzacja procesów: w bazach danych systemów ERP znajdują się rozległe, rozproszone zbiory danych, a wśród nich na przykład statystyki wydajności sprzedaży, opinie klientów, raporty o trendach rynkowych i rekordy dotyczące zarządzania łańcuchem dostaw. Algorytmy uczenia maszynowego mogą pomóc odnaleźć w tych danych korelacje i wzorce. Te z kolei można następnie wykorzystać w każdym obszarze działalności firmy, na przykład do optymalizacji procesów w urządzeniach w sieci w ramach Internetu rzeczy (IoT) lub automatyzacji zadań powtarzalnych bądź podatnych na błędy.
  • Przeglądy zapobiegawcze: nowoczesne łańcuchy dostaw i inteligentne fabryki coraz częściej sięgają po urządzenia i systemy IoT, a do komunikacji między flotą i procesami wykorzystują chmurę. Awarie i brak sprawności mogą skutkować ogromnymi kosztami oraz zakłóceniami. Gdy dane dotyczące konserwacji i napraw są gromadzone ręcznie, niemal niemożliwe jest przewidywanie potencjalnych problemów — nie mówiąc już o automatyzacji procesów w celu ich przewidywania i zapobiegania im. Tymczasem nawet wiekowe systemy analogowe można wyposażyć w czujniki bramy IoT, aby zapewnić widoczność i efektywność w całej firmie.

Wyzwania dotyczące uczenia maszynowego

W poświęconej fałszywym korelacjom książce Spurious Correlations Tyler Vigan, absolwent Uniwersytetu Harvarda i naukowiec zajmujący się analizą danych, zauważa, że nie wszystkie korelacje wskazują na faktyczny związek przyczynowo-skutkowy. W ramach przykładu prezentuje wykres pokazujący rzekomą silną korelację między konsumpcją margaryny a liczbą rozwodów w amerykańskim stanie Maine. Wykres ma oczywiście charakter humorystyczny, ale uczenie maszynowe rzeczywiście jest podatne na błędy i stronniczość zarówno ludzi, jak i algorytmów. A ze względu na skłonność takich systemów do uczenia się i adaptacji błędy oraz fałszywe korelacje mogą szybko się rozpowszechniać i zniekształcać wyniki w całej sieci neuronowej.

 

Dodatkowe wyzwanie stanowią modele uczenia maszynowego, w których algorytm i jego wyniki okazują się zbyt złożone, aby mogły zostać wyjaśnione oraz zrozumiane przez człowieka. Tak zwany model „czarnej skrzynki” może stanowić zagrożenie dla firmy, która nie będzie w stanie ustalić, w jaki sposób i dlaczego algorytm doszedł do konkretnego wniosku lub decyzji.

 

Na szczęście rośnie nie tylko złożoność zbiorów danych i algorytmów uczenia maszynowego, ale i dostępność narzędzi oraz zasobów do zarządzania ryzykiem. Najlepsze firmy starają się eliminować błędy i potencjalną stronniczość systemów, określając szczegółowe, stale aktualizowane wytyczne dotyczące nadzoru nad technologią AI oraz protokoły oparte na sprawdzonych metodach postępowania.

Wykorzystywanie potencjału uczenia maszynowego

Posłuchaj porad liderów — poznaj pięć przykładów firm, które osiągnęły sukces.

Często zadawane pytania na temat uczenia maszynowego

Uczenie maszynowe jest podzbiorem AI i nie może istnieć bez tej technologii. AI wykorzystuje i przetwarza dane w celu podejmowania decyzji i formułowania przewidywań — jest to mózg systemu komputerowego i jego „inteligencja”. Algorytmy uczenia maszynowego w ramach AI, jak również inne aplikacje oparte na sztucznej inteligencji, pozwalają systemowi nie tylko przetwarzać te dane, ale także wykorzystywać je do wykonywania zadań, tworzenia prognoz, uczenia się i rozwijania inteligencji, bez konieczności stosowania dodatkowego programowania. Dzięki nim AI może praktycznie wykorzystać swoją inteligencję oraz dane w konkretnym celu.

Tak, ale należy to potraktować jako przedsięwzięcie obejmujące całą firmę, a nie tylko jako modernizację infrastruktury informatycznej. Firmy, które osiągają najlepsze wyniki dzięki projektom transformacji cyfrowej, przeprowadzają rzetelną ocenę istniejących zasobów oraz zestawów umiejętności i upewniają się, że dysponują odpowiednimi systemami podstawowymi, zanim przejdą do działania.

W odniesieniu do uczenia maszynowego analiza danych stanowi podzbiór. Skupia się na statystykach i algorytmach, wykorzystuje regresję oraz techniki klasyfikacji, a następnie interpretuje i przekazuje wyniki.  Uczenie maszynowe koncentruje się na programowaniu, automatyzacji, skalowaniu oraz uwzględnianiu i magazynowaniu wyników.

Uczenie maszynowe analizuje wzorce i korelacje; uczy się na nich i podlega optymalizacji w miarę upływu czasu. Eksploracja danych jest wykorzystywana jako źródło informacji dla uczenia maszynowego. Techniki eksploracji danych wykorzystują złożone algorytmy i mogą pomóc dostarczać lepiej zorganizowane zbiory danych do wykorzystania przez system uczenia maszynowego.

Połączone neurony w sztucznej sieci neuronowej nazywane są węzłami i tworzą warstwy. Gdy węzeł otrzymuje sygnał numeryczny, przekazuje informację do innych odpowiednich neuronów, które działają równolegle. Uczenie głębokie wykorzystuje sieć neuronową, a określamy je jako „głębokie”, ponieważ angażuje bardzo duże ilości danych i wiele warstw sieci neuronowej jednocześnie. 

Uczenie maszynowe to pojęcie łączące różne modele, techniki i technologie uczenia się, które mogą obejmować statystykę. Sama statystyka koncentruje się na wykorzystaniu danych do formułowania prognoz i tworzenia modeli do analizy.

Biuletyn SAP Insights

Zasubskrybuj już dziś

Zasubskrybuj biuletyn i zyskaj dostęp do najważniejszych analiz.

Dowiedz się więcej

Powrót do góry