Čo je strojové učenie?
Strojové učenie je podmnožina umelej inteligencie (AI), v ktorej sa počítače učia z dát a zlepšujú sa so skúsenosťami bez toho, aby boli vyslovene naprogramované.
Detailná definícia strojového učenia
Strojové učenie je podmnožinou umelej inteligencie (AI). Zameriava sa na to, aby sa počítače učili z dát a zlepšovali sa so skúsenosťami – namiesto toho, aby boli na to vyslovene naprogramované. V strojovom učení sú algoritmy trénované na vyhľadávanie vzorov a korelácií vo veľkých množinách údajov a na prijímanie najlepších rozhodnutí a prognóz založených na tejto analýze. Aplikácie strojového učenia sa s použitím zlepšujú a stávajú sa presnejšími, čím viac údajov majú prístup k.
Aplikácie strojového učenia sú všade okolo nás – v našich domovoch, nákupných košíkoch, našich zábavných médiách a zdravotnej starostlivosti.
Ako súvisí strojové učenie s AI?
Strojové učenie – a jeho súčasti hlbokého učenia a neurónových sietí – sa hodia ako koncentrické podskupiny AI. Umelá inteligencia spracováva údaje na prijímanie rozhodnutí a predpovedí. Algoritmy strojového učenia umožňujú umelej inteligencii nielen spracovať tieto údaje, ale ich použiť na učenie sa a získanie inteligentnejšieho, bez toho, aby bolo potrebné akékoľvek ďalšie programovanie. Umelá inteligencia je nadradeným prvkom všetkých podmnožín strojového učenia pod ňou. V rámci prvej podmnožiny je strojové učenie; v rámci neho je hlboké učenie a potom v rámci nej neurónové siete.
Čo je neurónová sieť?
Umelá neurálna sieť (ANN) je modelovaná na neurónoch v biologickom mozgu. Umelé neuróny sa nazývajú uzly a zoskupujú sa vo viacerých vrstvách, fungujú paralelne. Keď umelý neurón prijme numerický signál, spracuje ho a signalizuje ostatné neuróny, ktoré sú s ním spojené. Rovnako ako v ľudskom mozgu, nervové posilnenie vedie k lepšiemu rozpoznávaniu vzorov, odbornosti a celkovému vzdelávaniu.
Čo je hlboké učenie?
Tento druh strojového učenia sa nazýva "hlboké", pretože zahŕňa mnoho vrstiev neurónovej siete a obrovské objemy komplexných a nesúrodých dát. Aby sa dosiahlo hlboké učenie, systém spolupracuje s viacerými vrstvami v sieti a extrahuje čoraz vyššie výstupy. Napríklad systém hlbokého učenia, ktorý spracováva obrazy prírody a hľadá Gloriosa daisies, v prvej vrstve rozpozná rastlinu. Ako sa pohybuje cez neurónové vrstvy, potom identifikuje kvet, potom daisy a nakoniec Gloriosa daisy. Medzi príklady aplikácií hlbokého učenia patrí rozpoznávanie reči, klasifikácia obrazu a farmaceutická analýza.
Ako funguje strojové učenie?
Strojové učenie sa skladá z rôznych typov modelov strojového učenia pomocou rôznych algoritmických techník. V závislosti od povahy údajov a požadovaného výsledku možno použiť jeden zo štyroch vzdelávacích modelov: dohliadaný, nekontrolovaný, polokontrolovaný alebo posilnený. V rámci každého z týchto modelov sa môže použiť jedna alebo viac algoritmických techník – vo vzťahu k používaným súborom údajov a k zamýšľaným výsledkom. Algoritmy strojového učenia sú v podstate navrhnuté na klasifikáciu vecí, vyhľadávanie vzorov, predpovedanie výsledkov a prijímanie informovaných rozhodnutí. Algoritmy sa môžu používať po jednom alebo kombinovať, aby sa dosiahla čo najlepšia presnosť, keď ide o zložité a nepredvídateľné údaje.
Ako funguje proces strojového učenia
Čo je dohliadané učenie?
Dozorované učenie je prvým zo štyroch modelov strojového učenia. V riadených učebných algoritmoch sa stroj učí príkladom. Modely výučby pod dohľadom pozostávajú z párov vstupných a výstupných údajov, kde je výstup označený požadovanou hodnotou. Povedzme napríklad, že cieľom je, aby stroj povedal rozdiel medzi sedmokráskami a pansies. Jedna dvojica binárnych vstupných údajov zahŕňa obraz sedmokrásky a obrázok pansy. Požadovaným výsledkom pre tento konkrétny pár je vybrať sedmokrásku, takže bude vopred identifikovaný ako správny výsledok.
Prostredníctvom algoritmu systém kompiluje všetky tieto dáta tréningu v priebehu času a začína určovať korelačnú podobnosť, rozdiely a ďalšie body logiky – až kým nedokáže sám predvídať odpovede na otázky daisy-or pansy. Je to ekvivalent toho, že dieťaťu dá súbor problémov s kľúčom odpovede, potom ho požiada, aby ukázal svoju prácu a vysvetlil svoju logiku. Dozorované vzdelávacie modely sa používajú v mnohých aplikáciách, s ktorými pracujeme každý deň, ako sú odporúčacie nástroje pre produkty a aplikácie na analýzu dopravy, ako je Waze, ktoré predpovedajú najrýchlejšiu trasu v rôznych denných časoch.
Čo je to výučba bez dozoru?
Neriadené učenie je druhým zo štyroch modelov strojového učenia. V modeloch výučby bez dozoru neexistuje kľúč odpovede. Stroj študuje vstupné údaje – z ktorých väčšina je neoznačená a neštruktúrovaná – a začína identifikovať vzory a korelácie, pričom využíva všetky relevantné, prístupné údaje. V mnohých ohľadoch je nekontrolované učenie modelované o tom, ako ľudia pozorujú svet. Využívame intuíciu a skúsenosti na zoskupenie vecí. Keďže máme stále viac príkladov niečoho, naša schopnosť kategorizovať a identifikovať ju sa stáva čoraz presnejšou. V prípade strojov je „skúsenosť“ definovaná množstvom údajov, ktoré sa vkladajú a sprístupňujú. Medzi bežné príklady aplikácií učenia bez dohľadu patrí rozpoznávanie tváre, analýza sekvencie génov, prieskum trhu a kybernetická bezpečnosť.
Čo je to sem-dozorované učenie?
Polokontrolované učenie je tretím zo štyroch modelov strojového učenia. V dokonalom svete by všetky údaje boli štruktúrované a označené pred vstupom do systému. Keďže to však zjavne nie je uskutočniteľné, sem-tam kontrolované učenie sa stáva realizovateľným riešením, keď je prítomné obrovské množstvo nespracovaných, neštruktúrovaných údajov. Tento model pozostáva zo zadania malého množstva označených údajov na rozšírenie neoznačených množín údajov. Označené dátové akty v podstate umožňujú spustenie systému a môžu výrazne zlepšiť rýchlosť a presnosť učenia. Polokontrolovaný algoritmus učenia dáva stroju pokyn, aby analyzoval označené údaje pre korelačné vlastnosti, ktoré by sa mohli použiť na neoznačené údaje.
Ako sa však podrobne skúma v tomto výskumnom dokumente MIT Press, existujú riziká spojené s týmto modelom, kde sa nedostatky v označených údajoch dozvedia a replikujú systémom. Spoločnosti, ktoré najviac úspešne využívajú sem-dohliadané učenie, zabezpečujú zavedenie protokolov osvedčených postupov. Polokontrolované učenie sa používa v reči a jazykovej analýze, komplexnom medicínskom výskume, ako je kategorizácia proteínov a detekcia podvodov na vysokej úrovni.
Čo je posilňovanie učenia?
Posilňovacie učenie je štvrtým modelom strojového učenia. V dozorovanom učení sa stroj dostane kľúč odpovede a učí sa tým, že nájde korelácie medzi všetkými správnymi výsledkami. Model učenia sa posilnenia neobsahuje kľúč odpovede, ale skôr zadáva súbor povolených akcií, pravidiel a potenciálnych koncových stavov. Keď je požadovaný cieľ algoritmu pevný alebo binárny, stroje sa môžu naučiť príkladom. Ale v prípadoch, keď je požadovaný výsledok meniteľný, sa systém musí učiť skúsenosťami a odmenou. V modeloch učenia sa posilnenia je „odmena“ numerická a je naprogramovaná do algoritmu ako niečo, čo sa systém snaží zbierať.
V mnohých ohľadoch je tento model analogický k tomu, aby niekoho naučil, ako hrať šach. Určite by nebolo možné pokúsiť sa im ukázať každý potenciálny ťah. Namiesto toho vysvetľujete pravidlá a oni si budujú svoje schopnosti prostredníctvom praxe. Odmeny prichádzajú v podobe nielen víťazstva v hre, ale aj získania súperových kúskov. Aplikácie posilňovacieho učenia zahŕňajú automatizované cenové ponuky pre kupujúcich online reklamy, vývoj počítačových hier a obchodovanie na burze s vysokými vkladmi.
Podnikové strojové učenie v akcii
Algoritmy strojového učenia rozpoznávajú vzory a korelácie, čo znamená, že sú veľmi dobré pri analýze svojej vlastnej návratnosti investícií. Pre spoločnosti, ktoré investujú do technológií strojového učenia, táto funkcia umožňuje takmer okamžité posúdenie prevádzkového vplyvu. Nižšie je len malá vzorka niektorých z rastúcich oblastí aplikácií podnikového strojového učenia.
Motory odporúčaní: Od roku 2009 do roku 2017 vzrástol počet domácností v USA, ktoré si predplatili služby streamovania videa, o 450 %. A článok z roku 2020 v časopise Forbes hlási ďalší nárast používania streamovania videa až o 70 %. Motory odporúčaní majú aplikácie naprieč mnohými maloobchodnými a nákupnými platformami, ale určite prichádzajú na svoje so službami streamovania hudby a video videa.
Dynamický marketing: Generovanie potenciálnych zákazníkov a ich odovzdanie prostredníctvom predajného lievika vyžaduje schopnosť zhromažďovať a analyzovať čo najviac údajov o zákazníkoch. Moderní spotrebitelia generujú obrovské množstvo rôznorodých a neštruktúrovaných údajov – od chatových prepisov až po nahrávanie obrázkov. Použitie aplikácií strojového učenia pomáha marketingovým pracovníkom pochopiť tieto údaje a použiť ich na poskytovanie personalizovaného marketingového obsahu a interakcie so zákazníkmi a potenciálnymi zákazníkmi v reálnom čase.
ERP a automatizácia procesov: Databázy ERP obsahujú rozsiahle a nesúrodé množiny údajov, ktoré môžu zahŕňať štatistiky výkonnosti predaja, kontroly spotrebiteľov, správy o trendoch trhu a záznamy riadenia dodávateľského reťazca. Algoritmy strojového učenia sa môžu použiť na nájdenie korelácií a vzorov v takýchto údajoch. Tieto prehľady potom môžu byť použité na informovanie prakticky každej oblasti podnikania, vrátane optimalizácie pracovných postupov zariadení internetu vecí (IoT) v rámci siete alebo najlepších spôsobov, ako automatizovať opakujúce sa alebo náchylné na chyby.
Prediktívna údržba: Moderné dodávateľské reťazce a inteligentné továrne čoraz viac využívajú zariadenia a stroje IoT, ako aj cloudové pripojenie vo všetkých svojich flotilách a prevádzkach. Výpadky a neefektívnosť môžu viesť k obrovským nákladom a narušeniam. Pri manuálnom zbere údajov o údržbe a oprave je takmer nemožné predpovedať potenciálne problémy – už vôbec nie automatizovať procesy na ich predpovedanie a prevenciu. Senzory brány IoT môžu byť namontované aj na desaťročia staré analógové stroje, ktoré poskytujú viditeľnosť a efektivitu v celom podniku.
Výzvy strojového učenia
Vo svojej knihe Šikovné korelácie, dátový vedec a Harvardov absolvent Tyler Vigan poukazuje na to, že „Nie všetky korelácie svedčia o základnej príčinnej súvislosti.“ Aby to ilustroval, obsahuje graf, ktorý ukazuje zjavne silnú koreláciu medzi konzumáciou margarínu a mierou rozvodov v štáte Maine. Samozrejme, tento graf má za cieľ urobiť humorný bod. Pri vážnejšej poznámke sú však aplikácie strojového učenia náchylné na ľudské aj algoritmické skreslenie a chybu. A vďaka ich sklonu učiť sa a prispôsobovať sa môžu chyby a falošné korelácie rýchlo šíriť a znečisťovať výsledky naprieč neurónovou sieťou.
Ďalšia výzva pochádza z modelov strojového učenia, kde je algoritmus a jeho výstup taký zložitý, že ich ľudia nedokážu vysvetliť ani pochopiť. Tento model sa nazýva „čierna skrinka“ a ohrozuje spoločnosti, keď sa ocitnú neschopné určiť, ako a prečo algoritmus dospel k určitému záveru alebo rozhodnutiu.
Našťastie, s rastúcou komplexnosťou dátových súborov a algoritmov strojového učenia, tak aj nástroje a zdroje, ktoré sú k dispozícii na riadenie rizika. Najlepšie spoločnosti pracujú na odstránení chýb a zaujatosti zavedením spoľahlivých a aktuálnych usmernení o riadení umelej inteligencie a protokolov osvedčených postupov.