Co je to strojové učení?

Strojové učení je podmnožina umělé inteligence (AI), ve které se počítače učí z dat a zlepšují se se zkušenostmi, aniž by byly explicitně naprogramovány.

Detail definice strojového učení

Strojové učení je podmnožinou umělé inteligence (AI). Zaměřuje se na výuku počítačů, aby se učily z dat a zlepšovaly se se zkušenostmi – místo aby k tomu byly explicitně naprogramovány. Ve strojovém učení jsou algoritmy trénovány k nalezení vzorů a korelací ve velkých množinách dat a k provádění nejlepších rozhodnutí a předpovědí založených na této analýze. Aplikace strojového učení se zlepšují s použitím a stávají se přesnějšími, čím více dat mají přístup.

 

Aplikace strojového učení jsou všude kolem nás – v našich domovech, nákupních košících, zábavních médiích a zdravotní péči.

Jak strojové učení souvisí s umělou inteligencí?

Strojové učení – a jeho komponenty hlubokého učení a neuronových sítí – to vše se hodí jako soustředné podmnožiny umělé inteligence. Umělá inteligence zpracovává data, aby se mohla rozhodovat a předpovídat. Algoritmy strojového učení umožňují umělé inteligenci nejen zpracovávat tato data, ale používat je k učení a chytřejší práci, aniž by potřebovala další programování. Umělá inteligence je nadřazenou položkou všech podmnožin strojového učení, které jsou pod ní. V první podmnožině je strojové učení; v rámci toho je hluboké učení a pak neuronové sítě v rámci toho.

Co je to neuronová síť?

 

Umělá neuronová síť (ANN) je modelována na neuronech v biologickém mozku. Umělé neurony se nazývají uzly a jsou shlukovány do více vrstev, operujících paralelně. Když umělý neuron obdrží numerický signál, zpracuje ho a signalizuje ostatní neurony s ním spojené. Stejně jako v lidském mozku má posilování nervů za následek lepší rozpoznávání vzorů, odbornost a celkové učení.

 

Co je hluboké učení?

 

Tento druh strojového učení se nazývá „hluboký“, protože zahrnuje mnoho vrstev neuronové sítě a masivní objemy složitých a nesourodých dat. Pro dosažení hlubokého učení se systém zapojuje s více vrstvami v síti, přičemž extrahuje stále více výstupů vyšší úrovně. Například systém hlubokého učení, který zpracovává obrazy přírody a hledá sedmikrásky Gloriosa, rozpozná – v první vrstvě – rostlinu. Jak se pohybuje přes nervové vrstvy, pak identifikuje květinu, pak sedmikrásku a nakonec Gloriosa sedisy. Příklady aplikací hlubokého učení zahrnují rozpoznávání řeči, klasifikaci obrazu a farmaceutickou analýzu.

Jak funguje strojové učení?

Strojové učení se skládá z různých typů modelů strojového učení za použití různých algoritmických technik. V závislosti na povaze dat a požadovaném výsledku lze použít jeden ze čtyř učebních modelů: s dohledem, bez dohledu, polopod dohledem nebo posilování. V rámci každého z těchto modelů lze použít jednu nebo více algoritmických technik – ve vztahu k používaným datovým souborům a zamýšleným výsledkům. Algoritmy strojového učení jsou v podstatě navrženy tak, aby klasifikovaly věci, nacházely vzory, předpovídaly výsledky a činily informovaná rozhodnutí. Algoritmy mohou být použity jeden po druhém nebo kombinovány k dosažení co nejlepší přesnosti, když se jedná o složitější a nepředvídatelnější data.

Jak funguje proces strojového učení

Co je to učení pod dohledem?

 

Učení s dohledem je prvním ze čtyř modelů strojového učení. V algoritmech učení s dohledem je stroj vyučován příkladem. Modely učení s dohledem se skládají z dvojic vstupních a výstupních dat, kde je výstup označen požadovanou hodnotou. Řekněme například, že cílem stroje je zjistit rozdíl mezi sedmikráskami a pansiemi. Jedna dvojice binárních vstupních dat zahrnuje jak obrázek sedmikrásky, tak obraz pansy. Požadovaným výsledkem pro tento konkrétní pár je vybrat sedmikráska, takže bude předem identifikován jako správný výsledek.

 

Pomocí algoritmu systém kompiluje všechna tato tréninková data v čase a začíná určovat korelativní podobnosti, rozdíly a další body logiky – dokud sám nedokáže předpovědět odpovědi na složité otázky. Je to ekvivalent toho, že dítě dostane soubor problémů s klíčem odpovědi, pak je požádá, aby ukázaly svou práci a vysvětlily svou logiku. Učební modely s dohledem se používají v mnoha aplikacích, se kterými komunikujeme každý den, jako jsou doporučovací moduly pro produkty a aplikace pro analýzu provozu, jako je Waze, které předpovídají nejrychlejší trasu v různých denních časech.

 

Co je učení bez dohledu?

 

Učení bez dohledu je druhým ze čtyř modelů strojového učení. V modelech učení bez dohledu není klíč odpovědi. Stroj studuje vstupní data – z nichž velká část je neoznačená a nestrukturovaná – a začíná identifikovat vzory a korelace s využitím všech relevantních, přístupných dat. V mnoha ohledech je učení bez dohledu modelováno podle toho, jak lidé pozorují svět. Používáme intuici a zkušenosti k seskupování věcí. Jak zažíváme stále více příkladů něčeho, naše schopnost kategorizovat a identifikovat to se stává stále přesnější. U strojů je „zkušenost“ definována množstvím zadávaných a zpřístupněných dat. Mezi běžné příklady aplikací učení bez dohledu patří rozpoznávání obličeje, analýza genové sekvence, průzkum trhu a kybernetická bezpečnost.

 

Co je to učení s polodohledem?

 

Polořízené učení je třetí ze čtyř modelů strojového učení. V dokonalém světě by byla všechna data strukturována a označena před vstupem do systému. Ale vzhledem k tomu, že to samozřejmě není možné, učení s polodohledem se stává fungujícím řešením, když je k dispozici velké množství surových, nestrukturovaných dat. Tento model spočívá v zadání malého množství označených dat pro rozšíření neoznačených datových sad. Označená data v podstatě fungují tak, aby umožnila spuštění systému a mohla výrazně zlepšit rychlost a přesnost učení. Algoritmus učení s polodohledem instruuje stroj, aby analyzoval označená data pro korelativní vlastnosti, které by bylo možné použít pro neoznačená data.

 

Jak bylo podrobně zkoumáno v tomto výzkumném dokumentu MIT Press, existují však rizika spojená s tímto modelem, kde se systém dozví a replikuje nedostatky v označených datech. Společnosti, které nejúspěšněji využívají učení pod polovičním dohledem, zajišťují zavedení protokolů osvědčených postupů. Polořízené učení se používá v řečové a jazykové analýze, komplexním lékařském výzkumu, jako je kategorizace proteinů a detekce podvodů na vysoké úrovni.

 

Co je to učení se posilování?

 

Posilovací učení je čtvrtým modelem strojového učení. V učení s dohledem je stroj dán klíč odpovědi a učí se nalezením korelací mezi všemi správnými výsledky. Posílený model učení nezahrnuje klíč k odpovědi, ale spíše zadává soubor přípustných akcí, pravidel a potenciálních koncových stavů. Když je požadovaný cíl algoritmu fixní nebo binární, stroje se mohou učit příkladem. Ale v případech, kdy je požadovaný výsledek proměnlivý, systém se musí učit zkušenostmi a odměnou. V posilovacích učebních modelech je „odměna“ numerická a je naprogramována do algoritmu jako něco, co se systém snaží shromáždit.

 

V mnoha ohledech je tento model analogický k tomu, aby někoho naučil hrát šachy. Jistě, nebylo by možné pokusit se jim ukázat každý potenciální tah. Místo toho vysvětlujete pravidla a oni si svou dovednost vybudují prostřednictvím praxe. Odměny přicházejí v podobě nejen vítězství ve hře, ale také získání soupeřových kousků. Aplikace posilovacího učení zahrnují automatizované nabízení cen pro kupující online reklamy, vývoj počítačových her a obchodování na burze s vysokými sázkami.

Podnikové strojové učení v akci

Algoritmy strojového učení rozpoznávají vzory a korelace, což znamená, že jsou velmi dobré při analýze jejich vlastní návratnosti investic. Pro společnosti, které investují do technologií strojového učení, tato funkce umožňuje téměř okamžité posouzení provozního dopadu. Níže je jen malý vzorek některých rostoucích oblastí podnikových aplikací strojového učení.

  • Motory doporučení: Od roku 2009 do roku 2017 vzrostl počet domácností v USA, které si předplatily služby streamování videa, o 450 %. A článek z roku 2020 v časopise Forbes hlásí další nárůst počtu využití streamování videa až o 70 %. Motory doporučení mají aplikace napříč mnoha maloobchodními a nákupními platformami, ale rozhodně se dostávají do svých vlastních se streamováním hudby a video­ služeb.

  • Dynamický marketing: Generování tipů a jejich použití prostřednictvím prodejního trychtýře vyžaduje schopnost shromažďovat a analyzovat co nejvíce dat zákazníků. Moderní spotřebitelé generují obrovské množství různorodých a nestrukturovaných dat – od chatových přepisů až po nahrávání obrázků. Používání aplikací strojového učení pomáhá marketérům porozumět těmto datům – a používat je k poskytování personalizovaného marketingového obsahu a zapojení zákazníků a zájemců v reálném čase.

  • ERP a automatizace procesů: Databáze ERP obsahují široké a nesourodé datové sady, které mohou zahrnovat statistiky výkonnosti prodeje, recenze spotřebitelů, zprávy o trendech trhu a záznamy o řízení dodavatelského řetězce. Algoritmy strojového učení lze použít k nalezení korelací a vzorů v takových datech. Tyto přehledy pak mohou být použity k informování prakticky všech oblastí podniku, včetně optimalizace pracovních postupů zařízení Internet of Things (IoT) v rámci sítě nebo nejlepších způsobů automatizace opakujících se úloh nebo úloh náchylných k chybám.

  • Prediktivní údržba: Moderní dodavatelské řetězce a chytré továrny stále více využívají zařízení a stroje IoT, stejně jako cloudové připojení ve všech svých vozových parcích a provozech. Poruchy a neefektivnost mohou vést k obrovským nákladům a poruchám. Při manuálním sběru dat údržby a oprav je téměř nemožné předvídat potenciální problémy – natož automatizovat procesy pro jejich předvídání a prevenci. Snímače bran IoT lze osadit i na dekádách starých analogových strojů, které poskytují viditelnost a efektivitu v celém podniku.

Výzvy strojového učení

Datový vědec a absolvent Harvardu Tyler Vigan ve své knize Spurious Correlations poukazuje na to, že „ne všechny korelace svědčí o příčinné souvislosti“. Pro ilustraci obsahuje graf ukazující zřejmě silnou korelaci mezi konzumací margarínu a rozvodovostí ve státě Maine. Samozřejmě, že tato hitparáda má udělat humorný bod. Nicméně, na vážnější poznámku, jsou aplikace strojového učení zranitelné jak lidskou, tak algoritmickou předpojatostí a chybou. A vzhledem k jejich tendenci se učit a přizpůsobovat, chyby a falešné korelace mohou rychle šířit a znečišťovat výsledky v rámci neuronové sítě.

 

Další výzva pochází z modelů strojového učení, kde je algoritmus a jeho výstup natolik složitý, že je člověk nemůže vysvětlit ani pochopit. Tento model se nazývá „černá skříňka“ a ohrožuje společnosti, když zjistí, že nejsou schopny určit, jak a proč algoritmus dospěl k určitému závěru nebo rozhodnutí.

 

Naštěstí se zvyšuje složitost datových sad a algoritmů strojového učení, stejně jako nástroje a zdroje dostupné pro řízení rizik. Nejlepší společnosti pracují na odstranění chyb a předsudků zavedením spolehlivých a aktuálních pokynů pro řízení umělé inteligence a protokolů osvědčených postupů.

Časté dotazy ke strojovému učení

Strojové učení je podmnožinou umělé inteligence a bez ní nemůže existovat. AI využívá a zpracovává data k rozhodování a předpovědím – je to mozek počítačového systému a je to „inteligence“, kterou ukazují stroje. Algoritmy strojového učení v rámci umělé inteligence a dalších aplikací využívajících umělou inteligenci umožňují systému nejen zpracovávat tato data, ale také je používat k provádění úloh, vytváření prognóz, učení se a být chytřejší, aniž by bylo nutné další programování. Dávají umělé inteligenci něco, co je zaměřeno na cíl, co souvisí se všemi těmito inteligencemi a daty.

Ano, ale mělo by se k němu přistupovat jako k celovečernímu úsilí, nikoli pouze k upgradu IT. Společnosti, které mají nejlepší výsledky díky projektům digitální transformace, posoudí své stávající zdroje a soubory dovedností a ujistí se, že mají zavedeny správné základní systémy, než začnou.

Ve vztahu ke strojovému učení je datová věda podmnožinou; zaměřuje se na statistiky a algoritmy, používá regresní a klasifikační techniky a interpretuje a sděluje výsledky. Strojové učení se zaměřuje na programování, automatizaci, škálování a začleňování a skladování výsledků.

Strojové učení se dívá na vzory a korelace; učí se od nich a optimalizuje se tak, jak to jde. Dolování dat se používá jako zdroj informací pro strojové učení. Techniky dolování dat samy používají složité algoritmy a mohou pomoci poskytnout lépe organizované datové sady pro použití aplikace strojového učení.

Připojené neurony s umělou neuronovou sítí se nazývají uzly, které jsou spojeny a shlukovány ve vrstvách. Když uzel obdrží numerický signál, signalizuje pak další relevantní neurony, které fungují paralelně. Hluboké učení využívá neuronovou síť a je „hluboké“, protože využívá velmi velké objemy dat a současně zapojuje více vrstev v neuronové síti.

Strojové učení je amalgam několika modelů, technik a technologií učení, které mohou zahrnovat statistiky. Samotná statistika se zaměřuje na využití dat k vytváření předpovědí a vytváření modelů pro analýzu.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel