Mi a gépi tanulás?

A gépi tanulás a mesterséges intelligencia (AI) egy részhalmaza, amelyben a számítógépek tanulnak az adatokból, és anélkül javulnak a tapasztalatokkal, hogy kifejezetten programoznák őket.

Gépi tanulás definíciója részletesen

A gépi tanulás a mesterséges intelligencia (AI) egy részhalmaza. Arra összpontosít, hogy számítógépeket tanítson az adatokból való tanulásra és a tapasztalatokkal való javulásra – ahelyett, hogy kifejezetten erre programoznák. A gépi tanulásban algoritmusokat tanítanak arra, hogy nagy adathalmazokban megtalálják a mintákat és korrelációkat, és az elemzés alapján meghozzák a legjobb döntéseket és előrejelzéseket. A gépi tanulási alkalmazások a használattal javulnak, és pontosabbá válnak, minél több adathoz férnek hozzá.

 

A gépi tanulás alkalmazásai körülöttünk vannak – otthonainkban, bevásárlókosarainkban, szórakoztató médiánkban és egészségügyi ellátásunkban.

Hogyan kapcsolódik a gépi tanulás a mesterséges intelligenciához?

A gépi tanulás – és annak összetevői a mélytanulási és neurális hálózatokban – mind illeszkednek a mesterséges intelligencia koncentrikus részhalmazaihoz. A mesterséges intelligencia az adatokat döntések és előrejelzések meghozatalához dolgozza fel. A gépi tanulási algoritmusok lehetővé teszik az AI számára, hogy ne csak feldolgozza az adatokat, hanem további programozás nélkül használja őket a tanulásra és az intelligensebb működésre. A mesterséges intelligencia az alatta lévő összes gépi tanulási részhalmaz szülője. Az első részhalmazon belül a gépi tanulás; ezen belül a mély tanulás, majd a benne lévő neurális hálózatok.

Mi az a neurális hálózat?

 

A biológiai agy neuronjain mesterséges neurális hálózatot (ANN) modelleznek. A mesterséges neuronokat csomópontoknak nevezik, és több rétegben csoportosulnak, párhuzamosan működnek. Amikor egy mesterséges neuron numerikus jelet kap, feldolgozza és jelzi a hozzá kapcsolódó többi neuront. Az emberi agyhoz hasonlóan a neurális erősítés jobb mintafelismerést, szakértelmet és általános tanulást eredményez.

 

Mi a mélytanulás?

 

Ezt a fajta gépi tanulást „mélynek” hívják, mert az ideghálózat számos rétegét és nagy mennyiségű összetett és eltérő adatot tartalmaz. A mély tanulás elérése érdekében a rendszer több réteggel működik együtt a hálózatban, egyre magasabb szintű kimeneteket nyerve ki. Például egy mély tanulási rendszer, amely természetképeket dolgoz fel és Gloriosa daisies-t keres, az első rétegben felismeri a növényt. Ahogy mozog az idegi rétegeken, akkor azonosít egy virágot, majd egy daisyt, végül egy Gloriosa daisyt. A mélytanulási alkalmazások közé tartozik a beszédfelismerés, a képosztályozás és a gyógyszeranalízis.

Hogyan működik a gépi tanulás?

A gépi tanulás különböző típusú gépi tanulási modellekből áll, különböző algoritmikus technikákkal. Az adatok jellegétől és a kívánt eredménytől függően négy tanulási modell egyike használható: felügyelt, felügyelet nélküli, félig felügyelt vagy megerősítő. Az egyes modelleken belül egy vagy több algoritmikus technika alkalmazható – a használt adathalmazokhoz és a kívánt eredményekhez viszonyítva. A gépi tanulási algoritmusok alapvetően a dolgok osztályozására, a minták megtalálására, az eredmények előrejelzésére és a megalapozott döntések meghozatalára szolgálnak. Az algoritmusok használhatók egyesével, vagy kombinálhatók a lehető legjobb pontosság elérése érdekében összetett és kiszámíthatatlan adatok esetén.

A gépi tanulási folyamat működése

Mi az a felügyelt tanulás?

 

A felügyelt tanulás az első a négy gépi tanulási modell közül. A felügyelt tanulási algoritmusokban a gépet példával tanítják. A felügyelt tanulási modellek „bemeneti” és „kimeneti” adatpárokból állnak, ahol a kimenet a kívánt értékkel van megjelölve. Tegyük fel például, hogy a cél az, hogy a gép megmondja a különbséget a daisies és a pansies között. Egy bináris bemeneti adatpár egy daisy és egy pansy képét is tartalmazza. Az adott pár számára a kívánt eredmény az, hogy kiválasztja a daisy-t, így előre meg lesz határozva, mint a helyes eredmény.

 

Egy algoritmus segítségével a rendszer összeállítja ezeket a tanítási adatokat az idő múlásával, és elkezdi meghatározni a korrelációs hasonlóságokat, különbségeket és a logika más pontjait – amíg meg nem tudja jósolni a válaszokat a daisy-or-pansy kérdésekre. Ez egyenértékű azzal, hogy egy gyermeknek problémacsoportot ad egy válaszkulccsal, majd megkéri őket, hogy mutassák meg munkájukat, és magyarázzák el logikájukat. A felügyelt tanulási modelleket számos olyan alkalmazásban használják, amelyekkel nap mint nap kommunikálunk, mint például a termékek ajánlómotorjai és az olyan forgalomelemző alkalmazások, mint a Waze, amelyek megjósolják a leggyorsabb útvonalat a különböző napszakokban.

 

Mi az a felügyelet nélküli tanulás?

 

A felügyelet nélküli tanulás a négy gépi tanulási modell közül a második. Felügyelet nélküli tanulási modellekben nincs válaszkulcs. A gép tanulmányozza a bemeneti adatokat – amelyek nagy része címkézés nélküli és strukturálatlan –, és elkezdi azonosítani a mintákat és korrelációkat, felhasználva az összes releváns, hozzáférhető adatot. Sokféleképpen modellezik a felügyelet nélküli tanulást arról, hogy az emberek hogyan figyelik a világot. Intuíciót és tapasztalatot használunk a dolgok összefogására. Ahogy egyre több példát tapasztalunk valamire, egyre pontosabbá válik az a képességünk, hogy kategorizáljuk és azonosítsuk. A gépek esetében a „tapasztalatot” a bevitt és rendelkezésre bocsátott adatok mennyisége határozza meg. A felügyelet nélküli tanulási alkalmazások közös példái az arcfelismerés, a génszekvencia elemzés, a piackutatás és a kiberbiztonság.

 

Mi az a félig felügyelt tanulás?

 

A félig felügyelt tanulás négy gépi tanulási modell közül a harmadik. Egy tökéletes világban minden adatot strukturálnak és címkéznek, mielőtt beviszik egy rendszerbe. De mivel ez nyilvánvalóan nem megvalósítható, a félig felügyelt tanulás működőképes megoldássá válik, amikor hatalmas mennyiségű nyers, strukturálatlan adat van jelen. Ez a modell kis mennyiségű címkézett adat beviteléből áll, hogy kiegészítse a címkézetlen adathalmazokat. Lényegében a címkézett adatok arra szolgálnak, hogy elindítsák a rendszert, és jelentősen javíthatják a tanulási sebességet és a pontosságot. A félig felügyelt tanulási algoritmus arra utasítja a gépet, hogy elemezze a címkézett adatokat a címkézetlen adatokra alkalmazható korrelációs tulajdonságok tekintetében.

 

Ahogyan azt a MIT Press kutatási tanulmánya részletesen feltárta, vannak azonban kockázatok ezzel a modellel kapcsolatban, ahol a címkézett adatok hibáit a rendszer megtanulja és replikálja. Azok a vállalatok, amelyek a legsikeresebben használják a félig felügyelt tanulást, biztosítják a legjobb gyakorlat protokollok meglétét. A félig felügyelt tanulást beszéd- és nyelvanalízisben, komplex orvosi kutatásokban, mint például a fehérje kategorizálásban és a magas szintű csalásfelderítésben használják.

 

Mi az erősítő tanulás?

 

A megerősített tanulás a negyedik gépi tanulási modell. A felügyelt tanulásban a gép megkapja a válaszkulcsot, és megtanulja az összefüggéseket az összes helyes eredmény között. A megerősítő tanulási modell nem tartalmaz válaszkulcsot, hanem egy sor megengedett intézkedést, szabályt és potenciális végállapotot ad meg. Amikor az algoritmus kívánt célja rögzített vagy bináris, a gépek példával tanulhatnak. De azokban az esetekben, amikor a kívánt eredmény változtatható, a rendszernek tapasztalatból és jutalomból kell tanulnia. A megerősítő tanulási modellekben a „jutalom” numerikus, és az algoritmusba úgy van programozva, mint amit a rendszer igyekszik összegyűjteni.

 

Sok szempontból ez a modell hasonló ahhoz, hogy valaki megtanítsa, hogyan kell sakkozni. Természetesen lehetetlen lenne megmutatni nekik minden lehetséges lépést. Ehelyett elmagyarázod a szabályokat, és a gyakorlaton keresztül fejlesztik a képességeiket. A jutalmak nemcsak a játék megnyerése, hanem az ellenfél darabjainak megszerzése formájában jönnek létre. A megerősítő tanulás alkalmazásai közé tartozik az automatikus árajánlattétel az online reklám, a számítógépes játékfejlesztés és a nagy tétes tőzsdei kereskedés vásárlói számára.

Vállalati gépi tanulás működés közben

A gépi tanulási algoritmusok felismerik a mintákat és korrelációkat, ami azt jelenti, hogy nagyon jól elemzik saját megtérülésüket. A gépi tanulási technológiákba befektető vállalatok számára ez a funkció lehetővé teszi a működési hatás szinte azonnali értékelését. Az alábbiakban csak egy kis minta található a vállalati gépi tanulási alkalmazások növekvő területeiről.

  • Javasolt motorok: 2009-től 2017-ig 450 %-kal nőtt a videoközvetítésre előfizető amerikai háztartások száma. És a Forbes magazin egy 2020-as cikke szerint a videostreamelés felhasználási adatai 70%-ig terjednek. Az ajánlómotoroknak számos kiskereskedelmi és vásárlási platformon vannak alkalmazásaik, de a zenék és videók streamelésével egyértelműen magukévá válnak­.

  • Dinamikus marketing: A leadek létrehozása és használata az értékesítési csatornán keresztül megköveteli a lehető legtöbb ügyféladat összegyűjtését és elemzését. A modern fogyasztók hatalmas mennyiségű változatos és strukturálatlan adatot generálnak – a chat-átiratoktól a képfeltöltésekig. A gépi tanulási alkalmazások használata segít a marketingfelelősöknek megérteni ezeket az adatokat – és felhasználva személyre szabott marketingtartalmat és valós idejű interakciót biztosít az ügyfelekkel és leadekkel.

  • ERP és folyamatautomatizálás: Az ERP adatbázisok széles körű és eltérő adathalmazokat tartalmaznak, amelyek magukban foglalhatják az értékesítési teljesítmény statisztikáit, a fogyasztói értékeléseket, a piaci trendekről szóló jelentéseket és a logisztikailánc-kezelési rekordokat. A gépi tanulási algoritmusok korrelációk és minták keresésére használhatók az ilyen adatokban. Ezek az elemzések aztán felhasználhatók az üzlet szinte minden területének tájékoztatására, beleértve a dolgok internete (IoT) eszközök munkafolyamatainak optimalizálását a hálózaton belül, vagy az ismétlődő vagy hibákra hajlamos feladatok automatizálásának legjobb módjait.

  • Prediktív karbantartás: A modern ellátási láncok és intelligens gyárak egyre inkább használják az IoT-eszközöket és -gépeket, valamint a felhőalapú kapcsolódást minden flottájukon és műveletükön belül. A meghibásodások és a hatékonyság hiánya hatalmas költségeket és zavarokat eredményezhet. A karbantartási és javítási adatok manuális gyűjtésekor szinte lehetetlen megjósolni a potenciális problémákat – nem is beszélve a folyamatok automatizálásáról azok előrejelzésére és megelőzésére. Az IoT gateway érzékelők akár több évtizedes analóg gépekre is felszerelhetők, így átláthatóságot és hatékonyságot biztosítanak az egész vállalaton belül.

Gépi tanulás kihívásai

Az adattudós és a Harvard végzős Tyler Vigan könyvében rámutat, hogy „nem minden korreláció jelzi a mögöttes ok-okozati kapcsolatot.” Ennek illusztrálására egy táblázatot is tartalmaz, amely a margarinfogyasztás és Maine állam válási aránya között látszólag erős korrelációt mutat. Természetesen ennek a diagramnak a célja, hogy humoros pontot hozzon létre. Komolyabb megjegyzés azonban, hogy a gépi tanulási alkalmazások sebezhetőek mind az emberi, mind az algoritmikus torzításokkal és hibákkal szemben. És a tanulási és alkalmazkodási hajlandóságuk miatt a hibák és a hamis korrelációk gyorsan terjeszthetik és szennyezhetik az eredményeket az idegi hálózaton.

 

További kihívást jelentenek a gépi tanulási modellek, ahol az algoritmus és kimenete annyira összetett, hogy az ember nem tudja megmagyarázni vagy megérteni őket. Ezt nevezik „black box” modellnek, és veszélybe sodorja a vállalatokat, amikor nem tudják meghatározni, hogy egy algoritmus hogyan és miért jutott el egy adott következtetésre vagy döntésre.

 

Szerencsére az adathalmazok és a gépi tanulási algoritmusok összetettsége nő, így a kockázatok kezelésére rendelkezésre álló eszközök és erőforrások is. A legjobb vállalatok azon dolgoznak, hogy megszüntessék a hibákat és az elfogultságot azáltal, hogy megalapozott és naprakész MI-irányítási irányelveket és bevált gyakorlati protokollokat hoznak létre.

Gépi tanulás GYIK

A gépi tanulás az AI részhalmaza, és nélküle nem létezhet. Az AI az adatokat a döntések és előrejelzések meghozatalához használja és dolgozza fel – ez egy számítógépes rendszer agya, és a gépek által kiállított „intelligencia”. A mesterséges intelligencián belüli gépi tanulási algoritmusok, valamint más AI-alapú alkalmazások lehetővé teszik a rendszer számára, hogy ne csak feldolgozza ezeket az adatokat, hanem feladatok végrehajtására, előrejelzések készítésére, tanulásra és intelligensebbé válásra használja őket anélkül, hogy további programozásra lenne szükség. A mesterséges intelligenciának valami célorientált dolgot adnak, ami minden intelligenciához és adathoz kapcsolódik.

Igen, de üzleti szintű törekvésként kell megközelíteni, nem csak informatikai fejlesztésként. Azok a vállalatok, amelyek a legjobb eredményeket érik el a digitális átalakítási projektekkel, lebilincselő módon értékelik meglévő erőforrásaikat és készségeiket, és az indulás előtt gondoskodnak arról, hogy a megfelelő alaprendszerekkel rendelkezzenek.

A gépi tanuláshoz viszonyítva az adattudomány egy részhalmaz; a statisztikákra és algoritmusokra összpontosít, regressziós és osztályozási technikákat alkalmaz, valamint értelmezi és kommunikálja az eredményeket. A gépi tanulás a programozásra, az automatizálásra, a méretezésre, valamint az eredmények beépítésére és a raktározásra összpontosít.

A gépi tanulás megvizsgálja a mintákat és korrelációkat; tanul belőlük, és úgy optimalizálja magát, ahogy megy. Az adatbányászat információforrásként használatos a gépi tanuláshoz. Az adatbányászati technikák maguk is összetett algoritmusokat alkalmaznak, és segíthetnek jobban szervezett adathalmazokat biztosítani a gépi tanulási alkalmazás számára.

A mesterséges neurális hálózattal összekapcsolt neuronokat csomópontoknak nevezzük, amelyeket rétegekbe kötnek és csoportosítanak. Amikor egy csomópont numerikus jelet kap, akkor más releváns neuronokat jelez, amelyek párhuzamosan működnek. A mélytanulás a neurális hálózatot használja, és „mély”, mert nagyon nagy mennyiségű adatot használ, és egyidejűleg több réteget vesz fel a neurális hálózatban.

A gépi tanulás több tanulási modell, technika és technológia egyvelege, amelyek statisztikákat is tartalmazhatnak. Maga a statisztika az adatok használatára összpontosít előrejelzések készítéséhez és modellek elemzéshez való létrehozásához.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel