Mitä koneoppiminen on?
Koneoppiminen on tekoälyn (AI) osajoukko, jossa tietokoneet oppivat datasta ja kehittyvät kokemuksella ilman eksplisiittistä ohjelmointia.
Koneoppimisen määritys yksityiskohtaisesti
Koneoppiminen on tekoälyn (AI) osajoukko. Se keskittyy opettamaan tietokoneita oppimaan datasta ja parantamaan kokemuksella – sen sijaan että se olisi nimenomaisesti ohjelmoitu siihen. Koneoppimisessa algoritmit koulutetaan etsimään malleja ja korrelaatioita suurista tietojoukoista ja tekemään parhaat päätökset ja ennusteet analyysin perusteella. Koneoppimissovellukset kehittyvät käytön myötä ja muuttuvat tarkemmiksi, mitä enemmän tietoja niillä on käytettävissään.
Koneoppimisen sovellukset ovat kaikkialla ympärillämme – kodeissamme, ostoskärryissämme, viihdemediassamme ja terveydenhuollossamme.
Miten koneoppiminen liittyy tekoälyyn?
Koneoppiminen – ja sen syvän oppimisen ja neuroverkkojen komponentit – sopivat kaikki tekoälyn samankeskisiksi osajoukoiksi. Tekoäly käsittelee tietoja päätöksenteon ja ennusteiden tekemiseksi. Koneoppimisalgoritmien avulla tekoäly voi paitsi käsitellä kyseistä dataa myös käyttää sitä oppiakseen ja tullakseen älykkäämmäksi ilman lisäohjelmointia. Tekoäly on kaikkien sen alla olevien koneoppimisen osajoukkojen ylätaso. Ensimmäisessä osajoukossa on koneoppiminen; siinä on syvä oppiminen ja sitten neuroverkot siinä.
Mikä on neuroverkko?
Keinotekoinen neuraaliverkko (ANN) on mallinnettu biologisten aivojen neuroneille. Keinotekoisia neuroneja kutsutaan solmuiksi, ja ne rypistyvät yhteen useisiin kerroksiin, jotka toimivat rinnakkain. Kun keinotekoinen neuroni vastaanottaa numeerisen signaalin, se käsittelee sen ja ilmaisee muut siihen liittyvät neuronit. Kuten ihmisaivoissa, neuraalinen vahvistuminen parantaa kuvioiden tunnistamista, asiantuntemusta ja yleistä oppimista.
Mitä syväoppiminen on?
Tällaista koneoppimista kutsutaan ”syväksi”, koska se sisältää monia neuroverkon kerroksia ja massiivisia määriä monimutkaista ja hajanaista dataa. Syvän oppimisen saavuttamiseksi järjestelmä käyttää useita kerroksia verkossa ja louhii yhä korkeamman tason tuotoksia. Esimerkiksi syvä oppimisjärjestelmä, joka käsittelee luontokuvia ja etsii Gloriosan päiväkoteja, tunnistaa – ensimmäisessä kerroksessa – kasvin. Kun se liikkuu hermokerrosten läpi, se tunnistaa sitten kukan, sitten daisy ja lopuksi Gloriosa daisy. Esimerkkejä syväoppimisen sovelluksista ovat puheentunnistus, imagon luokittelu ja lääkeanalyysi.
Miten koneoppiminen toimii?
Koneoppiminen koostuu erityyppisistä koneoppimismalleista, joissa käytetään erilaisia algoritmisia tekniikoita. Aineiston luonteesta ja halutusta lopputuloksesta riippuen voidaan käyttää yhtä neljästä oppimismallista: valvottua, valvomatonta, puolivalvottua tai vahvistusta. Kussakin näistä malleista voidaan soveltaa yhtä tai useampaa algoritmista tekniikkaa – suhteessa käytössä oleviin tietoaineistoihin ja aiottuihin tuloksiin. Koneoppimisalgoritmit on periaatteessa suunniteltu luokittelemaan asioita, löytämään malleja, ennustamaan tuloksia ja tekemään tietoon perustuvia päätöksiä. Algoritmeja voidaan käyttää yksi kerrallaan tai yhdistää parhaan mahdollisen tarkkuuden saavuttamiseksi, kun kyseessä on monimutkainen ja arvaamattomampi data.
Miten koneoppimisprosessi toimii
Mitä on valvottu oppiminen?
Valvottu oppiminen on ensimmäinen neljästä koneoppimismallista. Valvotuissa oppimisalgoritmeissa konetta opetetaan esimerkin avulla. Valvotut oppimismallit koostuvat ”tulo”- ja ”tuotos”-tietopareista, joissa tuotos on merkitty halutulla arvolla. Oletetaan esimerkiksi, että tavoitteena on, että kone kertoo eron päivänkakkaroiden ja panssien välillä. Yksi binäärinen syöttötietopari sisältää sekä kuvan daisy että kuva pansy. Toivottu tulos kyseiselle parille on valita daisy, joten se tunnistetaan etukäteen oikeaksi lopputulokseksi.
Algoritmin avulla järjestelmä kokoaa kaikki nämä harjoitustiedot ajan kuluessa ja alkaa määrittää korrelatiivisia yhtäläisyyksiä, eroja ja muita logiikan kohtia – kunnes se pystyy ennustamaan vastaukset daisy-or-pansy-kysymyksiin kokonaan itsestään. Se vastaa sitä, että lapselle annetaan joukko ongelmia, joilla on vastausavain, ja sitten pyydetään heitä näyttämään työnsä ja selittämään logiikkansa. Valvottuja oppimismalleja käytetään monissa sovelluksissa, joiden kanssa olemme vuorovaikutuksessa joka päivä, kuten suositusmoottorit tuotteille ja liikenteen analysointisovellukset, kuten Waze, jotka ennustavat nopeinta reittiä eri vuorokaudenaikoina.
Mitä on valvomaton oppiminen?
Valvomaton oppiminen on toinen neljästä koneoppimismallista. Valvomattomissa oppimismalleissa ei ole vastausavainta. Kone tutkii syöttötietoja – joista suuri osa on merkitsemätöntä ja jäsentymätöntä – ja alkaa tunnistaa kuvioita ja korrelaatioita käyttäen kaikkea olennaista, saatavilla olevaa tietoa. Valvomatonta oppimista mallinnetaan monin tavoin sen perusteella, miten ihmiset tarkkailevat maailmaa. Käytämme intuitiota ja kokemusta asioiden ryhmittelyyn. Kun koemme yhä enemmän esimerkkejä jostakin, kykymme luokitella ja tunnistaa se tulee yhä tarkemmaksi. Koneissa ”kokemus” määräytyy syötettyjen ja saataville asetettujen tietojen määrän mukaan. Yleisiä esimerkkejä valvomattomista oppimissovelluksista ovat kasvojen tunnistus, geenisekvenssianalyysi, markkinatutkimus ja kyberturvallisuus.
Mitä on puoliohjattu oppiminen?
Puoliohjattu oppiminen on kolmas neljästä koneoppimismallista. Täydellisessä maailmassa kaikki data jäsenneltäisiin ja merkittäisiin ennen järjestelmään syöttämistä. Mutta koska se ei selvästikään ole mahdollista, puolivalvotusta oppimisesta tulee toimiva ratkaisu, kun käytettävissä on valtavia määriä raakaa, rakenteetonta dataa. Tässä mallissa syötetään pieniä määriä merkittyjä tietoja tunnistamattomien tietojoukkojen lisäämiseksi. Merkittyjen tietojen avulla järjestelmä käynnistyy, ja se voi huomattavasti parantaa oppimisnopeutta ja -tarkkuutta. Puoliksi valvottu oppimisalgoritmi ohjeistaa koneen analysoimaan korrelaatio-ominaisuuksien merkittyjä tietoja, joita voitaisiin käyttää merkitsemättömiin tietoihin.
Kuten tässä MIT Press -tutkimusjulkaisussa syvällisesti tutkittiin, tähän malliin liittyy kuitenkin riskejä, joissa järjestelmä oppii ja jäljittelee merkityn tiedon puutteita. Yritykset, jotka käyttävät parhaiten puoliohjattua oppimista, varmistavat, että parhaiden käytäntöjen protokollat ovat käytössä. Puolivalvottua oppimista käytetään puheen ja kielellisen analyysin, monimutkaisen lääketieteellisen tutkimuksen, kuten proteiiniluokituksen, ja korkean tason petosten havaitsemisessa.
Mitä on vahvistamisen oppiminen?
Vahvistava oppiminen on neljäs koneoppimisen malli. Valvotussa oppimisessa kone saa vastausavaimen ja oppii löytämällä korrelaatioita kaikkien oikeiden lopputulosten joukosta. Vahvistava oppimismalli ei sisällä vastausavainta, vaan antaa panokseksi joukon sallittuja toimia, sääntöjä ja mahdollisia lopputiloja. Kun algoritmin haluttu tavoite on kiinteä tai binääri, koneet voivat oppia esimerkiksi. Mutta tapauksissa, joissa haluttu lopputulos on muuttumaton, järjestelmän on opittava kokemuksen ja palkkion perusteella. Vahvistusoppimismalleissa ”palkinto” on numeerinen ja ohjelmoidaan algoritmiin, kun järjestelmä pyrkii keräämään sitä.
Tämä malli on monin tavoin analoginen, kun opetetaan jollekulle, miten pelata shakkia. Varmasti olisi mahdotonta yrittää näyttää heille kaikki mahdolliset siirrot. Sen sijaan selität säännöt ja ne kehittävät taitojaan käytännön kautta. Palkinnot tulevat paitsi voittamalla, myös hankkimalla vastustajan nappuloita. Vahvistamisoppimisen sovelluksia ovat automatisoitu hintatarjoaminen verkkomainonnan ostajille, tietokonepelien kehittäminen ja korkean panoksen pörssikaupankäynti.
Enterprise Machine Learning toiminnassa
Koneoppimisalgoritmit tunnistavat kuvioita ja korrelaatioita, mikä tarkoittaa, että ne ovat erittäin hyviä analysoimaan omaa ROI:taan. Koneoppimisteknologioihin investoiville yrityksille tämä ominaisuus mahdollistaa lähes välittömän operatiivisten vaikutusten arvioinnin. Alla on vain pieni otos joistakin kasvavista aloista yrityksen koneoppimissovelluksissa.
Suositusmoottorit: Vuosina 2009–2017 videoiden suoratoistopalveluja tilaavien yhdysvaltalaisten kotitalouksien määrä kasvoi 450 prosenttia. Forbes-lehden vuonna 2020 julkaistussa artikkelissa kerrotaan, että videoiden suoratoiston käyttöluvut ovat nousseet jopa 70 prosenttiin. Suositusmoottoreilla on sovelluksia monilla kauppa- ja ostosalustoilla, mutta ne tulevat varmasti omilleen suoratoisto- ja videopalveluiden myötä.
Dynaaminen markkinointi: Vihjeiden luominen ja niiden käyttäminen myyntisuppilon kautta edellyttää kykyä kerätä ja analysoida mahdollisimman paljon asiakastietoja. Nykyaikaiset kuluttajat tuottavat valtavan määrän vaihtelevaa ja strukturoimatonta dataa – chat-transkripteistä kuvien latauksiin. Koneoppimissovellusten käyttö auttaa markkinoijia ymmärtämään näitä tietoja – ja toimittamaan niiden avulla yksilöllistä markkinointisisältöä ja reaaliaikaista sitoutumista asiakkaisiin ja liideihin.
ERP ja prosessien automatisointi: ERP-tietokannat sisältävät laajoja ja erilaisia tietokokonaisuuksia, jotka voivat sisältää myyntisuoritustilastoja, kuluttajakatsauksia, markkinatrendiraportteja ja toimitusketjun hallintatietueita. Koneoppimisalgoritmeja voidaan käyttää korrelaatioiden ja mallien löytämiseen tällaisista tiedoista. Näitä tietoja voidaan sitten käyttää lähes kaikkien liiketoiminnan osa-alueiden tiedottamiseen, mukaan lukien esineiden internetin (IoT) laitteiden työnkulkujen optimointiin verkossa tai parhaisiin tapoihin automatisoida toistuvia tai virheille alttiita tehtäviä.
Ennakoiva kunnossapito: Nykyaikaiset toimitusketjut ja älykkäät tehtaat hyödyntävät yhä enemmän IoT-laitteita ja -koneita sekä pilviyhteyksiä kaikissa kalustoissaan ja toiminnoissaan. Katkokset ja tehottomuus voivat aiheuttaa valtavia kustannuksia ja häiriöitä. Kun huolto- ja korjaustietoja kerätään manuaalisesti, on lähes mahdotonta ennustaa mahdollisia ongelmia – saati automatisoida prosesseja niiden ennakoimiseksi ja ehkäisemiseksi. IoT-yhdyskäytäväanturit voidaan asentaa jopa vuosikymmeniä vanhoihin analogisiin koneisiin, mikä takaa näkyvyyden ja tehokkuuden koko liiketoiminnassa.
Koneoppimisen haasteet
Tiedontutkija ja Harvardin valmistunut Tyler Vigan huomauttavat kirjassaan "Kaikki korrelaatiot eivät viittaa taustalla olevaan kausaaliseen yhteyteen". Tämän havainnollistamiseksi hän sisältää kaavion, jossa näkyy ilmeisen vahva korrelaatio margariinin kulutuksen ja Mainen osavaltion avioeroprosentin välillä. Tietenkin tällä kaaviolla on tarkoitus tehdä humoristinen pointti. Vakavampaa on kuitenkin, että koneoppimissovellukset ovat alttiita sekä inhimillisille että algoritmisille vääristymille ja virheille. Ja niiden oppimis- ja sopeutumistaipumuksen vuoksi virheet ja virheelliset korrelaatiot voivat nopeasti levittää ja saastuttaa tuloksia hermoverkossa.
Lisähaasteena ovat koneoppimismallit, joissa algoritmi ja sen tuotos ovat niin monimutkaisia, etteivät ihmiset pysty selittämään tai ymmärtämään niitä. Tätä kutsutaan "black box" -malliksi ja se vaarantaa yritykset, kun ne eivät pysty määrittämään, miten ja miksi algoritmi päätyi tiettyyn johtopäätökseen tai päätökseen.
Onneksi tietojoukkojen ja koneoppimisalgoritmien monimutkaisuuden kasvaessa myös riskien hallintaan käytettävissä olevat työkalut ja resurssit lisääntyvät. Parhaat yritykset pyrkivät poistamaan virheitä ja puolueellisuutta luomalla vankkoja ja ajantasaisia tekoälyn hallinnointiohjeita ja parhaiden käytäntöjen protokollia.