Hva er maskinlæring?
Maskinlæring er en undergruppe av kunstig intelligens (AI) der datamaskiner lærer av data og forbedres med erfaring uten å være eksplisitt programmert.
Maskinlæringsdefinisjon i detalj
Maskinlæring er en undergruppe av kunstig intelligens (AI). Det er fokusert på å lære datamaskiner å lære av data og forbedre seg med erfaring – i stedet for å være eksplisitt programmert til å gjøre det. I maskinlæring er algoritmer opplært til å finne mønstre og korrelasjoner i store datasett og for å ta de beste beslutningene og prognosene basert på denne analysen. Maskinlæringsprogrammer forbedres ved bruk og blir mer nøyaktige jo mer data de har tilgang til.
Bruk av maskinlæring er rundt oss – i våre hjem, våre handlekurver, våre underholdningsmedier og våre helsetjenester.
Hvordan er maskinlæring relatert til AI?
Maskinlæring – og dens komponenter i dype lærings- og nevrale nettverk – passer som konsentriske delmengder av AI. AI behandler data for å ta beslutninger og prognoser. Maskinlæringsalgoritmer tillater AI ikke bare å behandle disse dataene, men å bruke dem til å lære og bli smartere, uten å trenge noen ekstra programmering. Kunstig intelligens er forelderen til alle maskinlæringsdelsettene under den. Innenfor det første delsettet er maskinlæring; innenfor det er dyp læring, og deretter nevrale nettverk innenfor det.
Hva er et nevralt nettverk?
Et kunstig nevralt nettverk (ANN) modelleres på neuronene i en biologisk hjerne. Kunstige nevroner kalles noder og er samlet sammen i flere lag, som opererer parallelt. Når et kunstig nevron mottar et numerisk signal, prosesserer det og signaliserer de andre nevronene som er koblet til det. Som i en menneskelig hjerne resulterer neuralforsterkning i forbedret mønstergjenkjenning, ekspertise og generell læring.
Hva er dyp læring?
Denne typen maskinlæring kalles "dyp" fordi den inkluderer mange lag av nevralt nettverk og massive volumer av komplekse og ulike data. For å oppnå dyp læring, engasjerer systemet seg med flere lag i nettverket, og trekker ut stadig høyere utganger. For eksempel, et dypt læringssystem som behandler naturbilder og leter etter Gloriosa daisies vil – på første lag – gjenkjenne en plante. Når den beveger seg gjennom nevrale lag, vil den deretter identifisere en blomst, deretter en daisy, og til slutt en Gloriosa daisy. Eksempler på anvendelser for dyp læring inkluderer talegjenkjenning, bildeklassifisering og farmasøytisk analyse.
Hvordan fungerer maskinlæring?
Maskinlæring består av ulike typer maskinlæringsmodeller, ved hjelp av ulike algoritmeteknikker. Avhengig av arten av dataene og det ønskede resultatet, kan en av fire læringsmodeller brukes: overvåket, ikke-overvåket, halvovervåket eller forsterkning. Innenfor hver av disse modellene kan en eller flere algoritmiske teknikker brukes – i forhold til datasettene som er i bruk og de tilsiktede resultatene. Maskinlæringsalgoritmer er i utgangspunktet utformet for å klassifisere ting, finne mønstre, forutsi resultater og ta informerte beslutninger. Algoritmer kan brukes én om gangen eller kombineres for å oppnå best mulig nøyaktighet når komplekse og mer uforutsigbare data er involvert.
Slik fungerer maskinlæringsprosessen
Hva er veiledet læring?
Veiledet læring er den første av fire maskinlæringsmodeller. I overvåkede læringsalgoritmer læres maskinen av eksempel. Overvåkede læringsmodeller består av datapar med inndata og utdata, der utdataene er merket med ønsket verdi. La oss for eksempel si at målet er at maskinen skal fortelle forskjellen mellom daisies og pansies. Et binært inngangsdatapar omfatter både et bilde av en daisy og et bilde av en pansring. Ønsket resultat for det bestemte paret er å plukke daisy, så det vil bli pre-identifisert som riktig utfall.
Ved hjelp av en algoritme kompilerer systemet alle disse treningsdataene over tid og begynner å bestemme korrelative likheter, forskjeller og andre logiske punkter - inntil det kan forutsi svarene for daisy-or-pansy spørsmål av seg selv. Det er det samme som å gi et barn et sett med problemer med en svarnøkkel, og deretter be dem om å vise sitt arbeid og forklare sin logikk. Veiledede læringsmodeller brukes i mange av programmene vi samhandler med hver dag, for eksempel anbefalingsmotorer for produkter og trafikkanalyseapper som Waze, som forutsier den raskeste ruten på forskjellige tider av dagen.
Hva er læring uten tilsyn?
Læring uten tilsyn er den andre av de fire maskinlæringsmodellene. I læringsmodeller uten tilsyn finnes det ingen svarnøkkel. Maskinen studerer inndataene – hvorav mye er umerket og ustrukturert – og begynner å identifisere mønstre og korrelasjoner, ved hjelp av alle relevante, tilgjengelige data. På mange måter er ikke-overvåket læring modellert på hvordan mennesker observerer verden. Vi bruker intuisjon og erfaring til å gruppere ting sammen. Etter hvert som vi opplever flere og flere eksempler på noe, blir vår evne til å kategorisere og identifisere det stadig mer nøyaktig. For maskiner er "erfaring" definert av mengden data som er inndata og gjort tilgjengelig. Vanlige eksempler på ikke-overvåkede læringsprogrammer inkluderer ansiktsgjenkjenning, gensekvensanalyse, markedsforskning og cybersikkerhet.
Hva er semi-overvåket læring?
Semi-overvåket læring er den tredje av fire maskinlæringsmodeller. I en perfekt verden ville alle data bli strukturert og merket før de blir matet inn i et system. Men siden det åpenbart ikke er mulig, blir semi-overvåket læring en brukbar løsning når store mengder rå, ustrukturerte data er til stede. Denne modellen består i å legge inn små mengder merkede data for å forsterke umerkede datasett. I hovedsak fungerer de merkede dataene for å gi en løpende start på systemet og kan forbedre læringshastigheten og nøyaktigheten betraktelig. En halvovervåket lærealgoritme instruerer maskinen til å analysere de merkede data for korrelative egenskaper som kan anvendes på de umerkede data.
Som utforsket i dybden i denne MIT Press forskningsartikkelen, er det imidlertid risiko forbundet med denne modellen, hvor feil i de merkede dataene blir lært og replikert av systemet. Firmaer som bruker semi-overvåket læring mest mulig, sikrer at protokoller for beste praksis er på plass. Semi-overvåket læring brukes i tale og språklig analyse, kompleks medisinsk forskning som protein kategorisering, og høynivå svindel deteksjon.
Hva er forsterkningslæring?
Forsterkningslæring er den fjerde maskinlæringsmodellen. I veiledet læring får maskinen svarnøkkelen og lærer ved å finne korrelasjoner mellom alle de riktige resultatene. Den forsterkende læringsmodellen inkluderer ikke en svarnøkkel, men gir i stedet et sett med tillatte handlinger, regler og potensielle slutttilstander. Når det ønskede målet for algoritmen er fast eller binær, kan maskiner lære ved eksempel. Men i tilfeller der ønsket utfall er foranderlig, må systemet lære av erfaring og belønning. I forsterkende læringsmodeller er "belønningen" numerisk og er programmert inn i algoritmen som noe systemet søker å samle inn.
På mange måter er denne modellen analog til å lære noen hvordan å spille sjakk. Selvfølgelig ville det være umulig å prøve å vise dem hver potensiell bevegelse. I stedet forklarer du reglene og de bygger opp sine ferdigheter gjennom praksis. Belønninger kommer i form av ikke bare å vinne spillet, men også skaffe motstanderens brikker. Anvendelser av forsterkning læring inkluderer automatisert pris budgivning for kjøpere av online reklame, dataspill utvikling, og høy innsats aksjemarkedet handel.
Maskinlæring for foretak i aktivitet
Maskinlæringsalgoritmer gjenkjenner mønstre og korrelasjoner, noe som betyr at de er veldig flinke til å analysere sin egen avkastning. For firmaer som investerer i maskinlæringsteknologier, gir denne funksjonen en nesten umiddelbar vurdering av driftsmessig påvirkning. Nedenfor er bare et lite utvalg av noen av de voksende områdene av bedriftens maskinlæring applikasjoner.
Anbefalingsmotorer: Fra 2009 til 2017 steg antallet amerikanske husholdninger som abonnerer på videostrømmetjenester med 450%. Og en artikkel fra 2020 i Forbes Magazine rapporterer en ytterligere pigg i videostrømming brukstall på opptil 70%. Anbefalingsmotorer har applikasjoner på tvers av mange detaljhandels- og shoppingplattformer, men de kommer definitivt til sin egen med strømming av musikk og videotjenester.
Dynamisk markedsføring: Generering av leads og innføring av dem gjennom salgstrakten krever mulighet til å samle inn og analysere så mye kundedata som mulig. Moderne forbrukere genererer en enorm mengde varierte og ustrukturerte data – fra chat-transkripsjoner til bildeopplastinger. Bruken av maskinlæringsapplikasjoner hjelper markedsførere med å forstå disse dataene – og bruke dem til å levere persontilpasset markedsføringsinnhold og engasjement i sanntid med kunder og leads.
ERP og prosessautomatisering: ERP-databaser inneholder brede og ulike datasett, som kan omfatte salgsstatistikk, forbrukeranmeldelser, markedstrendrapporter og administrasjonsposter for forsyningskjeden. Maskinlæringsalgoritmer kan brukes til å finne korrelasjoner og mønstre i slike data. Disse innsiktene kan deretter brukes til å informere nesten alle områder av virksomheten, inkludert optimalisering av arbeidsflyten til Internett of Things (IoT) enheter i nettverket eller de beste måtene å automatisere repeterende eller feilutsatte oppgaver.
Forutsigende vedlikehold: Moderne forsyningskjeder og smarte fabrikker bruker i økende grad IoT-enheter og -maskiner, i tillegg til skyforbindelser på tvers av alle flåter og operasjoner. Nedbrytninger og ineffektivitet kan føre til enorme kostnader og forstyrrelser. Når vedlikeholds- og reparasjonsdata samles inn manuelt, er det nesten umulig å forutsi potensielle problemer – ikke minst automatisere prosesser for å forutsi og forhindre dem. IoT gatewaysensorer kan monteres på til og med tiår gamle analoge maskiner, noe som gir synlighet og effektivitet i hele virksomheten.
Maskinlæringsutfordringer
I sin bok Spurious Correlasjoner påpeker dataforsker og Harvard-utdannet Tyler Vigan at «Ikke alle korrelasjoner indikerer en underliggende årsakssammenheng.» For å illustrere dette inkluderer han et diagram som viser en tilsynelatende sterk korrelasjon mellom margarinforbruk og skilsmissefrekvensen i delstaten Maine. Selvfølgelig er dette diagrammet ment å gjøre et humoristisk punkt. På et mer alvorlig notat er imidlertid maskinlæringsapplikasjoner sårbare for både menneskelig og algoritmisk skjevhet og feil. Og på grunn av deres tilbøyelighet til å lære og tilpasse seg, kan feil og falske korrelasjoner raskt forplante seg og forurense resultater på tvers av nevrale nettverk.
En ekstra utfordring kommer fra maskinlæringsmodeller, hvor algoritmen og dens produksjon er så komplekse at de ikke kan forklares eller forstås av mennesker. Dette kalles en «black box»-modell, og den setter selskaper i fare når de finner seg ute av stand til å bestemme hvordan og hvorfor en algoritme kom til en bestemt konklusjon eller beslutning.
Heldigvis, etter hvert som kompleksiteten til datasett og maskinlæringsalgoritmer øker, gjør også verktøyene og ressursene som er tilgjengelige for å håndtere risiko. De beste selskapene jobber for å eliminere feil og skjevheter ved å etablere robuste og oppdaterte retningslinjer for AI-styring og protokoller for beste praksis.