
Hva er maskinlæring?
Denne websiden er maskinoversatt for å hjelpe deg. SAP kan ikke garantere at maskinoversettelsen er riktig eller fullstendig oversatt. Den opprinnelige engelske nettsiden finner du ved å bruke verdenskartet i øvre høyre hjørne av denne siden.
Maskinlæring er en undergruppe av kunstig intelligens (AI). Den fokuserer på å lære datamaskiner å lære av data og forbedre med erfaring, i stedet for å bli programmert til å gjøre det. I maskinlæring trenes algoritmer opp til å finne mønstre og korrelasjoner i store datasett og for å ta de beste beslutningene og prognosene basert på denne analysen. Maskinlæringsapplikasjoner forbedres med bruk og blir mer nøyaktige med de mer dataene de har tilgang til. Alle applikasjoner for maskinlæring er rundt oss – i våre hjem, våre handlekurver, våre underholdningsmedier og våre helsetjenester.
Maskinlæring forklart
Hvordan er maskinlæring relatert til AI?
Maskinlæring – og dens komponenter i dype lærings- og nevrale nettverk – alle passer som konsentriske delsett av AI. AI behandler data for å ta beslutninger og prognoser. Maskinlæringsalgoritmer tillater AI ikke bare å behandle disse dataene, men å bruke dem til å lære og få smartere, uten å måtte ha mer programmering. Kunstig intelligens er overordnet for alle maskinlæringsdelsettene under det. I det første delsettet er maskinlæring; i det er dyp læring, og deretter nevrale nettverk innenfor det.
Diagram over relasjonen mellom AI og maskinlæring
Hva er et nevralt nettverk?
Et kunstig nevralt nettverk (ANN) er modellert etter nevronene i en biologisk hjerne. Kunstige nevroner kalles knuter og er klynget sammen i flere lag, som opererer parallelt. Når en kunstig nevronen får et numerisk signal, behandler den det og signaliserer de andre nevronene som er koblet til den. Som i en menneskelig hjerne resulterer nevralforsterkning i forbedret mønstergjenkjenning, ekspertise og generell læring.
Hva er dyp læring?
Denne typen maskinlæring kalles «dyp» fordi det inkluderer mange lag av det nevrale nettverket og massive volumer av komplekse og avvikende data. For å oppnå dyp læring engasjerer systemet seg med flere lag i nettverket og trekker ut stadig større resultater på høyere nivå. Et dypt læringssystem som behandler naturbilder og leter etter Gloriosa daisies vil – ved det første laget – gjenkjenne en fabrikk. Da den beveger seg gjennom de nevrale lagene vil den deretter identifisere en blomst, deretter en daisy, og til slutt en Gloriosa daisy. Eksempler på programmer for dyp læring er talegjenkjenning, bildeklassifisering og legemiddelanalyse.
Hvordan fungerer maskinlæring?
Maskinlæring består av ulike typer maskinlæringsmodeller ved hjelp av ulike algoritmiske teknikker. Avhengig av dataenes art og det ønskede resultatet, kan en av fire læringsmodeller brukes: overvåket, uten tilsyn, semi-overvåket eller forsterkning. Innenfor hver av disse modellene kan en eller flere algoritmiske teknikker anvendes, i forhold til datasettene som er i bruk, og de tiltenkte resultatene. Maskinlæringsalgoritmer er hovedsakelig utformet for å klassifisere ting, finne mønstre, forutsi resultater og ta informerte beslutninger. Algoritmer kan brukes én om gangen eller kombinert for å oppnå best mulig nøyaktighet når komplekse og mer uforutsigbare data er involvert.
Slik fungerer maskinlæringsprosessen
Hva overvåkes opplæring?
Overvåket læring er den første av fire maskinlæringsmodeller. I overvåkede læringsalgoritmer blir maskinen for eksempel undervist. Veiledede læringsmodeller består av "inndata" og "utdata"-datapar, der utdataene er merket med ønsket verdi. La oss for eksempel si at målet er at maskinen skal fortelle forskjellen mellom daisier og pansier. Et binært inndatapar inkluderer både et bilde av en daisy og et bilde av en pansy. Det ønskede resultatet for det bestemte paret er å velge daisy, så det vil bli forhåndsidentifisert som det korrekte resultatet.
Ved hjelp av en algoritme kompilerer systemet alle disse treningsdataene over tid og begynner å fastslå korrelative likheter, forskjeller og andre logiske punkter – inntil det kan forutsi svarene for spørsmål om daisy-or-pansy i seg selv. Det er likeverdig å gi et barn et sett med problemer med en svarnøkkel, og ber dem om å vise sitt arbeid og forklare logikken deres. Veiledende læringsmodeller brukes i mange av applikasjonene vi samhandler med hver dag, for eksempel anbefalingsmotorer for produkter og trafikkanalyseapper som Waze, som forutser den raskeste ruten på ulike tider av dagen.
Hva er opplæring uten tilsyn?
Uovervåket læring er det andre av de fire maskinlæringsmodellene. I læringsmodeller uten tilsyn finnes det ingen svarnøkkel. Maskinen studerer inndataene – som er umerket og ustrukturert – og begynner å identifisere mønstre og korrelasjoner ved hjelp av alle relevante, tilgjengelige data. På mange måter er uovervåket læring modellert på hvordan menneskene observerer verden. Vi bruker intuisjon og erfaring til å gruppere ting sammen. Når vi opplever flere og flere eksempler på noe, blir vår evne til å kategorisere og identifisere det stadig mer nøyaktig. For maskiner defineres "erfaring" av mengden data som er lagt inn og gjort tilgjengelig. Vanlige eksempler på læringsapplikasjoner uten tilsyn er ansiktsgjenkjenning, gensekvensanalyse, markedsforskning og cybersikkerhet.
Hva er delvis overvåket opplæring?
Halvovervåket læring er den tredje av fire maskinlæringsmodeller. I en perfekt verden ville alle data bli strukturert og merket før de blir lagt inn i et system. Men siden det åpenbart ikke er mulig, blir semi-overvåket læring en arbeidbar løsning når store mengder råvarer, ustrukturerte data finnes. Denne modellen består av å angi små mengder merkede data for å supplere umerkede datasett. De merkede dataaktene er hovedsakelig merket for å gi en begynnende start på systemet og kan forbedre læringshastigheten og -nøyaktigheten betraktelig. En halvovervåket læringsalgoritme instruerer maskinen om å analysere de merkede dataene for korrelative egenskaper som kan brukes på de umerkede dataene.
Som utforsket i dybden i dette MIT Press forskningspapiret, er det imidlertid risiko knyttet til denne modellen, hvor feil i de merkede dataene blir lært og replikert av systemet. Firmaer som bruker delvis overvåket opplæring mest mulig, sikrer at protokoller for god forretningsførsel er på plass. Halvovervåket læring brukes i tale og lingvistisk analyse, kompleks medisinsk forskning som proteinkategorisering og høynivå-svindeldeteksjon.
Hva er en forsterkning av læring?
Forsterkningslæring er den fjerde maskinlæringsmodellen. I overvåket læring får maskinen svarnøkkelen og lærer ved å finne korrelasjoner mellom alle de riktige resultatene. Forsterkningslæringsmodellen inkluderer ikke en svarnøkkel, men heller et sett med tillatte handlinger, regler og potensielle slutttilstander. Når det ønskede målet til algoritmen er fast eller binær, kan maskiner lære for eksempel. Men i tilfeller der det ønskede resultatet kan muteres, må systemet lære ved hjelp av erfaring og belønning. I forsterkningslæringsmodeller er «belønningen» numerisk og programmert inn i algoritmen som noe systemet forsøker å samle inn.
På mange måter er denne modellen analog til å lære noen hvordan man spiller sjakk. Det er usikkert at det ville være umulig å forsøke å vise dem hvert eneste mulige trekk. I stedet forklarer du reglene og bygger opp ferdighetene deres gjennom praksis. Belønninger kommer i form av at det ikke bare vinner spillet, men også erverver motstanderens brikker. Anvendelser av forsterkningsopplæring omfatter automatisert pristilbud for kjøpere av nettbasert reklame, dataspill utvikling og handel med aksjemarkedet.
Enterprise Machine Learning i aktivitet
Maskinlæringsalgoritmer gjenkjenner mønstre og korrelasjoner, noe som betyr at de er svært gode til å analysere sin egen ROI. For firmaer som investerer i maskinlæringsteknologier, muliggjør denne funksjonen en nesten umiddelbar vurdering av driftsmessig påvirkning. Nedenfor finner du bare et lite utvalg av noen av de voksende områdene for maskinlæringsapplikasjoner for bedrifter.
- Anbefalingsmotorer: Fra 2009 til 2017 steg antallet amerikanske husholdninger som abonnerte på videostrømmetjenester med 450 prosent. Og en artikkel fra 2020 i magasinet Forbes melder om ytterligere spiss i videostrømmende brukstall på opptil 70 prosent. Anbefalingsmotorer har anvendelser på tvers av mange butikk- og handleplattformer, men de kommer definitivt inn i sitt eget med streamingmusikk og video- tjenester.
- Dynamisk markedsføring: Generering av leads og lagring av leads gjennom salgstrakten krever at du kan samle inn og analysere så mye kundedata som mulig. Moderne forbrukere genererer en enorm mengde varierte og ustrukturerte data – fra chattranskripsjoner til bildeopplastinger. Bruken av maskinlæringsapplikasjoner hjelper markedsførere med å forstå disse dataene – og bruke dem til å levere persontilpasset markedsføringsinnhold og sanntidsoppdrag med kunder og leads.
- ERP og prosessautomatisering: ERP-databaser inneholder brede og atskilte datasett, som kan omfatte salgsytelsesstatistikk, forbrukergjennomgang, markedstrendrapporter og forsyningskjedestyringsposter. Maskinlæringsalgoritmer kan brukes til å finne korrelasjoner og mønstre i slike data. Disse analysene kan deretter brukes til å informere praktisk talt alle deler av virksomheten, inkludert optimalisering av workflower for Internet of Things-enheter (IoT) innenfor nettverket eller de beste måtene å automatisere repetitive eller feil-prone oppgaver på.
- Prognosevedlikehold: Moderne forsyningskjeder og smarte fabrikker gjør stadig større bruk av IoT-enheter og maskiner, samt nettskyforbindelse på tvers av alle sine flåter og operasjoner. Innbrudd og ineffektivitet kan føre til enorme kostnader og forstyrrelser. Når vedlikeholds- og reparasjonsdata samles inn manuelt, er det nesten umulig å forutsi potensielle problemer - la alene automatisere prosesser for å prognostisere og forhindre dem. IoT gatewaysensorer kan monteres på selv dekadeseldgamle analoge maskiner, noe som gir synlighet og effektivitet over hele virksomheten.
Maskinlæringsutfordringer
I sin bok Spurious CorRelationship peker dataforsker og Harvard-utdannet Tyler Vigan på at «Ikke alle korrelasjoner indikerer en underliggende årsakssammenheng.» For å illustrere dette inkluderer han en oversikt som viser en tilsynelatende sterk korrelasjon mellom margarinforbruket og skilsmissesatsen i delstaten Maine. Dette diagrammet er selvsagt ment å lage et humoristisk punkt. I en mer alvorlig merknad er imidlertid maskinlæringsapplikasjoner sårbare for både menneskelige og algoritmiske skjevheter og feil. Og på grunn av deres tilbøyelighet til å lære og tilpasse seg, kan feil og falske korrelasjoner raskt forplante og forurense utfall over det nevrale nettverket.
En ytterligere utfordring kommer fra maskinlæringsmodeller, der algoritmen og dens utdata er så komplekse at de ikke kan forklares eller forstås av mennesker. Dette kalles en "black box"-modell og den setter bedrifter i fare når de finner seg ute av stand til å fastslå hvordan og hvorfor en algoritme ankom en bestemt konklusjon eller beslutning.
Heldigvis, når kompleksiteten i datasett og maskinlæringsalgoritmer øker, gjør dette verktøyene og ressursene som er tilgjengelige for å håndtere risiko. De beste selskapene jobber for å eliminere feil og skjevheter ved å etablere robuste og oppdaterte retningslinjer for AI-styring og protokoller for beste praksis.
Gjøre det meste av maskinlæring
Følg i fotsporene til «raske elever» med disse fem erfaringene.
Ofte stilte spørsmål om maskinlæring
Maskinlæring er et undersett av AI og kan ikke eksistere uten den. AI bruker og behandler data for å ta avgjørelser og forutsigelser – det er hjernen i et databasert system og er den "intelligens" som utstilles av maskiner. Maskinlæringsalgoritmer i AI, i tillegg til andre AI-drevne apper, tillater at systemet ikke bare behandler disse dataene, men bruker dem til å utføre oppgaver, lage prognoser, lære og få smartere, uten å behøve mer programmering. De gir AI noe målorientert å gjøre med all slik intelligens og data.
Ja, men bør oppfattes som en forretningsrettet virksomhet, ikke bare en IT-oppgradering. Firmaene som har de beste resultatene med digitale transformasjonsprosjekter, tar en vurdering av eksisterende ressurser og kvalifikasjoner og sikrer at de har de riktige grunnsystemene på plass før de starter.
I forhold til maskinlæring er datavitenskap et subsett; den fokuserer på statistikk og algoritmer, bruker regresjon og klassifiseringsteknikker, og tolker og formidler resultater. Maskinlæring fokuserer på programmering, automatisering, skalering og inkorporering og lagerresultater.
Maskinlæring ser på mønstre og korrelasjoner, den lærer av dem og optimaliserer seg selv etter hvert som den går. Datautvinning brukes som en informasjonskilde for maskinlæring. Datautvinningsteknikker bruker komplekse algoritmer selv og kan bidra til å gi bedre organiserte datasett som maskinlæringsapplikasjonen kan bruke.
De sammenkoblede nevronene med et kunstig nevralt nettverk kalles noder, som er forbundet og klynget i lag. Når en node mottar et numerisk signal, signaliserer det deretter andre relevante nevroner som opererer parallelt. Dyp læring bruker neuralnettverket og er "dyp" fordi det bruker meget store datavolumer og driver med flere lag i nevralt nettverk samtidig.
Maskinlæring er amalgam av flere læringsmodeller, -teknikker og -teknologier, som kan omfatte statistikk. Statistikk fokuserer på å bruke data til å lage prognoser og opprette modeller for analyse.