Vad är maskininlärning?
Maskininlärning är en delmängd av artificiell intelligens (AI) där datorer lär av data och förbättrar med erfarenhet utan att uttryckligen programmeras.
Maskininlärningsdefinition i detalj
Maskininlärning är en delmängd av artificiell intelligens (AI). Det är inriktat på att lära datorer att lära sig av data och att förbättra med erfarenhet – istället för att vara uttryckligen programmerade för att göra det. Inom maskininlärning tränas algoritmer för att hitta mönster och korrelationer i stora dataset och att fatta de bästa besluten och förutsägelserna utifrån den analysen. Maskininlärningsapplikationer förbättras med användning och blir mer korrekta ju mer data de har tillgång till.
Tillämpningar av maskininlärning finns runt omkring oss – i våra hem, våra kundvagnar, våra underhållningsmedier och vår sjukvård.
Hur relaterar maskininlärning till AI?
Maskininlärning – och dess komponenter i djupinlärning och neurala nätverk – passar alla som koncentriska delmängder av AI. AI bearbetar data för att fatta beslut och prognoser. Maskininlärningsalgoritmer gör det möjligt för AI att inte bara bearbeta dessa data, utan att använda dem för att lära sig och bli smartare, utan att behöva ytterligare programmering. Artificiell intelligens är överordnad alla maskininlärningsdelmängder under den. INOM den första delmängden finns maskininlärning; inom det ligger djupinlärning, och sedan neurala nätverk inom det.
Vad är ett neuronnät?
Ett artificiellt neuralt nätverk (ANN) modelleras på neuronerna i en biologisk hjärna. Artificiella neuroner kallas noder och klustras samman i flera lager och fungerar parallellt. När en artificiell neuron tar emot en numerisk signal bearbetar den den och signalerar de andra neuronerna som är kopplade till den. Som i en mänsklig hjärna resulterar neural förstärkning i förbättrad mönsterigenkänning, expertis och övergripande lärande.
Vad är djupinlärning?
Denna typ av maskininlärning kallas "djup" eftersom den innehåller många lager av det neurala nätverket och massiva volymer av komplexa och olikartade data. För att uppnå djupinlärning engagerar sig systemet med flera lager i nätverket och extraherar allt högre utdata. Ett djupinlärningssystem som bearbetar naturbilder och letar efter Gloriosa daisies kommer till exempel – i första lagret – att känna igen en växt. När den rör sig genom de neurala lagren kommer den sedan att identifiera en blomma, sedan en daisy, och slutligen en Gloriosa daisy. Exempel på djupinlärningstillämpningar är taligenkänning, bildklassificering och läkemedelsanalys.
Hur fungerar maskininlärning?
Maskininlärning består av olika typer av maskininlärningsmodeller, med hjälp av olika algoritmiska tekniker. Beroende på uppgifternas art och önskat resultat kan en av fyra inlärningsmodeller användas: övervakad, oövervakad, halvövervakad eller förstärkning. Inom var och en av dessa modeller kan en eller flera algoritmiska tekniker tillämpas – i förhållande till de dataset som används och de avsedda resultaten. Maskininlärningsalgoritmer är i grunden utformade för att klassificera saker, hitta mönster, förutsäga resultat och fatta välgrundade beslut. Algoritmer kan användas en i taget eller kombineras för att uppnå bästa möjliga noggrannhet när komplexa och mer oförutsägbara data är inblandade.
Hur maskininlärningsprocessen fungerar
Vad är handledd inlärning?
Övervakad inlärning är den första av fyra maskininlärningsmodeller. I övervakade inlärningsalgoritmer lärs maskinen av exempel. Övervakade inlärningsmodeller består av ”input”- och ”output”-datapar, där utdata är märkta med önskat värde. Låt oss till exempel säga att målet är att maskinen ska avgöra skillnaden mellan ritningar och rutor. Ett binärt indatapar inkluderar både en bild av en daisy och en bild av en pansy. Det önskade resultatet för just det paret är att välja daisy, så det kommer att föridentifieras som rätt resultat.
Med hjälp av en algoritm sammanställer systemet alla dessa träningsdata över tid och börjar bestämma korrelativa likheter, skillnader och andra punkter av logik – tills det kan förutsäga svaren för daisy-or-pansy frågor helt själv. Det motsvarar att ge ett barn en uppsättning problem med en svarsnyckel, och sedan be dem att visa sitt arbete och förklara sin logik. Övervakade inlärningsmodeller används i många av de applikationer vi interagerar med varje dag, till exempel rekommendationsmotorer för produkter och trafikanalysappar som Waze, som förutspår den snabbaste vägen vid olika tidpunkter på dagen.
Vad är oövervakad inlärning?
Oövervakad inlärning är den andra av de fyra maskininlärningsmodellerna. I oövervakade inlärningsmodeller finns ingen svarsnyckel. Maskinen studerar indata – varav mycket är omärkt och ostrukturerat – och börjar identifiera mönster och korrelationer, med hjälp av alla relevanta, tillgängliga data. På många sätt är oövervakat lärande modellerat på hur människor observerar världen. Vi använder intuition och erfarenhet för att gruppera saker. I takt med att vi upplever fler och fler exempel på något blir vår förmåga att kategorisera och identifiera det allt mer träffsäkert. För maskiner definieras ”erfarenhet” av mängden data som matas in och görs tillgängliga. Vanliga exempel på oövervakade inlärningstillämpningar är ansiktsigenkänning, gensekvensanalys, marknadsforskning och cybersäkerhet.
Vad är semihandledd inlärning?
Halvövervakad inlärning är den tredje av fyra maskininlärningsmodeller. I en perfekt värld skulle alla data struktureras och märkas innan de matas in i ett system. Men eftersom det uppenbarligen inte är möjligt blir halvövervakat lärande en fungerande lösning när det finns stora mängder rådata som inte är strukturerade. Den här modellen består i att mata in små mängder etiketterade data för att utöka ej märkta dataset. I huvudsak fungerar de märkta data för att ge en löpande start på systemet och kan avsevärt förbättra inlärningshastigheten och noggrannheten. En halvövervakad inlärningsalgoritm instruerar maskinen att analysera etiketterade data för korrelativa egenskaper som kan tillämpas på data utan etikett.
Som undersöks ingående i denna MIT Press forskningsrapport, finns det dock risker förknippade med denna modell, där brister i de märkta data lär sig och replikeras av systemet. Företag som mest framgångsrikt använder semi-övervakad inlärning säkerställer att protokoll för bästa praxis finns på plats. Halvövervakad inlärning används inom tal- och språkanalys, komplex medicinsk forskning såsom proteinkategorisering och bedrägeridetektering på hög nivå.
Vad är förstärkningsinlärning?
Förstärkningsinlärning är den fjärde maskininlärningsmodellen. I övervakad inlärning får maskinen svarsnyckeln och lär sig genom att hitta korrelationer bland alla korrekta resultat. Förstärkningsmodellen innehåller inte en svarsnyckel utan anger snarare en uppsättning tillåtna åtgärder, regler och potentiella slutstatusar. När det önskade målet för algoritmen är fast eller binär, kan maskiner lära sig genom exempel. Men i de fall där det önskade resultatet är muterbart måste systemet lära sig av erfarenhet och belöning. I förstärkningsinlärningsmodeller är ”belöningen” numerisk och programmeras in i algoritmen som något som systemet försöker samla in.
På många sätt är denna modell likartad med att lära någon hur man spelar schack. Visst skulle det vara omöjligt att försöka visa dem varje potentiellt drag. Istället förklarar du reglerna och de bygger upp sin skicklighet genom praktik. Belöningar kommer i form av att inte bara vinna spelet, utan också förvärva motståndarens pjäser. Tillämpningar av förstärkning lärande inkluderar automatiserad prisupphandling för köpare av online-reklam, dataspelsutveckling och börshandel med höga insatser.
Enterprise-maskininlärning pågår
Maskininlärningsalgoritmer känner igen mönster och korrelationer, vilket innebär att de är mycket bra på att analysera sin egen ROI. För företag som investerar i maskininlärningsteknik möjliggör denna funktion en nästan omedelbar bedömning av den operativa effekten. Nedan är bara ett litet exempel på några av de växande områdena av företag maskininlärning applikationer.
Rekommendationsmotorer: Från 2009 till 2017 ökade antalet amerikanska hushåll som abonnerade på videoströmningstjänster med 450 procent. Och en 2020 artikel i tidningen Forbes rapporterar ytterligare en spik i siffror för videoströmmande användning på upp till 70 procent. Rekommendationsmotorer har applikationer över många detaljhandels- och shoppingplattformar, men de kommer definitivt till sin rätt med strömmande musik och videotjänster.
Dynamisk marknadsföring: För att generera leads och föra dem genom säljtratten krävs det att du kan samla in och analysera så mycket kunddata som möjligt. Moderna konsumenter genererar en enorm mängd varierad och ostrukturerad data – från chatttranskript till bilduppladdningar. Användningen av maskininlärningsapplikationer hjälper marknadsförare att förstå dessa data – och använda dem för att leverera anpassat marknadsföringsinnehåll och engagemang i realtid med kunder och leads.
ERP- och processautomatisering: ERP-databaser innehåller breda och olika dataset, vilket kan inkludera statistik över försäljningsresultat, kundrecensioner, marknadstrendrapporter och poster för hantering av försörjningskedjan. Maskininlärningsalgoritmer kan användas för att hitta korrelationer och mönster i sådana data. Dessa insikter kan sedan användas för att informera i stort sett alla delar av verksamheten, inklusive optimering av arbetsflöden för internet of Things-enheter (IoT) inom nätverket eller de bästa sätten att automatisera repetitiva eller felbenägna uppgifter.
Prediktivt underhåll: Moderna försörjningskedjor och smarta fabriker använder i allt högre grad IoT-enheter och -maskiner, samt molnkonnektivitet i alla sina flottor och verksamheter. Nedbrytningar och ineffektivitet kan leda till enorma kostnader och störningar. När data för underhåll och reparation samlas in manuellt är det nästan omöjligt att förutsäga potentiella problem – än mindre automatisera processer för att förutsäga och förhindra dem. IoT-gateway-sensorer kan monteras på även flera decennier gamla analoga maskiner, vilket ger insyn och effektivitet i hela verksamheten.
Maskininlärningsutmaningar
I sin bok Spurious CorRelations påpekar datavetaren och Harvardforskaren Tyler Vigan att ”Alla korrelationer tyder inte på ett underliggande orsakssamband.” För att illustrera detta inkluderar han ett diagram som visar ett till synes starkt samband mellan margarinkonsumtion och skilsmässofrekvensen i delstaten Maine. Det här diagrammet är förstås tänkt att göra en humoristisk poäng. Men på ett allvarligare sätt är maskininlärningsapplikationer sårbara för både mänskliga och algoritmiska bias och fel. Och på grund av deras benägenhet att lära sig och anpassa sig kan fel och falska korrelationer snabbt sprida och förorena resultat över det neurala nätverket.
En ytterligare utmaning kommer från maskininlärningsmodeller, där algoritmen och dess utdata är så komplexa att de inte kan förklaras eller förstås av människor. Detta kallas en ”black box”-modell och det sätter företag i riskzonen när de inte kan avgöra hur och varför en algoritm kom fram till en viss slutsats eller ett visst beslut.
Som tur är ökar komplexiteten hos dataset och maskininlärningsalgoritmer, så gör de verktyg och resurser som finns tillgängliga för att hantera risker. De bästa företagen arbetar för att eliminera fel och partiskhet genom att upprätta robusta och uppdaterade riktlinjer för AI-styrning och protokoll för bästa praxis.