Vad är maskininlärning?

Maskininlärning är en delmängd av artificiell intelligens (AI) där datorer lär av data och förbättrar med erfarenhet utan att uttryckligen programmeras.

Maskininlärningsdefinition i detalj

Maskininlärning är en delmängd av artificiell intelligens (AI). Det är inriktat på att lära datorer att lära sig av data och att förbättra med erfarenhet – istället för att vara uttryckligen programmerade för att göra det. Inom maskininlärning tränas algoritmer för att hitta mönster och korrelationer i stora dataset och att fatta de bästa besluten och förutsägelserna utifrån den analysen. Maskininlärningsapplikationer förbättras med användning och blir mer korrekta ju mer data de har tillgång till.

 

Tillämpningar av maskininlärning finns runt omkring oss – i våra hem, våra kundvagnar, våra underhållningsmedier och vår sjukvård.

Hur relaterar maskininlärning till AI?

Maskininlärning – och dess komponenter i djupinlärning och neurala nätverk – passar alla som koncentriska delmängder av AI. AI bearbetar data för att fatta beslut och prognoser. Maskininlärningsalgoritmer gör det möjligt för AI att inte bara bearbeta dessa data, utan att använda dem för att lära sig och bli smartare, utan att behöva ytterligare programmering. Artificiell intelligens är överordnad alla maskininlärningsdelmängder under den. INOM den första delmängden finns maskininlärning; inom det ligger djupinlärning, och sedan neurala nätverk inom det.

Vad är ett neuronnät?

 

Ett artificiellt neuralt nätverk (ANN) modelleras på neuronerna i en biologisk hjärna. Artificiella neuroner kallas noder och klustras samman i flera lager och fungerar parallellt. När en artificiell neuron tar emot en numerisk signal bearbetar den den och signalerar de andra neuronerna som är kopplade till den. Som i en mänsklig hjärna resulterar neural förstärkning i förbättrad mönsterigenkänning, expertis och övergripande lärande.

 

Vad är djupinlärning?

 

Denna typ av maskininlärning kallas "djup" eftersom den innehåller många lager av det neurala nätverket och massiva volymer av komplexa och olikartade data. För att uppnå djupinlärning engagerar sig systemet med flera lager i nätverket och extraherar allt högre utdata. Ett djupinlärningssystem som bearbetar naturbilder och letar efter Gloriosa daisies kommer till exempel – i första lagret – att känna igen en växt. När den rör sig genom de neurala lagren kommer den sedan att identifiera en blomma, sedan en daisy, och slutligen en Gloriosa daisy. Exempel på djupinlärningstillämpningar är taligenkänning, bildklassificering och läkemedelsanalys.

Hur fungerar maskininlärning?

Maskininlärning består av olika typer av maskininlärningsmodeller, med hjälp av olika algoritmiska tekniker. Beroende på uppgifternas art och önskat resultat kan en av fyra inlärningsmodeller användas: övervakad, oövervakad, halvövervakad eller förstärkning. Inom var och en av dessa modeller kan en eller flera algoritmiska tekniker tillämpas – i förhållande till de dataset som används och de avsedda resultaten. Maskininlärningsalgoritmer är i grunden utformade för att klassificera saker, hitta mönster, förutsäga resultat och fatta välgrundade beslut. Algoritmer kan användas en i taget eller kombineras för att uppnå bästa möjliga noggrannhet när komplexa och mer oförutsägbara data är inblandade.

Hur maskininlärningsprocessen fungerar

Vad är handledd inlärning?

 

Övervakad inlärning är den första av fyra maskininlärningsmodeller. I övervakade inlärningsalgoritmer lärs maskinen av exempel. Övervakade inlärningsmodeller består av ”input”- och ”output”-datapar, där utdata är märkta med önskat värde. Låt oss till exempel säga att målet är att maskinen ska avgöra skillnaden mellan ritningar och rutor. Ett binärt indatapar inkluderar både en bild av en daisy och en bild av en pansy. Det önskade resultatet för just det paret är att välja daisy, så det kommer att föridentifieras som rätt resultat.

 

Med hjälp av en algoritm sammanställer systemet alla dessa träningsdata över tid och börjar bestämma korrelativa likheter, skillnader och andra punkter av logik – tills det kan förutsäga svaren för daisy-or-pansy frågor helt själv. Det motsvarar att ge ett barn en uppsättning problem med en svarsnyckel, och sedan be dem att visa sitt arbete och förklara sin logik. Övervakade inlärningsmodeller används i många av de applikationer vi interagerar med varje dag, till exempel rekommendationsmotorer för produkter och trafikanalysappar som Waze, som förutspår den snabbaste vägen vid olika tidpunkter på dagen.

 

Vad är oövervakad inlärning?

 

Oövervakad inlärning är den andra av de fyra maskininlärningsmodellerna. I oövervakade inlärningsmodeller finns ingen svarsnyckel. Maskinen studerar indata – varav mycket är omärkt och ostrukturerat – och börjar identifiera mönster och korrelationer, med hjälp av alla relevanta, tillgängliga data. På många sätt är oövervakat lärande modellerat på hur människor observerar världen. Vi använder intuition och erfarenhet för att gruppera saker. I takt med att vi upplever fler och fler exempel på något blir vår förmåga att kategorisera och identifiera det allt mer träffsäkert. För maskiner definieras ”erfarenhet” av mängden data som matas in och görs tillgängliga. Vanliga exempel på oövervakade inlärningstillämpningar är ansiktsigenkänning, gensekvensanalys, marknadsforskning och cybersäkerhet.

 

Vad är semihandledd inlärning?

 

Halvövervakad inlärning är den tredje av fyra maskininlärningsmodeller. I en perfekt värld skulle alla data struktureras och märkas innan de matas in i ett system. Men eftersom det uppenbarligen inte är möjligt blir halvövervakat lärande en fungerande lösning när det finns stora mängder rådata som inte är strukturerade. Den här modellen består i att mata in små mängder etiketterade data för att utöka ej märkta dataset. I huvudsak fungerar de märkta data för att ge en löpande start på systemet och kan avsevärt förbättra inlärningshastigheten och noggrannheten. En halvövervakad inlärningsalgoritm instruerar maskinen att analysera etiketterade data för korrelativa egenskaper som kan tillämpas på data utan etikett.

 

Som undersöks ingående i denna MIT Press forskningsrapport, finns det dock risker förknippade med denna modell, där brister i de märkta data lär sig och replikeras av systemet. Företag som mest framgångsrikt använder semi-övervakad inlärning säkerställer att protokoll för bästa praxis finns på plats. Halvövervakad inlärning används inom tal- och språkanalys, komplex medicinsk forskning såsom proteinkategorisering och bedrägeridetektering på hög nivå.

 

Vad är förstärkningsinlärning?

 

Förstärkningsinlärning är den fjärde maskininlärningsmodellen. I övervakad inlärning får maskinen svarsnyckeln och lär sig genom att hitta korrelationer bland alla korrekta resultat. Förstärkningsmodellen innehåller inte en svarsnyckel utan anger snarare en uppsättning tillåtna åtgärder, regler och potentiella slutstatusar. När det önskade målet för algoritmen är fast eller binär, kan maskiner lära sig genom exempel. Men i de fall där det önskade resultatet är muterbart måste systemet lära sig av erfarenhet och belöning. I förstärkningsinlärningsmodeller är ”belöningen” numerisk och programmeras in i algoritmen som något som systemet försöker samla in.

 

På många sätt är denna modell likartad med att lära någon hur man spelar schack. Visst skulle det vara omöjligt att försöka visa dem varje potentiellt drag. Istället förklarar du reglerna och de bygger upp sin skicklighet genom praktik. Belöningar kommer i form av att inte bara vinna spelet, utan också förvärva motståndarens pjäser. Tillämpningar av förstärkning lärande inkluderar automatiserad prisupphandling för köpare av online-reklam, dataspelsutveckling och börshandel med höga insatser.

Enterprise-maskininlärning pågår

Maskininlärningsalgoritmer känner igen mönster och korrelationer, vilket innebär att de är mycket bra på att analysera sin egen ROI. För företag som investerar i maskininlärningsteknik möjliggör denna funktion en nästan omedelbar bedömning av den operativa effekten. Nedan är bara ett litet exempel på några av de växande områdena av företag maskininlärning applikationer.

  • Rekommendationsmotorer: Från 2009 till 2017 ökade antalet amerikanska hushåll som abonnerade på videoströmningstjänster med 450 procent. Och en 2020 artikel i tidningen Forbes rapporterar ytterligare en spik i siffror för videoströmmande användning på upp till 70 procent. Rekommendationsmotorer har applikationer över många detaljhandels- och shoppingplattformar, men de kommer definitivt till sin rätt med strömmande musik och videotjänster.

  • Dynamisk marknadsföring: För att generera leads och föra dem genom säljtratten krävs det att du kan samla in och analysera så mycket kunddata som möjligt. Moderna konsumenter genererar en enorm mängd varierad och ostrukturerad data – från chatttranskript till bilduppladdningar. Användningen av maskininlärningsapplikationer hjälper marknadsförare att förstå dessa data – och använda dem för att leverera anpassat marknadsföringsinnehåll och engagemang i realtid med kunder och leads.

  • ERP- och processautomatisering: ERP-databaser innehåller breda och olika dataset, vilket kan inkludera statistik över försäljningsresultat, kundrecensioner, marknadstrendrapporter och poster för hantering av försörjningskedjan. Maskininlärningsalgoritmer kan användas för att hitta korrelationer och mönster i sådana data. Dessa insikter kan sedan användas för att informera i stort sett alla delar av verksamheten, inklusive optimering av arbetsflöden för internet of Things-enheter (IoT) inom nätverket eller de bästa sätten att automatisera repetitiva eller felbenägna uppgifter.

  • Prediktivt underhåll: Moderna försörjningskedjor och smarta fabriker använder i allt högre grad IoT-enheter och -maskiner, samt molnkonnektivitet i alla sina flottor och verksamheter. Nedbrytningar och ineffektivitet kan leda till enorma kostnader och störningar. När data för underhåll och reparation samlas in manuellt är det nästan omöjligt att förutsäga potentiella problem – än mindre automatisera processer för att förutsäga och förhindra dem. IoT-gateway-sensorer kan monteras på även flera decennier gamla analoga maskiner, vilket ger insyn och effektivitet i hela verksamheten.

Maskininlärningsutmaningar

I sin bok Spurious CorRelations påpekar datavetaren och Harvardforskaren Tyler Vigan att ”Alla korrelationer tyder inte på ett underliggande orsakssamband.” För att illustrera detta inkluderar han ett diagram som visar ett till synes starkt samband mellan margarinkonsumtion och skilsmässofrekvensen i delstaten Maine. Det här diagrammet är förstås tänkt att göra en humoristisk poäng. Men på ett allvarligare sätt är maskininlärningsapplikationer sårbara för både mänskliga och algoritmiska bias och fel. Och på grund av deras benägenhet att lära sig och anpassa sig kan fel och falska korrelationer snabbt sprida och förorena resultat över det neurala nätverket.

 

En ytterligare utmaning kommer från maskininlärningsmodeller, där algoritmen och dess utdata är så komplexa att de inte kan förklaras eller förstås av människor. Detta kallas en ”black box”-modell och det sätter företag i riskzonen när de inte kan avgöra hur och varför en algoritm kom fram till en viss slutsats eller ett visst beslut.

 

Som tur är ökar komplexiteten hos dataset och maskininlärningsalgoritmer, så gör de verktyg och resurser som finns tillgängliga för att hantera risker. De bästa företagen arbetar för att eliminera fel och partiskhet genom att upprätta robusta och uppdaterade riktlinjer för AI-styrning och protokoll för bästa praxis.

Vanliga frågor om maskininlärning

Maskininlärning är en delmängd av AI och kan inte finnas utan den. AI använder och bearbetar data för att fatta beslut och förutsäga – det är hjärnan i ett datorbaserat system och är den ”intelligens” som ställs ut av maskiner. Maskininlärningsalgoritmer inom AI, liksom andra AI-drivna appar, gör det möjligt för systemet att inte bara bearbeta dessa data, men att använda den för att utföra uppgifter, göra förutsägelser, lära sig och bli smartare, utan att behöva någon ytterligare programmering. De ger AI något målinriktat att göra med all denna intelligens och data.

Ja, men det bör ses som en affärsövergripande strävan, inte bara en IT-uppgradering. De företag som har de bästa resultaten med digitala transformationsprojekt gör en oslagbar bedömning av sina befintliga resurser och kompetenser och ser till att de har rätt grundsystem på plats innan de sätter igång.

I förhållande till maskininlärning är datavetenskap en delmängd; den fokuserar på statistik och algoritmer, använder regressions- och klassificeringstekniker samt tolkar och kommunicerar resultat. Maskininlärning fokuserar på programmering, automatisering, skalning och införlivande och lagerhållningsresultat.

Maskininlärning tittar på mönster och korrelationer, den lär sig av dem och optimerar sig själv som den går. Data mining används som informationskälla för maskininlärning. Data mining-tekniker använder komplexa algoritmer själva och kan hjälpa till att ge bättre organiserade dataset för maskininlärningsapplikationen att använda.

De anslutna neuronerna med ett artificiellt neuralt nätverk kallas noder, som är sammankopplade och klustrade i lager. När en nod tar emot en numerisk signal signalerar den sedan andra relevanta neuroner, som verkar parallellt. Deep learning använder det neurala nätverket och är ”djupt” eftersom det använder mycket stora datavolymer och engagerar sig med flera lager i det neurala nätverket samtidigt.

Maskininlärning är amalgam av flera inlärningsmodeller, tekniker och tekniker, som kan innehålla statistik. Statistiken i sig fokuserar på att använda data för att göra prediktioner och skapa modeller för analys.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel