flex-height
text-black

Beursgegevens

Wat is datamining?

Datamining is het extraheren van nuttige informatie uit grote datasets, met behulp van machine learning en andere tools om patronen, afwijkingen en inzichten voor besluitvorming te ontdekken.

default

{}

default

{}

primary

default

{}

secondary

Overzicht datamining

In dit digitale tijdperk verzamelen organisaties natuurlijk steeds grotere hoeveelheden data, en veel leidinggevenden zien het vandaag de dag als een schat aan bruikbare inzichten. Wat is datamining en hoe vergemakkelijkt het de extractie van waardevolle informatie uit datasets? Datamining is het proces van het ontdekken van nuttige informatie uit een accumulatie van data, vaak uit een datawarehouse of een verzameling van gekoppelde datasets. Datamining kan machine learning, statistische analyse en andere krachtige analysetools omvatten die worden gebruikt om grote gegevenssets te doorlopen om trends, verborgen patronen, anomalieën en relaties te identificeren om geïnformeerde besluitvorming en planning te ondersteunen.

Een van de minder voor de hand liggende voordelen van datamining - en een belangrijke reden waarom data mining tegenwoordig belangrijk is - is dat het de accumulatie van data, die dikwijls gepaard gaat met digitalisering, in een voordeel verandert. Naarmate organisaties hun activiteiten steeds meer moderniseren en digitaliseren, hebben ze de neiging om meer en meer data te genereren en te verzamelen. Voor een grote onderneming met enorme datasets biedt datamining dus een efficiënte manier om gebruik te maken van een schat aan informatie die ze al hebben.

Waarom is datamining belangrijk?

Datamining is belangrijk omdat de data van de organisatie een belangrijk onderdeel van business intelligence wordt. Datamining tools zijn ingebouwd in executive dashboards, het verzamelen van inzicht uit big data, waaronder data van sociale media, Internet of Things (IoT) sensorfeeds, locatiebewuste apparaten, ongestructureerde tekst, video en meer. Moderne datamining is gebaseerd op de cloud en virtuele computing, evenals in-memory databases, om data uit vele bronnen kosteneffectief te beheren en op aanvraag te schalen.

Dus wat voor bedrijfswaarde kan datamining bieden? Het belangrijkste voordeel van datamining is haar vermogen om patronen en relaties in grote hoeveelheden data uit meerdere bronnen te identificeren, waaronder sociale media, externe sensoren en andere monitoringapparatuur, steeds gedetailleerdere rapporten over productbeweging en marktactiviteit, en, van cruciaal belang, applicaties en andere software die door de organisatie wordt gebruikt.

Dit betekent twee dingen. Datamining kan mensen in verschillende rollen, in verschillende sectoren, helpen om buiten de kaders te denken door gebruik te maken van een breed scala aan bronnen en onduidelijke relaties en patronen te onthullen in schijnbaar niet-gerelateerde stukjes informatie. Dit maakt datamining belangrijk voor grote organisaties, in het bijzonder voor bedrijven waar informatie meestal wordt versnipperd.

Bovendien strekken de voordelen van datamining zich niet alleen uit tot de verkoop, maar ook tot andere bedrijfsgebieden: dankzij deze capaciteit voor het afbreken van silo's kan het een breed scala aan rollen mogelijk maken. Ingenieurs en ontwerpers kunnen de effectiviteit van productveranderingen analyseren en zoeken naar mogelijke oorzaken van productsucces of -falen. Service- en reparatieactiviteiten kunnen de voorraad en het personeel van onderdelen beter plannen. Professionele serviceorganisaties kunnen data mining gebruiken om nieuwe kansen te identificeren die ontstaan door veranderende economische trends en demografische verschuivingen. Data mining kan zelfs helpen fraude op te sporen, vooral in branches zoals financiën, retail en gezondheidszorg.

Met andere woorden, de potentiële voordelen van datamining omvatten het hele scala aan bedrijfsfuncties: van het helpen verhogen van de omzet en het verlagen van de kosten tot het verbeteren van klantrelaties, het voorkomen van fraude en het finetunen van verkoopprognoses.

Datamining is belangrijk omdat het aanzienlijke bedrijfswaarde kan opleveren voor een reeks doelen, bijvoorbeeld:

Hoe werkt data mining?

Simpel gezegd werkt datamining door machine learning, statistische analyse en andere analytische tools te gebruiken om grote sets ruwe data te analyseren en verborgen patronen te ontdekken die kunnen worden gebruikt om bruikbare inzichten te verkrijgen. De feitelijke technieken en stappen voor datamining zijn afhankelijk van het soort vragen dat wordt gesteld en de inhoud en organisatie van de database of datasets die de grondstof leveren voor het zoeken en analyseren. Dat gezegd hebbende, zijn er enkele stappen die een datamining proces meestal omvat.

Het 5-stappenproces van datamining

1. Verzameling van data:

2. Voorbewerking van data:

3. Modelbouw:

4. Evaluatie:

5. Interpretatie:

Belangrijkste data mining technieken

Classificatie

Een veelvoorkomende techniek voor data mining is het sorteren van nieuwe gegevens in vooraf gedefinieerde categorieën op basis van patronen die zijn geleerd van historische data: bijvoorbeeld klanten groeperen op basis van de vraag of ze waarschijnlijk zullen terugkeren door hun winkelpatronen, betalingshistorie en betrokkenheidsniveaus te analyseren. Dit zou niet alleen helpen belangrijke klantsegmenten te onderscheiden, maar ook je inzicht van je klantrelaties te verdiepen.

Anomaliedetectie

Anomaliedetectie is vooral belangrijk voor doelen als fraudepreventie, netwerkbeveiliging en identiteitsverificatie. Deze data mining kan bijvoorbeeld helpen om ongebruikelijke creditcardactiviteiten op te sporen die afwijken van het typische gebruik van een klant, op basis van factoren zoals onverwachte locaties, ongebruikelijke online aankopen of ongebruikelijk grote bedragen. Maar data mining methoden kunnen ook helpen nieuwe voorspellers te ontdekken die niet minder voor de hand liggen, wat ons naar de volgende data mining techniek brengt.

Clustering

Clustering is een data mining techniek gericht op het ontdekken van natuurlijke groepen op basis van overeenkomsten in data in plaats van vooraf gedefinieerde aannames (in tegenstelling tot classificatie), die uiteindelijk verborgen patronen en relaties onthullen. In het voorbeeld van de creditcard kan clustering extra markeringen voor verdachte activiteit onthullen. Historische gegevens van accounts die slachtoffer zijn geweest van fraudeurs, kunnen bijvoorbeeld aantonen dat een statistisch significant deel van hen een andere overeenkomst heeft: misschien hebben ze allemaal een patroon laten zien van kleine testaankopen bij een bepaalde handelaar, gevolgd door grote transacties. In de toekomst zou dit patroon kunnen worden gebruikt om frauduleuze activiteiten in realtime op te sporen.

Associatieregels

Een andere belangrijke data miningtechniek is associatieregelmining: het koppelen van twee schijnbaar niet-gerelateerde gebeurtenissen of activiteiten. Stel je voor dat je productplaatsing in een supermarkt wilt optimaliseren om de verkoop te maximaliseren. Je hebt geen data mining nodig om te speculeren dat klanten die luiers kopen waarschijnlijk ook andere babyproducten kopen, zoals babydoekjes. Maar deze dataminingtechniek kan andere, minder voor de hand liggende, cross-selling mogelijkheden ontdekken: misschien zul je merken dat klanten die in de zomer wegwerpbestek in voorraad hebben, ook vaker insectenspray en marshmallows kopen. Deze producten zouden normaal gesproken in verschillende producteilanden zitten, maar data mining kan wijzen op een seizoensgebonden winkelmissie: het krijgen van benodigdheden om tijd buiten door te brengen. In dit scenario zou de techniek van de data mining van de associatieregel de detailhandelaar helpen om deze seizoenskans te benutten.

Regressie

Een van de wiskundige dataminingtechnieken, regressie-analyse voorspelt een getal op basis van historische patronen. Het is een klassieke tool die in veel velden en contexten wordt gebruikt, waaronder verkoopprognoses, voorraadprijsvoorspellingen en financiële analyses.

Merk op dat dit slechts een paar van de meest voorkomende soorten datamining technieken zijn die vaak beschikbaar zijn in data mining toolkits.

Toepassingen en voorbeelden van datamining

Voorbeelden van datamining zijn sentimentanalyse, prijsoptimalisatie, databasemarketing, kredietrisicobeheer, training en ondersteuning, fraudedetectie, gezondheidszorg en medische diagnoses, risicobeoordeling, cross-selling en upselling-aanbevelingssystemen, en nog veel meer. En het kan een effectief instrument zijn in vrijwel elke branche, van retail en groothandel tot productie, gezondheidszorg en financiën.

Belangrijkste use cases van datamining

Productontwikkeling

Bedrijven die fysieke producten ontwerpen, maken of distribueren, kunnen datamining gebruiken om kansen te vinden om hun producten beter te richten door inkooppatronen in combinatie met economische en demografische gegevens te analyseren. Ontwerpers en ingenieurs kunnen ook klant- en gebruikersfeedback, reparatierecords en andere gegevens kruisen om mogelijkheden voor productverbetering te identificeren. En zakelijke besluitvormers kunnen zelfs kiezen welke nieuwe soorten producten ze willen introduceren op basis van wat klanten meestal samen met de huidige producten willen kopen.

Voorbeelden van datamining die wordt gebruikt om productontwikkeling te sturen:

Productie

Fabrikanten kunnen kwaliteitstrends, reparatiegegevens, productiesnelheden en productprestatiegegevens uit het veld volgen om productieproblemen te identificeren. Ze kunnen ook mogelijke procesupgrades herkennen die de kwaliteit verbeteren, tijd en middelen besparen, de productprestaties verbeteren en wijzen op de behoefte aan nieuwe of betere fabrieksuitrusting.

Voorbeelden van datamining die wordt gebruikt om productieprocessen te optimaliseren:

Dienstverleningssectoren

In dienstverleningssectoren kunnen bedrijven vergelijkbare kansen voor serviceverbetering vinden door klantfeedback (direct of via sociale media of andere bronnen) te kruisen met specifieke services, kanalen, klantondersteuningscases, prestatiegegevens van collega's, regio, prijzen, demografische gegevens, economische gegevens en andere factoren.

Voorbeelden van datamining die worden gebruikt om klantpersonalisering in de servicesectoren te waarborgen:

Salesprognoses

Ongeacht de branche is datamining van onschatbare waarde voor verkoopprognoses en -planning. Datagedreven inzichten kunnen helpen om schommelingen in de vraag te anticiperen, marktanalyses te verfijnen, prijswijzigingen te voorspellen en nog veel meer.

Voorbeelden van datamining die wordt gebruikt om verkoopprognoses te verfijnen:

Fraudeherkenning

Datamining wordt veel gebruikt bij fraudedetectie – het bovenstaande voorbeeld van creditcard is slechts een van de vele fraudepreventie-toepassingen van datamining. De anomaliedetectietechniek helpt verdachte uitschieters te markeren, maar andere datamining methoden zijn ook nuttig, ze helpen om nieuwe patronen bloot te leggen en de preventiemaatregelen voor fraude voortdurend te verfijnen.

Voorbeelden van datamining die worden gebruikt om fraudedetectie te verbeteren:

Voordelen en uitdagingen van datamining

De meeste nadelen van datamining worden gecompenseerd door de voordelen, maar er zijn bepaalde uitdagingen van datamining waar organisaties zich bewust van moeten zijn.

Big data

Voordeel: er worden steeds meer data gegenereerd, waardoor steeds meer mogelijkheden worden geboden voor datamining en daardoor betere besluitvorming.

Uitdaging: Vanwege het hoge volume, de hoge snelheid en de grote verscheidenheid aan datastructuren, evenals de toenemende prevalentie van ongestructureerde data, hebben bestaande systemen moeite om deze stroom van input te verwerken, op te slaan en te gebruiken. Dus om betekenis uit Big Data te halen, hebben bedrijven geschikte, krachtige software nodig.

Gebruikerscompetentie

Voordeel: tools voor datamining en -analyse kunnen gebruikers en andere belanghebbenden helpen beter geïnformeerde, datagedreven beslissingen te nemen.

Uitdaging: Hoewel tools die worden gebruikt voor datamining veel gebruiksvriendelijker zijn geworden, kost het wel enige training om ze ten volle te benutten. Gebruikers moeten begrijpen welke data beschikbaar zijn, moeten ten minste een algemeen beeld hebben van hoe data mining werkt, en bekwaam zijn in de bedrijfscontext, evenals zorgen over regelgeving en compliance rond het gebruik van data, wat allemaal enige gebruikersopleiding vereist.

Dataprivacy en regelgevend toezicht

Voordeel: personalisering op basis van datagedreven inzichten kan de klantervaring verbeteren.

Uitdaging: Data, en met name gebruikersdata van particulieren, zijn onderworpen aan wettelijk toezicht. De feitelijke procedures en voorschriften op het gebied van gegevensbescherming verschillen echter per regio en zijn nog steeds vatbaar voor veranderingen, dus het kan een uitdaging zijn voor organisaties die gegevens verwerken om bij te blijven.

Kwaliteit en beschikbaarheid van data

Voordeel: Toenemend grote hoeveelheden en verscheidenheid aan beschikbare data maken data mining belangrijker dan ooit.

Uitdaging: Met volumes nieuwe data zijn er ook massa's van onvolledige, onjuiste, misleidende, frauduleuze, beschadigde of gewoon nutteloze data. Gebruikers moeten altijd op de hoogte zijn van de bron van de data, de geloofwaardigheid en betrouwbaarheid ervan, en zorgen met betrekking tot privacy en databescherming; en organisaties moeten verantwoordelijk nemen voor de bescherming van hun eigen data, én die van hun klanten, tegen datalekken en andere vormen van misbruik.

Datamining versus gerelateerde concepten

Datamining versus machine learning

Het verschil tussen datamining en machine learning is dat machine learning een set tools en algoritmen is die getraind zijn om patronen en correlaties te vinden in grote datasets, terwijl datamining het proces is waarbij nuttige informatie wordt gehaald uit een verzameling van data. Machine learning is een van de tools die in datamining wordt gebruikt om voorspellende modellen te bouwen, maar datamining is niet de enige applicatie van machine learning.

Datamining versus analytics

Er is een subtiel verschil tussen datamining en data analytics. Dataanalyse of -analyse zijn algemene termen voor het brede geheel aan praktijken die zijn gericht op het identificeren van nuttige informatie, het evalueren ervan en het geven van specifieke antwoorden. Datamining is een type data-analyse dat is gericht op het graven in grote, gecombineerde sets van data om patronen, trends en relaties te ontdekken die kunnen leiden tot inzichten en voorspellingen.

Datamining versus data science

Data science is niet hetzelfde als datamining, maar de concepten zijn gerelateerd. Data science is een term die veel informatietechnologieën omvat, waaronder statistieken, wiskunde en geavanceerde computertechnieken zoals toegepast op gegevens. Datamining is een use case voor data science gericht op de analyse van grote datasets uit een breed scala aan bronnen met als doel nuttige inzichten te ontdekken.

Datamining versus datawarehouse

Een datawarehouse is een verzameling gegevens, meestal uit meerdere bronnen (ERP, CRM, enzovoort) die een bedrijf samenbrengt in een datawarehouse voor archivering en brede analyses, zoals datamining.

Veelgestelde vragen

Is datamining slecht?
Datamining is niet goed of slecht - het is een hulpmiddel, en zoals de meeste tools, kan het handig zijn wanneer het veilig en correct wordt behandeld. Met andere woorden, datamining kan zeer nuttig zijn voor een organisatie, maar het kan gaan om het omgaan met gevoelige soorten data, waaronder klantdata, dus het vereist strikte naleving van de privacyvoorschriften en adequate beveiliging om de data te beschermen.
Wat zijn de meest voorkomende dataminingtechnieken?
De meest voorkomende dataminingtechnieken zijn associatieregels, anomaliedetectie (ook wel uitschieter detectie genoemd), classificatie, clustering en regressie.
In welke branches wordt datamining gebruikt?
Datamining wordt gebruikt in onderwijs, gezondheidszorg, financiën en investeringen, productie, retail, dienstverlening, telecom, IT en vele andere industrieën. In deze digitale tijd is datamining belangrijk en kan een nuttig hulpmiddel zijn voor zowat elke branche.
Wat zijn de meest voorkomende toepassingen voor datamining?
De meest voorkomende toepassingen voor datamining zijn het informeren van besluitvormers en het verbeteren van strategieën en planning, dus het heeft een breed scala aan toepassingen in productontwikkeling, marketing en communicatie, verkoop, supply chain management (SCM), fraudepreventie, klantenservice en klantervaring, en human resources (HR). Simpel gezegd kan datamining in de meeste bedrijfsgebieden nuttig zijn.