Vai al contenuto
Cavi per computer

Cos'è il data mining?

 

Per comodità dell'utente, questa pagina Web è stata tradotta automaticamente. SAP non fornisce alcuna garanzia circa la correttezza o completezza della traduzione automatica. La pagina web originale inglese può essere trovata utilizzando la mappa del mondo nell'angolo in alto a destra di questa pagina.

Il data mining è il processo di estrazione di informazioni utili da un accumulo di dati, spesso da un data warehouse o da una raccolta di set di dati collegati. Gli strumenti di data mining includono potenti capacità statistiche, matematiche e analitiche il cui scopo principale è quello di passare attraverso grandi insiemi di dati per identificare tendenze, modelli e relazioni a supporto di processi decisionali e di pianificazione informati.

 

Spesso associato alle richieste dei reparti di marketing, il data mining è visto da molti dirigenti come un modo per aiutarli a comprendere meglio la domanda e per vedere l'effetto che i cambiamenti nei prodotti, nei prezzi o nelle promozioni hanno sulle vendite. Ma il data mining ha notevoli vantaggi anche per altre aree commerciali. Ingegneri e progettisti possono analizzare l'efficacia delle modifiche dei prodotti e cercare le possibili cause del successo o del fallimento del prodotto in relazione a come, quando e dove vengono utilizzati i prodotti. Le operazioni di servizio e riparazione possono pianificare meglio lo stock e l'allocazione dei pezzi di ricambio. Le aziende di servizi professionali possono utilizzare il data mining per individuare nuove opportunità derivanti da tendenze economiche in evoluzione e cambiamenti demografici.

 

Il data mining diventa più utile e prezioso con insiemi di dati più grandi e con una maggiore esperienza utente. Logicamente, più dati, più informazioni e più intelligenza dovrebbero essere sepolti lì. Inoltre, man mano che gli utenti acquisiscono maggiore dimestichezza con gli strumenti e capiscono meglio il database, più creativi possono essere le loro esplorazioni e analisi.

Perché utilizzare il data mining?

Il vantaggio principale del data mining è il suo potere di identificare modelli e relazioni in grandi volumi di dati provenienti da più fonti. Con un numero sempre maggiore di dati disponibili, provenienti da fonti diverse come social media, sensori remoti e report sempre più dettagliati sul movimento dei prodotti e sulle attività di mercato, il data mining offre gli strumenti per sfruttare appieno i Big Data e trasformarli in intelligenza fruibile. Inoltre, può fungere da meccanismo per “pensare fuori dagli schemi”.

 

Il processo di data mining è in grado di rilevare relazioni e modelli sorprendenti e intriganti in bit di informazioni apparentemente non correlati. Poiché l'informazione tende ad essere compartimentalizzata, storicamente è stato difficile o impossibile analizzarla nel suo insieme. Tuttavia, può esistere una relazione tra fattori esterni (forse demografici o economici) e le prestazioni dei prodotti di un’azienda. Inoltre, mentre i dirigenti esaminano regolarmente i numeri di vendita per area, linea di prodotti, canale di distribuzione e regione, spesso mancano di un contesto esterno per queste informazioni. La loro analisi sottolinea “quello che è successo” ma serve a poco per scoprire il “perché è successo in questo modo”. Il data mining può colmare questa lacuna.

 

Il data mining può cercare correlazioni con fattori esterni; mentre la correlazione non sempre indica causalità, queste tendenze possono essere indicatori preziosi per orientare le decisioni su prodotti, canali e produzione. La stessa analisi va a vantaggio di altre parti dell'azienda, dalla progettazione dei prodotti all'efficienza operativa e all'erogazione dei servizi.

Storia del data mining

Le persone raccolgono e analizzano i dati da migliaia di anni e, per molti versi, il processo è rimasto invariato: identificare le informazioni necessarie, trovare fonti di dati di qualità, raccogliere e combinare i dati, utilizzare gli strumenti più efficaci disponibili per analizzare i dati e sfruttare ciò che si è appreso. Man mano che i sistemi informatici e basati sui dati sono cresciuti e avanzati, sono cresciuti anche gli strumenti per la gestione e l'analisi dei dati. Il vero punto di svolta arrivò negli anni '60 con lo sviluppo della tecnologia dei database relazionali e di strumenti di query in linguaggio naturale orientati all'utente come Structured Query Language (SQL). I dati non erano più disponibili solo tramite programmi personalizzati. Con questa svolta, gli utenti aziendali possono esplorare in modo interattivo i propri dati e svelare le gemme nascoste dell'intelligence sepolte all'interno.

 

Il data mining è tradizionalmente un insieme di abilità specialistiche all'interno della data science. Ogni nuova generazione di strumenti analitici, tuttavia, inizia richiedendo competenze tecniche avanzate, ma poi si evolve rapidamente per diventare accessibile agli utenti. L’interattività, ovvero la capacità di lasciare che i dati ti parlino, è l'avanzamento fondamentale. Fai una domanda; vedi la risposta. In base a ciò che impari, fai un'altra domanda. Questo tipo di roaming non strutturato attraverso i dati porta l'utente oltre i confini della progettazione di database specifici dell'applicazione e consente la scoperta di relazioni che attraversano i confini funzionali e organizzativi.

 

Il data mining è un componente chiave della business intelligence. Gli strumenti di data mining sono integrati in cruscotti executive, che raccolgono informazioni dai Big Data, inclusi i dati provenienti dai social media, i feed dei sensori di Internet of Things (IoT), i dispositivi sensibili alla posizione, i testi non strutturati, i video e altro ancora. Il data mining moderno si basa sul cloud e virtual computing, nonché sui database in-memory, per gestire i dati provenienti da molte fonti in modo conveniente e scalare su richiesta.

Come funziona il data mining?

Esistono tanti approcci al data mining quanti sono i data miner. L'approccio dipende dal tipo di domande poste e dal contenuto e dall'organizzazione del database o dei set di dati che forniscono la materia prima per la ricerca e l'analisi. Ciò detto, esistono alcune fasi organizzative e preparatorie che dovrebbero essere completate per preparare dati, tool e utenti:
  1. Comprendere il problema, o almeno l’area di indagine. Il responsabile delle decisioni aziendali, che dovrebbe essere al posto di guida di questa avventura off-road di data mining, ha bisogno di una comprensione generale del dominio in cui lavorerà, ossia i tipi di dati interni ed esterni che devono far parte di questa esplorazione. Si presume che abbia un'intima conoscenza dell'azienda e delle aree funzionali coinvolte.
  2. Raccolta dati. Iniziare con i propri sistemi e database interni. Collegarli attraverso i propri modelli di dati e vari strumenti relazionali o raccogliere i dati in un data warehouse. Ciò include tutti i dati provenienti da sorgenti esterne che fanno parte delle proprie operazioni, come dati di vendita e/o servizio sul campo, IoT o dati dei social media. Esaminare e acquisire i diritti su dati esterni, tra cui dati demografici, economici e di mercato, come le tendenze del settore e i benchmark finanziari delle associazioni di categoria e dei governi. Portarli nell'ambito del toolkit (portarli nel proprio data warehouse o collegarli all'ambiente di data mining).
  3. Preparazione e comprensione dei dati. Utilizzare gli esperti business per definire, categorizzare e organizzare i dati. Questa parte del processo è talvolta chiamata wrangling o munging di dati. Alcuni dati potrebbero necessitare di pulizia o “ripulitura” per rimuovere duplicazioni, inconsistenze, record incompleti o formati obsoleti. La preparazione e la ripulitura dei dati possono essere un'attività continua man mano che diventano di interesse nuovi progetti o dati provenienti da nuovi campi di indagine.
  4. Formazione degli utenti. Daresti a tuo figlio le chiavi della Ferrari senza fargli seguire una lezione di guida e un addestramento su strada con un conducente esperto? Quindi assicurati di fornire una formazione formale ai tuoi futuri data miner e qualche pratica supervisionata man mano che iniziano a familiarizzare con questi potenti strumenti. Anche la formazione continua è una buona idea una volta padroneggiati i fondamenti e possono passare a tecniche più avanzate.

Tecniche di data mining

Tenere presente che il data mining si basa su un toolkit piuttosto che su una routine o un processo fisso. Le specifiche tecniche di data mining qui citate sono solo esempi di come gli strumenti vengono utilizzati dalle organizzazioni per esplorare i propri dati alla ricerca di tendenze, correlazioni, intelligence e conoscenze aziendali.

 

In generale, gli approcci di data mining possono essere categorizzati come diretti, focalizzati su uno specifico risultato desiderato, o indiretti, come un processo di scoperta. Altre esplorazioni potrebbero avere lo scopo di ordinare o classificare i dati, per esempio il raggruppamento di clienti potenziali in base ad attributi aziendali quali settore industriale, prodotti, dimensioni e ubicazione. Un obiettivo simile, il rilevamento di valori fuori norma o anomalie, è un metodo automatizzato per riconoscere le anomalie reali (piuttosto che la semplice variabilità) all'interno di un insieme di dati che mostra modelli identificabili.

 

Associazione

Un altro obiettivo interessante è l'associazione, che collega due eventi o attività apparentemente non correlate. Una storia, forse fittizia, dei primi tempi dell'analisi e data mining, racconta di una catena di minimarket che scopre una correlazione tra le vendite di birra e pannolini. Ipotizzando che i neo-papà tormentati escono a tarda sera per acquistare i pannolini e possano afferrare anche un paio di confezioni di birra mentre sono lì. I negozi posizionano la birra e i pannolini in stretta prossimità e aumentano di conseguenza le vendite di birra.

 

Clustering

Questo approccio è volto a raggruppare i dati in base ad analogie piuttosto che a supposizioni predefinite. Per esempio, quando si rilevano le informazioni sulle vendite dei clienti combinate con il credito al consumo esterno e i dati demografici, è possibile scoprire che i clienti più redditizi provengono da città di medie dimensioni.

Gran parte del tempo, il data mining viene perseguito a supporto della previsione. Migliore è la comprensione di modelli e comportamenti, migliore sarà il lavoro di previsione delle azioni future legate a causalità o correlazioni.

 

Regressione

Una delle tecniche matematiche offerte nei kit di strumenti di data mining, l'analisi di regressione prevede un numero basato su modelli storici proiettati nel futuro. Vari altri algoritmi di tracciamento e rilevamento di pattern forniscono strumenti flessibili per aiutare gli utenti a comprendere meglio i dati e il comportamento che rappresenta.

Queste sono solo alcune delle tecniche e degli strumenti disponibili nei kit di strumenti di data mining. La scelta del tool o della tecnica è in qualche modo automatizzata in quanto le tecniche saranno applicate in base a come viene posta la domanda. In epoche precedenti, il data mining era indicato come "slicing and dicing", ma ora la pratica è più sofisticata e termini come associazione, clustering e regressione sono all'ordine del giorno.

Casi di utilizzo ed esempi

Il data mining è fondamentale per l'analisi del sentiment, l'ottimizzazione dei prezzi, il database marketing, la gestione del rischio di credito, la formazione e il supporto, il rilevamento delle frodi, le diagnosi sanitarie e mediche, la valutazione del rischio, i sistemi di raccomandazione ("i clienti che hanno acquistato questo prodotto hanno apprezzato anche...") e molto altro ancora. Può essere uno strumento efficace in qualsiasi settore, tra cui il commercio al dettaglio, la distribuzione all'ingrosso, i settori dei servizi, le telecomunicazioni, le comunicazioni, l'assicurazione, l'istruzione, la produzione, l'assistenza sanitaria, il settore bancario, la scienza, l'ingegneria e il marketing online o i social media.

  • Sviluppo di prodotti: le aziende che progettano, realizzano o distribuiscono prodotti fisici possono individuare le opportunità per orientare meglio i propri prodotti analizzando i modelli di acquisto abbinati a dati economici e demografici. Progettisti e ingegneri possono inoltre fare riferimento incrociato al feedback dei clienti e degli utenti, ai record di riparazione e ad altri dati per identificare le opportunità di miglioramento del prodotto.
  • Produzione: le aziende manifatturiere possono monitorare le tendenze di qualità, i dati di riparazione, i tassi di produzione e i dati sulle prestazioni dei prodotti sul campo per individuare le problematiche di produzione. Possono anche riconoscere possibili aggiornamenti di processo che migliorerebbero la qualità, risparmierebbero tempo e costi, migliorerebbero le prestazioni del prodotto e/o indicherebbero la necessità di attrezzature di fabbrica nuove o migliori.
  • Settori dei servizi: nei settori dei servizi, gli utenti possono trovare opportunità simili per il miglioramento dei prodotti incrociando il feedback dei clienti (diretto o dai social media o altre fonti) con servizi, canali, dati sulle prestazioni di pari livello, regione, prezzi, dati demografici, dati economici e altro ancora.

Infine, tutti questi risultati dovrebbero essere ripresi nella previsione e nella pianificazione, in modo che l'intera organizzazione sia in grado di realizzare i cambiamenti previsti nella domanda sulla base di una conoscenza più approfondita del cliente e di essere meglio posizionata per sfruttare le nuove opportunità identificate.

Sfide nel data mining

  • Big Data: i dati vengono generati a un ritmo sempre più rapido, offrendo sempre più opportunità di data mining. Tuttavia, i moderni strumenti di data mining sono necessari per estrarre il "significato" dai Big Data, dato l'elevato volume, l'alta velocità e la grande varietà di strutture di dati, nonché il crescente volume di dati non strutturati. Molti sistemi esistenti faticano a gestire, immagazzinare e sfruttare questo flusso di input.
  • Competenza degli utenti: gli strumenti di data mining e analisi sono progettati per aiutare gli utenti e i responsabili decisionali a dare un senso e ottenere insight da masse di dati. Sebbene altamente tecnici, questi potenti strumenti sono ora confezionati con un eccellente design di esperienza utente in modo che praticamente chiunque possa utilizzarli con una formazione minima. Tuttavia, per ottenere tutti i vantaggi, l'utente deve comprendere i dati disponibili e il contesto commerciale delle informazioni che sta cercando. Devono anche sapere, almeno in generale, come funzionano gli strumenti e cosa possono fare. Questo non va al di là della portata del manager medio o del dirigente, ma è un processo di apprendimento e gli utenti devono sforzarsi di sviluppare questa nuova serie di abilità.
  • Qualità e disponibilità dei dati: con masse di nuovi dati, ci sono anche masse di dati incompleti, errati, ingannevoli, fraudolenti, danneggiati o semplicemente inutili. Gli strumenti possono aiutare a risolvere il problema, ma gli utenti devono essere costantemente consapevoli della fonte dei dati e della loro credibilità e affidabilità. Importanti sono anche le preoccupazioni legate alla privacy, sia per quanto riguarda l'acquisizione dei dati sia per la cura e la gestione una volta in suo possesso.
placeholder

Espandi le tue competenze in materia
di gestione dei dati

Comprendi il processo di gestione dei dati e i suoi vantaggi.

Altri contenuti in questa serie

FAQ sul data mining

Il data mining è il processo di utilizzo di strumenti analitici avanzati per estrarre informazioni utili da un accumulo di dati. Il machine learning è un tipo di intelligenza artificiale (AI) che permette ai sistemi di imparare dall'esperienza. Il data mining può fare uso dell'apprendimento automatico, quando i programmi analitici hanno la capacità di adattare le loro funzionalità in risposta all'analisi dei dati che eseguono.

L'analisi dei dati o l'analisi sono termini generali per l'ampio insieme di pratiche incentrate sull'identificazione di informazioni utili, sulla loro valutazione e sulla fornitura di risposte specifiche. Il data mining è un tipo di analisi dei dati che si concentra sullo studio di grandi insiemi combinati di dati per scoprire modelli, tendenze e relazioni che possono portare a insight e previsioni.

Data science è un termine che include molte tecnologie dell'informazione tra cui statistica, matematica e sofisticate tecniche computazionali applicate ai dati. Il data mining è un caso di utilizzo per la data science incentrata sull'analisi di grandi set di dati da un'ampia gamma di fonti.

Un data warehouse è una raccolta di dati, generalmente provenienti da più fonti (ERP, CRM e così via) che un'azienda combinerà nel magazzino per l'archiviazione e analisi di ampio respiro come il data mining.

SAP Insights Newsletter

placeholder
Abbonati subito

Acquisisci informazioni approfondite iscrivendoti alla nostra newsletter.

Ulteriore lettura

Torna all'inizio