Cos'è la modellazione dei dati?

La modellazione dei dati è il processo di generazione di diagrammi dei flussi di dati.

Panoramica della modellazione dei dati

La modellazione dei dati è il processo di generazione di diagrammi dei flussi di dati. Durante la creazione di una struttura di database nuova o alternativa, il progettista inizia con un diagramma del flusso di dati in entrata e in uscita dal database. Questo diagramma di flusso servirà a definire le caratteristiche dei formati di dati, le strutture e le funzioni di gestione del database per supportare in modo efficiente i requisiti del flusso di dati. Dopo la creazione e la distribuzione del database, il modello di dati permane e diventa la documentazione e la giustificazione dell'esistenza del database e della modalità di progettazione dei flussi di dati.

 

Il modello di dati risultante da questo processo offre sia un quadro delle relazioni tra gli elementi dati all'interno di un database sia una guida all'uso dei dati. I modelli di dati sono un elemento fondante dello sviluppo e dell'analisi software. Essi forniscono un metodo standardizzato per la definizione e la formattazione coerente dei contenuti del database in tutti i sistemi e consentono ad applicazioni diverse di condividere gli stessi dati.

Perché la modellazione dei dati è importante?

Un modello di dati completo e ottimizzato contribuisce a creare un database logico semplificato che elimina la ridondanza, riduce i requisiti di archiviazione e consente un recupero efficiente. Esso inoltre offre a tutti i sistemi una fonte unica di informazioni affidabili, essenziale per il funzionamento efficace e per una conformità comprovabile alle norme e ai requisiti normativi. La modellazione dei dati rappresenta un passo fondamentale in due funzioni vitali di un'impresa digitale.

Progetti di sviluppo software (nuovi o personalizzazioni) eseguiti da professionisti IT

Prima di progettare e realizzare un qualsiasi progetto software, deve esserci una visione documentata dell'aspetto e del comportamento del prodotto finale. Una parte importante di tale visione è l'insieme di regole aziendali che governano la funzionalità desiderata. L'altra parte è la descrizione dei dati, ovvero i flussi di dati (o il modello di dati) e il design del database che lo supporterà.

La modellazione dei dati tiene traccia della visione e offre una road map ai progettisti software. Una volta che il database e i flussi di dati sono stati interamente definiti e documentati e i sistemi sono stati sviluppati secondo quelle specifiche, i sistemi dovranno fornire la funzionalità prevista necessaria per mantenere accurati i dati (a patto che la procedura sia stata seguita correttamente).

Analisi e visualizzazione o business intelligence: uno strumento decisionale fondamentale per gli utenti

 

Con volumi di dati progressivamente più elevati e numeri crescenti di utenti, le organizzazioni devono trovare il modo per trasformare i dati grezzi in informazioni utilizzabili nel processo decisionale. Non sorprende che la domanda di analisi dei dati sia cresciuta drasticamente. La visualizzazione dei dati rende i dati ancora più accessibili agli utenti perché li presenta in forma grafica.

 

I modelli di dati odierni trasformano i dati grezzi in informazioni utili che possono diventare visualizzazioni dinamiche. La modellazione dei dati prepara i dati per l'analisi: pulisce i dati, definisce le misure e le dimensioni e amplia i dati mediante la definizione di gerarchie, l'impostazione di unità e valute e l'aggiunta di formule.

Quali sono i tipi di modellazione di dati?

I tre tipi principali di modelli di dati sono relazionale, dimensionale ed Entità-Relazione (E-R). Ve ne sono molti altri, che però non vengono comunemente utilizzati, e comprendono il modello gerarchico, di rete, orientato all'oggetto e multivalore. Il tipo di modello definisce la struttura logica, ossia il modo in cui i dati sono archiviati logicamente e, pertanto, la modalità di archiviazione, organizzazione e recupero.

  1. Relazionale: sebbene rappresenti un approccio “più vecchio”, il modello di database più comune ancora in uso è quello relazionale, che archivia i dati in record di formato fisso e li organizza in tabelle con righe e colonne. Il tipo di modello di dati più semplice presenta due elementi: misure e dimensioni. Le misure sono valori numerici, quali quantità o ricavi, utilizzati nei calcoli matematici come le operazioni di somma o di calcolo della media. Le dimensioni possono essere numeriche o di testo. Non vengono utilizzate nei calcoli e includono descrizioni o posizioni. I dati grezzi vengono definiti come misura o dimensione. Altri termini utilizzati nella progettazione dei database relazionali sono "relazioni" (la tabella con righe e colonne), "attributi" (colonne), "tuple" (righe) e "dominio" (set di valori ammessi in una colonna). Sebbene un database relazionale sia definito da vari termini e requisiti strutturali, il fattore importante è rappresentato dalle relazioni definite all'interno di tale struttura. Gli elementi dati comuni (o chiavi) collegano le tabelle e i set di dati. Le tabelle possono essere correlate anche in modo esplicito, per esempio con relazioni tra elementi sovraordinati e subordinati, tra cui uno a uno, uno a molti o molti a molti.
  2. Dimensionale: l'approccio dimensionale, meno rigido e strutturato, favorisce una struttura di dati contestuale più adatta all'utilizzo o al contesto aziendale. Questa struttura di database è ottimizzata per le query online e gli strumenti di data warehousing. Gli elementi dati fondamentali, per esempio una quantità di transazione, sono definiti "fatti" e sono accompagnati da informazioni di riferimento chiamate "dimensioni", che possono essere ID prodotto, prezzo unitario o data della transazione. Una tabella di fatti è una tabella primaria in un modello dimensionale. Il recupero può essere rapido ed efficiente – perché i dati di un determinato tipo di attività sono archiviati insieme – ma la mancanza di collegamenti relazionali può rendere più complicato il recupero e l'utilizzo dei dati. Poiché la struttura dei dati è legata alla funzione aziendale che produce e utilizza i dati, la combinazione dei dati prodotti da sistemi diversi (per esempio in un data warehouse) può essere problematica.
  3. Entità-Relazione (E-R): un modello E-R rappresenta una struttura di dati aziendali in formato grafico contenente caselle di varie forme che rappresentano attività, funzioni o "entità" e righe che rappresentano associazioni, dipendenze o "relazioni". Il modello E-R viene quindi utilizzato per creare un database relazionale in cui ogni riga rappresenta un'entità e i campi in quella riga contengono attributi. Come in tutti i database relazionali, gli elementi dati "chiave" vengono utilizzati per collegare le tabelle tra loro.

Quali sono i tre livelli di astrazione dei dati?

Vi sono molti tipi di modelli di dati, con diversi tipi di layout possibili. La comunità di elaborazione dei dati individua tre tipi di modellazione per la rappresentazione di livelli di pensiero durante lo sviluppo dei modelli.

Modello di dati concettuale

 

Questo è il modello della "visione d'insieme" che rappresenta la struttura e il contenuto complessivi, ma non il dettaglio del piano di dati. Si tratta del tipico punto di partenza per la modellazione dei dati e identifica i vari set di dati e il flusso di dati dell'organizzazione. Il modello concettuale è il progetto generale per lo sviluppo dei modelli logici e fisici e costituisce una parte importante della documentazione sull'architettura dei dati.

 

Modello di dati logico

 

Il secondo livello di dettaglio è quello del modello di dati logico. Esso è correlato più strettamente alla definizione generale di "modello di dati", poiché descrive il flusso di dati e il contenuto del database. Il modello logico aggiunge dettagli alla struttura complessiva del modello concettuale, ma non include specifiche relative allo stesso database, poiché il modello può essere applicato a varie tecnologie e a vari prodotti di database. (Se il progetto è relativo a una singola applicazione o a un altro sistema limitato, il modello concettuale potrebbe non essere presente).

 

Modello di dati fisico

 

Il modello di dati fisico descrive le specifiche della modalità di realizzazione del modello logico. Esso deve contenere dettagli a sufficienza per consentire ai tecnici di creare l'effettiva struttura del database in hardware e software a supporto delle applicazioni che lo utilizzeranno. Ovviamente, il modello di dati fisico è specifico di un sistema software di database designato. Se si utilizzano diversi sistemi di database, possono esserci vari modelli fisici derivati da un singolo modello logico.

Processo e tecniche di modellazione di dati

La modellazione di dati è un processo intrinsecamente top-down che parte dal modello concettuale per stabilire la visione complessiva, poi passa al modello logico e infine alla progettazione dettagliata contenuta nel modello fisico.

 

La creazione del modello concettuale è essenzialmente un processo di conversione di idee in formato grafico che assomiglia al diagramma di flusso di un programmatore.

 

I moderni strumenti di modellazione di dati possono aiutare a definire e a creare i modelli di dati e i database logici e fisici. Di seguito, vengono illustrate alcune tipiche tecniche e fasi di modellazione di dati:

  • Determinazione delle entità e creazione di un diagramma Entità-Relazione (ERD). Le entità possono essere descritte meglio come "elementi dati interessanti per la propria azienda". Per esempio, un'entità potrebbe essere "cliente", un'altra "vendite". In un diagramma Entità-Relazione, si documentano le relazioni che intercorrono tra queste diverse entità all'interno dell'azienda e le connessioni generali che esistono tra loro.

  • Definizione di fatti, misure e dimensioni. Un fatto rappresenta una parte dei dati che indica un'occorrenza o una transazione specifica, per esempio la vendita di un prodotto. Le misure sono quantitative, quali quantità, ricavi, costi e così via. Le dimensioni sono misure qualitative, quali descrizioni, posizioni e date.

  • Creazione di un collegamento alla vista dei dati tramite strumento grafico o query SQL. Se non si ha familiarità con SQL, lo strumento grafico è l'opzione più intuitiva, perché consente di trascinare e rilasciare elementi nel modello e di creare visivamente i collegamenti. Durante la creazione di una vista, è possibile combinare in un unico output tabelle o addirittura altre viste. Quando si seleziona una fonte nella vista grafica e la si trascina sopra una fonte già associata all'output, è possibile scegliere di collegare o di creare un'unione di queste tabelle.

Le moderne soluzioni di analisi possono inoltre aiutare a selezionare, filtrare e collegare le fonti di dati tramite una visualizzazione grafica di trascinamento e rilascio. Per gli esperti dei dati che normalmente lavorano nel reparto IT sono disponibili strumenti avanzati, ma gli utenti possono anche creare le proprie storie creando visivamente un modello di dati e organizzando tabelle, grafici, mappe e altri oggetti per raccontare una storia basata sulla conoscenza approfondita dei dati.

Esempi di modellazione dei dati

La modellazione dei dati rappresenta una fase preliminare essenziale per tutte le applicazioni – che si tratti di applicazioni aziendali, di intrattenimento, personali o di altro tipo - per la progettazione del sistema e la definizione dell'infrastruttura necessaria per l'abilitazione del sistema. Questo può essere qualsiasi tipo di sistema transazionale, set o suite di applicazioni di elaborazione dei dati o qualsiasi altro sistema che raccolga, crei o utilizzi i dati.

 

La modellazione dei dati è imprescindibile per il data warehousing, perché il data warehouse è un repository di dati provenienti da fonti diverse che probabilmente contiene dati simili o correlati in diversi formati. Innanzitutto è necessario mappare i formati e la struttura del data warehouse per stabilire come modificare ciascun set di dati in entrata per soddisfare le esigenze del progetto del warehouse, in modo che i dati siano utili per l'analisi e il data mining. Il modello di dati quindi è un abilitatore importante per gli strumenti di analisi, i sistemi informatici esecutivi (cruscotti), il data mining e l'integrazione con tutti i sistemi e le applicazioni di dati.

 

Nelle fasi preliminari della progettazione di qualsiasi sistema, la modellazione dei dati rappresenta un prerequisito fondamentale da cui dipendono tutte le altre fasi e gli altri passaggi per stabilire le fondamenta sulle quali si basano tutti i programmi, le funzioni e gli strumenti. Il modello di dati è come un linguaggio comune che consente ai sistemi di comunicare tramite la comprensione e l'accettazione dei dati come descritti nel modello. Questo è più importante che mai nel mondo odierno di big data, machine learning, intelligenza artificiale, connettività cloud, IoT e sistemi distribuiti, compreso l'edge computing.

Evoluzione della modellazione dei dati

In un senso molto reale, la modellazione dei dati esiste da quando esistono l'elaborazione dei dati, l'archiviazione dei dati e la programmazione dei computer, anche se il termine stesso è entrato probabilmente nell'uso comune negli anni '60, nello stesso periodo in cui hanno iniziato a evolversi i sistemi di gestione dei database. Non c'è niente di nuovo o di innovativo nel concetto di pianificazione e di creazione di architetture di nuove strutture. La stessa modellazione dei dati è diventata più strutturata e formalizzata con l'emergere di più dati, più database e più varietà di dati.

 

Oggi la modellazione dei dati è più essenziale che mai, dato che i tecnici hanno a che fare con nuove fonti di dati (sensori IoT, dispositivi di rilevamento della posizione, clickstream e social media), oltre che con un'ondata di dati non strutturati (testo, audio, video, output grezzo di sensori) a volumi e velocità che superano le capacità dei sistemi tradizionali. Vi è una domanda costante di nuovi sistemi, strutture e tecniche di database innovative e di nuovi modelli di dati per collegare questo nuovo sforzo di sviluppo.

Qual è il futuro della modellazione dei dati?

La connettività dell'informazione e grandi quantità di dati da così tante fonti diverse – compresi sensori, voce, video, e-mail e tanto altro – ampliano l'ambito dei progetti di modellazione per i professionisti IT. Internet, ovviamente, è uno degli abilitatori di questa evoluzione. Il cloud rappresenta una parte importante della soluzione, poiché è l'unica infrastruttura di calcolo sufficientemente grande, scalabile e agile da soddisfare i requisiti attuali e futuri nel vasto mondo della connettività in via di espansione.

 

Anche le opzioni di progettazione dei database stanno cambiando. Dieci anni fa, la struttura di database dominante era quella di un database relazionale basato sulle righe che utilizzava una tecnologia tradizionale di archiviazione su disco. I dati di un tipico sistema di gestione dell'inventario o di contabilità generale ERP venivano archiviati in dozzine di tabelle diverse che dovevano essere aggiornate e modellate. Oggi, le moderne soluzioni ERP archiviano i dati attivi in memoria tramite un design a colonne, per ottenere una significativa riduzione del numero di tabelle e un aumento di velocità e di efficienza.

 

Per i professionisti dell'area aziendale, i nuovi strumenti self-service disponibili attualmente continueranno a migliorare. Verranno introdotti nuovi strumenti per rendere la modellazione e la visualizzazione dei dati ancora più semplici e collaborative.

In sintesi

Un modello di dati ben concepito e completo è la chiave dello sviluppo di un database davvero funzionale, utile, sicuro e accurato. Si parte dal modello concettuale per disporre tutti i componenti e le funzioni del modello di dati. Questi piani potranno poi essere perfezionati in un modello di dati logico che descrive i flussi di dati e chiarisce la definizione dei dati necessari e la loro modalità di acquisizione, gestione, archiviazione e distribuzione. Il modello di dati logico gestisce il modello di dati fisico specifico di un prodotto di database e rappresenta il documento di progettazione dettagliato che guida la creazione del database e del software delle applicazioni.

 

Una modellazione dei dati e una progettazione del database di buona qualità sono essenziali per lo sviluppo di sistemi e database di applicazioni funzionali, affidabili e sicuri che funzionano bene con data warehouse e strumenti di analisi, e semplificano lo scambio di dati sia con i business partner che tra vari set di applicazioni. Modelli di dati ben concepiti aiutano a garantire l'integrità dei dati e rendono i dati della tua azienda ancora più preziosi e affidabili.

placeholder

Esplora i moderni strumenti di modellazione dei dati

Collega i dati al contesto aziendale per consentire agli utenti aziendali di sbloccare le conoscenze approfondite.

placeholder

Idee che non troverai da nessun'altra parte

Registrati per ricevere una serie di informazioni di business intelligence direttamente nella tua casella di posta in arrivo.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel