flex-height
text-black

primo piano di un monitor con dei dati

Cos'è un grande modello linguistico?

Un grande modello linguistico (LLM, large language model) è un tipo di intelligenza artificiale (AI) che eccelle nelle attività di elaborazione, comprensione e generazione di linguaggio umano. Gli LLM sono particolarmente utili per analizzare, riassumere e creare contenuti in numerosi settori.

default

{}

default

{}

primary

default

{}

secondary

Definizione di grande modello linguistico

Nel campo dell'intelligenza artificiale, gli LLM sono un sottoinsieme appositamente progettato di machine learning, noto come deep learning, che utilizza algoritmi addestrati su grandi set di dati per riconoscere schemi complessi. L'apprendimento da parte degli LLM è il frutto di un addestramento effettuato con enormi quantità di testo. A un livello basilare, imparano a rispondere a richieste degli utenti con contenuti pertinenti e contestuali scritti in linguaggio umano, ossia con le parole e la sintassi usate dalle persone in una normale conversazione.

Come sono correlati gli LLM all'intelligenza artificiale?

Se raffiguriamo l'intelligenza artificiale come una piramide, l'AI occuperà il livello più basso, quello riservato alla tecnologia madre. Al livello successivo troviamo il machine learning, seguito dal deep learning, dalle reti neurali e dall'AI generativa e infine, negli ultimi due livelli più in alto, dai modelli fondativi e dagli LLM. Gli LLM sono una sottocategoria avanzata di AI che lavora soprattutto sulla comprensione, la previsione e la generazione di testo simile a quello umano.

Le applicazioni degli LLM

Gli LLM sono una componente critica per il funzionamento dell'AI generativa, che li rende strumenti di grande efficacia in una serie di operazioni di elaborazione del linguaggio naturale, quali:

Ma soprattutto, oltre alla mera creazione di testo, grazie alla capacità di combinare le informazioni, analizzare i dati e intercettare le tendenze, gli LLM possono adattarsi a casi d'uso specifici. Queste capacità emergenti si estendono a una vasta gamma di campi, ruoli e compiti, che possono andare dal sequenziamento genetico allo sviluppo di farmaci, dalla generazione di codice alla programmazione dei robot, dalla consulenza per investimenti al rilevamento delle frodi. Gli LLM trovano utile impiego anche in applicazioni agricole, nel commercio al dettaglio e nelle risorse umane.

Come funzionano i grandi modelli linguistici?

Gli LLM operano su reti neurali, ossia modelli computazionali con nodi interconnessi in gruppi come i neuroni di un cervello biologico. Questa struttura consente un'elaborazione rapida e parallela dei segnali e migliora le capacità di riconoscimento di schemi e deep learning.

La vera innovazione degli LLM risiede tuttavia nella "transformer architecture" e nei meccanismi di auto-attenzione che permettono ai modelli di ponderare la rilevanza delle diverse parti dei dati di input. Gli LLM sono quindi in grado di prevedere in sequenza ciò che dovrebbe venire dopo, più che eseguire una funzione di completamento automatico. Gli LLM passano al vaglio miliardi o addirittura migliaia di miliardi di set di dati nella loro analisi semantica per elaborare una comprensione del significato delle parole nel contesto specifico in cui vengono utilizzate.

Nel tempo, gli algoritmi di deep learning imparano a prevedere non solo la parola successiva che dovrebbe prendere posto nella frase, ma anche oltre, ossia il paragrafo e talvolta anche il capitolo successivo. Questo processo illustra il modo in cui un LLM getta un ponte tra la struttura sottostante dei dati e i concetti aziendali di base di cui ha bisogno per poter generare contenuti pertinenti.

Come vengono addestrati i grandi modelli linguistici?

A prescindere che vengano implementati in settori come l'industria farmaceutica, il marketing, i servizi finanziari o in qualsiasi altro ambiente, gli LLM devono imparare le regole di un linguaggio e di un dominio, decodificando schemi complessi per acquisire una comprensione approfondita della grammatica, della semantica e dei processi e poi produrre risposte contestualmente precise.

Dati per l'addestramento degli LLM

Nella fase iniziale, gli LLM vengono alimentati con grandi quantità di dati testuali provenienti da fonti di vario tipo. Questo addestramento consiste nell'elaborazione di miliardi di parole provenienti da libri, articoli, siti Web e altri ambienti ricchi di testo. L'eterogeneità e le dimensioni del set di dati sono criteri fondamentali affinché il modello disponga di un'adeguata base di apprendimento.

Processo di addestramento degli LLM

Questa prima fase di addestramento è supervisionata da operatori umani che forniscono al modello conversazioni e altri testi da assimilare. La seconda fase è un addestramento di rinforzo basato sul feedback umano alle risposte date dal modello, che vengono classificate. Il modello viene quindi addestrato in molteplici iterazioni, tra cui l'addestramento senza supervisione, in cui il modello, esposto a materiale testuale, impara a individuare schemi e correlazioni al fine di predire parti del testo stesso, senza istruzioni esplicite.

Fine-tuning dell'LLM dopo l'addestramento

Dopo l'addestramento condotto su un set di dati generico, l'LLM può essere adattato in modo più specifico per ambienti particolari, anche a livello aziendale, tramite un processo detto di "inferenza del modello". Un modello addestrato con dati del mondo reale di pertinenza di un settore e specifici di una organizzazione (di qualunque tipo, da contenuti non strutturati come database a conversazioni con i clienti e ticket di assistenza, fino ai contratti legali) utilizza gli schemi linguistici appresi e le conoscenze acquisite durante il pre-addestramento e il fine-tuning per analizzare i nuovi input. Può quindi interagire in modo più efficace e naturale con gli utenti, essere ottimizzato per applicazioni e casi d'uso specifici e cogliere peculiarità di terminologie e contesti aziendali distinti.

Gli LLM specifici di dominio, per esempio, potrebbero essere addestrati specificamente su tipi di dati medici, scientifici o legali, mentre gli LLM proprietari potrebbero essere addestrati sui dati privati di un'azienda a scopo di competitività e sicurezza.

Una buona pratica per la gestione delle performance del modello consiste nell'aggiornare i dati di addestramento in modo incrementale, aggiungendo elementi quali descrizioni di nuovi prodotti e documenti di policy, ottimizzando così in continuo l'LLM per valorizzarlo al massimo in termini di business.

Risorse necessarie per l'addestramento di un LLM

Uno dei vantaggi più significativi degli LLM risiede nella loro capacità di apprendere e migliorare nel tempo, adattandosi a vari casi d'uso e rispondendo a esigenze aziendali in evoluzione. Dalla predisposizione dell'addestramento di base alla fornitura di funzionalità avanzate con consapevolezza contestuale, ogni fase consiste nell'evoluzione dell'LLM per renderlo più allineato ed efficace a fronte dei requisiti specifici dell'organizzazione.

Quali sono i casi d'uso dei grandi modelli linguistici per le imprese?

Gli LLM si stanno dimostrando così versatili che praticamente ogni settore, in qualsiasi fase, può trarre beneficio dalla loro implementazione in un numero crescente di processi aziendali. Ciò è tanto più vero in quanto i nuovi strumenti personalizzati e interconnessi di LLM consentono a un sempre maggior numero di aziende di adottare e monetizzare le funzionalità dell'AI generativa.

Con il progredire della tecnologia, gli LLM stanno varcando i confini delle semplici applicazioni testuali. Una volta che l'AI generativa ha creato nuovi testi, audio, immagini o video utilizzando una schiera infinita di fonti di dati, un LLM addestrato e messo a punto ha le capacità di comprensione necessarie per immettere questi risultati generati dall'AI in un contesto aziendale.

Gli LLM possono rafforzare e amplificare la potenza dell'AI generativa rendendola ancora più predittiva, adattiva e intelligente. Alcuni LLM sono in grado di collaborare con altri modelli di AI per svolgere compiti più complessi, aiutando le aziende a snellire le operazioni, a migliorare il processo decisionale o a creare customer experience più interattive e personalizzate.

Alla luce delle tante nuove applicazioni rilasciate a ritmo serrato, si prospettano molte possibilità promettenti per il futuro dell'AI e degli LLM nel business.

Le funzionalità di LLM più comuni nelle imprese

Permettendo agli utenti di generare frasi e interi paragrafi coerenti e contestualmente appropriati in risposta a un determinato prompt, gli LLM possono automatizzare un gran numero di attività aziendali:

Casi d'uso degli LLM nella comunicazione tecnica

Gli LLM possono prestare una valida assistenza ai redattori della documentazione tecnica, specie per i compiti più monotoni e ripetitivi e in ambito di controlli di qualità, liberando tempo per attività di maggior valore strategico che non possono prescindere dal fattore umano.

Casi d'uso degli LLM per l'assistenza in loco

Durante gli interventi di assistenza, i tecnici possono chiedere a un bot come riparare una specifica attrezzatura restando sul posto. Dopo aver passato al setaccio i dati, il bot potrebbe impartire istruzioni generate dall'LLM in linguaggio naturale, aprendo così un accesso rapido alle conoscenze degli esperti.

Casi di utilizzo degli LLM per la gestione della supply chain

Nella gestione della supply chain, per esempio, gli LLM possono creare condizioni di efficienza senza precedenti e agilità rivolta al futuro:

Principali settori e aree aziendali che utilizzano gli LLM

Come vengono distribuiti nel business i grandi modelli linguistici?

In un ambiente di produzione, gli LLM vengono generalmente utilizzati con la formula SaaS (Software-as-a-Service), per cui vengono addestrati e ospitati nel cloud e integrati direttamente in applicazioni, prodotti o servizi. Le organizzazioni possono immettere direttamente i propri dati univoci nel modello di AI e ricevere risposte o previsioni su misura, senza dover imparare a progettare o ad addestrare il modello.

Le fasi di integrazione degli LLM nelle applicazioni aziendali

I vantaggi dei grandi modelli linguistici

Gli LLM offrono una serie di vantaggi aziendali di vasta portata, indipendentemente dai settori o casi d'uso specifici:

Le sfide legate ai grandi modelli linguistici

Oltre ai numerosi vantaggi e casi d'uso, gli LLM devono fare i conti anche con una serie di sfide:

Logo SAP

Prodotto SAP

Scopri di più sui grandi modelli linguistici

Approfondisci la conoscenza dell'AI generativa e della tecnologia LLM che la sottende, e impara ad utilizzare l'una e l'altra per ottimizzare le tue applicazioni aziendali.

Visita la pagina

FAQ
Cosa significa LLM?

LLM è la sigla di large language model, un tipo di modello di machine learning/deep learning di grandi dimensioni e in grado di eseguire una varietà di compiti di elaborazione e analisi del linguaggio naturale (NLP), tra cui la traduzione, la classificazione e la generazione di testo, la risposta alle domande in modo conversazionale e il riconoscimento di schemi di dati.

Che differenza c'è tra LLM e AI?

Se raffiguriamo l'intelligenza artificiale come una serie di cerchi concentrici, al centro troverebbe posto l'AI intesa come tecnologia madre. L'anello successivo sarebbe occupato dal machine learning, seguito dal deep learning, dalle reti neurali e dall'AI generativa e infine dai modelli fondativi e dagli LLM. Gli LLM sono un sottoinsieme avanzato di AI che lavora soprattutto sulla comprensione, la previsione e la generazione di testo simile a quello umano.

Logo SAP

Prodotto SAP

Ulteriori informazioni sull'LLM

Approfondisci la conoscenza dell'AI generativa e della tecnologia LLM che la sottende, e impara ad utilizzare l'una e l'altra per ottimizzare le tue applicazioni aziendali.

Visita la pagina

Per saperne di più

tags
4187ae8c-cd0e-40c1-9c57-b7f4b964faed:1b3c5a48-ceb7-41ef-9ef4-ed3056aa76d4/80703328-4f70-42b5-bb93-a92442818df8
limit
3
info
publicationDate