Classificazione testuale e intelligenza artificiale: verso l'integrazione di modelli proprietari, open-source e supervisione umana

Chapter

Publication Date:

2025

abstract:

Lo studio esamina l’efficacia dei large language model (LLM), proprietari e open-source, nei processi di classificazione testuale. Pur confermando le alte prestazioni di modelli chiusi come Chat GPT-4, si evidenzia come gli LLM open-source, ottimizzati tramite fine tuning, possano ottenere risultati comparabili con costi di elaborazione contenuti. Un esercizio di classificazione di post di X (già Twitter) mostra che i modelli open-source (es. Llama-2 e Llama-3) producono classificazioni accurate in forza della loro maggiore flessibilità, pur avendo dimensioni ridotte.
Viene inoltre proposto un approccio ibrido che combina LLM (a sorgente chiusa e open-source) con la supervisione umana, ottimizzando accuratezza e scalabilità nella classificazione. Il metodo si dimostra adatto a contesti di classificazione multidimensionale, tipici delle scienze sociali, migliorando la qualità del risultato, la trasparenza dei processi e riducendo costi e rischi legati alla sicurezza dei dati.

Iris type:

Articolo in Volume

Keywords:

modelli linguistici di grandi dimensioni; fine tuning; open-source e proprietà intellettuale; classificazione testuale; integrazione uomo-AI.

List of contributors:

Carammia, Marcello; Iacus, Stefano M.; Porro, Giuseppe

Authors of the University:

PORRO GIUSEPPE

Handle:

https://irinsubria.uninsubria.it/handle/11383/2202371

Book title:

Diritto, economia, culture e intelligenza artificiale. Presupposti, applicazioni e limiti