Il nuovo mercato dei dati per addestrare l’Ia

repubblica.it, 23 marzo 2026

Il nuovo mercato dei dati per addestrare l’Ia

Nella prima fase dell’IA moderna che ha portato – per intenderci – al lancio di ChatGpt, le aziende hanno sfruttato, più o meno legalmente, enormi archivi già presenti sul web per addestrare modelli generativi capaci di imitare capacità cognitive tipicamente umane.
Oggi che i contenuti di internet sono esauriti, molte società stanno progettando prodotti, servizi e persino forme di lavoro con l’obiettivo di produrre dati nuovi e più specifici per l’addestramento dell’intelligenza artificiale.
Il caso Pokémon Go e il valore dei dati geospaziali
Quando nel marzo 2025 Niantic – azienda statunitense leader nello sviluppo di videogiochi per dispositivi mobili basati sulla realtà aumentata – ha venduto la propria divisione di videogiochi – inclusi Pokémon Go, Pikmin Bloom e Monster Hunter Now – alla società di mobile gaming Scopely per circa 3,5 miliardi di dollari, ha scorporato la propria tecnologia principale in una nuova società, Niantic Spatial, per sviluppare modelli di “geospatial AI”, cioè sistemi di intelligenza artificiale in grado di comprendere e interpretare il mondo fisico.
Il “tesoro” di Niantic, infatti, non era unicamente il titolo “Pokémon Go”, ma il database costruito in oltre un decennio di partite. Gran parte di questi dati è stata prodotta, infatti, tramite funzioni di AR mapping introdotte nel gioco: per trovare i Pokémon, bisognava spostarsi nello spazio urbano con la fotocamera dello smartphone attiva per ricostruire digitalmente lo spazio.
In questo modo sono state archiviate oltre 30 miliardi di immagini e scansioni tridimensionali di luoghi reali, utili per addestrare modelli IA che riconoscono edifici, oggetti e geometrie urbane.
Finora i dataset difficili da replicare erano alla portata di giganti come Google e Tesla, che disponevano di infrastrutture globali capaci di trasformare prodotti di massa in reti di raccolta dati: milioni di smartphone nel caso delle mappe, milioni di automobili per la guida autonoma.
Oggi lo stesso principio sta diventando accessibile anche ad aziende molto più piccole.
Attori, avatar e dati biometrici
Secondo una recente inchiesta di The Verge, società come Handshake AI producono dati per l’industria dell’IA ingaggiando attori per registrare interazioni spontanee che permettano ai modelli di apprendere sfumature emotive, ironia, tensione o empatia durante una conversazione, al fine di simulare comportamenti sociali complessi.
Anche la startup londinese Synthesia, valutata 4 miliardi di dollari, raccoglie dati biometrici da attori professionisti: le loro performance diventano la base di personaggi virtuali.
Appen, una società australiana specializzata nella raccolta e annotazione di dati per l’IA, paga invece persone comuni 50 dollari l’ora per effettuare davanti a sensori e videocamere movimenti del corpo, gesti ed espressioni facciali. Il materiale registrato viene venduto a chi – come Meta – sviluppa modelli per generare avatar digitali realistici.
Il lavoro quotidiano come fonte di dati
Un esempio più discusso di raccolta e produzione di dati riguarda aziende che pagano lavoratori per registrare attività domestiche ordinarie. I partecipanti indossano dispositivi con videocamere integrate mentre cucinano o piegano il bucato. Le informazioni registrate servono per addestrare robot domestici e IA capaci di comprendere come gli esseri umani svolgono compiti quotidiani. Per alcuni rappresenta un modo semplice per guadagnare, ma si tratta spesso di un lavoro controverso e mal retribuito, soprattutto perché addestra sistemi di intelligenza artificiale a sostituire, in ultima analisi, il lavoro umano.
Nuove forme di raccolta e osservazione
Alcune startup come la californiana Micro1, che ha raggiunto una valutazione di 500 milioni di dollari grazie ai suoi servizi di raccolta e annotazione di dati, pagano persone in vari paesi per indossare occhiali smart che registrano in soggettiva ogni gesto. I filmati servono a insegnare alle IA come interpretare il comportamento umano nel mondo reale, una capacità necessaria per robot e assistenti domestici del futuro.
L’IA impara anche dai professionisti
La raccolta di dati non riguarda solo movimenti o immagini. Sempre più aziende stanno reclutando professionisti qualificati per insegnare alle IA conoscenze specialistiche.
Mercor, una società statunitense valutata oltre un miliardo di dollari, ha reclutato decine di migliaia di esperti – programmatori, avvocati, analisti finanziari – a cui ha chiesto di creare esempi e valutazioni per addestrare i modelli su compiti complessi.

Un mercato in forte espansione
La richiesta continua di dataset, di varia natura, spinge il mercato globale della raccolta ed etichettatura dei dati per le IA: valeva circa 3,77 miliardi di dollari nel 2024; raggiungerà 17 miliardi entro il 2030, con una crescita media annua del 28% circa.

PIER LUIGI PISA