- 8
- April
- 2025

la ricerca
L’impatto dell’intelligenza artificiale sul tessuto socioeconomico e l’innovazione tecnologica
Responsabile della linea di ricerca
Andrea Tacchella
Introduzione
I recenti progressi nel campo dell’intelligenza artificiale stanno producendo rapidi mutamenti nel modo di elaborare informazioni e di generare contenuti. In particolare i modelli per il linguaggio Large Language Models – LLM, ( ChatGPT, GPT4, LLaMA), e i modelli per la generazione di immagini Diffusion Models – DM, (DALLE 2, Midjourney, StableDiffusion) si sono dimostrati in grado di produrre contenuti e rispondere a richieste a livelli comparabili con quelli di un essere umano. Questi strumenti hanno il potenziale di modificare profondamente il modo di gestire, trasformare e produrre informazioni, contenuti e, in ultima analisi, lavoro.
In questo progetto ci concentreremo prevalentemente sui Language Models, che possiedono il maggiore potenziale trasformativo per il mercato del lavoro, e allo stesso tempo si prestano meglio a essere utilizzati come strumenti per l’analisi economica e sociale.
Modelli di linguaggio come il GPT3 di OpenAI, rilasciato nel giugno 2020, hanno esteso i confini della comprensione e generazione del linguaggio naturale. Il GPT3 è con ben 175 miliardi di parametri, è uno dei più grandi modelli di linguaggio e ha dimostrato capacità impressionanti in vari compiti, come la traduzione, il question-answering e il completamento del testo. L’architettura del GPT3 si basa sul modello transformer, che utilizza meccanismi di autoattenzione per catturare le dipendenze a lungo raggio nel testo. Nei primi mesi del 2023 OpenAI ha rilasciato GPT4, un modello multimodale, in grado di lavorare simultaneamente su immagini e testo, che si stima essere composto da circa 100 trilioni di parametri.
Negli stessi mesi sono stati rilasciati diversi LLM open source: modelli i cui parametri sono stati resi pubblici, a differenza dei modelli di OpenAI che rimangono proprietari. Il principale modello open source disponibile al momento è LLaMA. Una caratteristica fondamentale di questi modelli open-source è la possibilità di eseguirne un fine-tuning su compiti specifici, ottenendo risultati all’avanguardia in aree come l’analisi del sentiment, il riconoscimento delle entità nominate e la classificazione del testo. Questo consente di sfruttare le capacità linguistiche di questi modelli in un’enorme varietà di compiti.
I processi creativi sono strettamente correlati alle dinamiche di innovazione in numerosi sistemi appartenenti alla teoria dalla complessità. In entrambi uno degli elementi caratterizzanti è l’espansione temporale dello spazio concettuale dovuto sia all’inclusione di elementi nuovi e inaspettati, sia a processi autonomi legati all’esplorazione dello spazio del possibile. In generale, le moderne tecniche di Intelligenza Artificiale hanno raggiunto livelli straordinari di ricombinazione delle informazioni presenti nella loro base di conoscenza. ChatGPT o GPT4 al momento riescono a produrre testi estremamente convincenti grazie all’apprendimento di una quantità enorme di informazioni di training e a infrastrutture tecnologiche di ragguardevoli dimensioni. Tuttavia, sebbene le capacità generative di tali sistemi siano del tutto convincenti, a oggi queste macchine non possiedono una specifica capacità di includere nuove informazioni o anche semplicemente di anticiparne l’arrivo in un contesto di continuous learning. Questa limitazione, a cui si è cercato di far fronte attraverso l’adozione di tecniche miste – come ad esempio reti neurali e reinforcement learning – non hanno portato a soluzioni effettivamente utilizzabili in applicazioni su sistemi non stazionari. In particolare, questo problema assume un ruolo molto rilevante in tutte le applicazioni in cui l’IA deve stabilire un collegamento tra la creatività umana – articolata in senso artistico, o quale processo di innovazione delle idee e di sviluppo – in modo da rappresentare uno strumento utile ed efficace per supportare le dinamiche creative naturali.
Nel contesto della collaborazione con strumenti di IA, la produzione testuale ha un ruolo di spicco, per via dei risultati ottenuti nel campo della Natural Language Processing NLP quali il suggerimento di alternative semanticamente corrette, l’analisi della leggibilità del testo e la generazione di testi a partire da una richiesta dell’utente. Quest’ultima tecnologia promette di cambiare radicalmente il processo di scrittura, fornendo un motore per: la produzione di testi, la sintesi e la proposta di forme retoriche alternative che, nonostante l’apertura al pubblico sia avvenuta meno di un anno fa, è già utilizzata su vasta scala e sta già influenzando il flusso di lavoro di molti scrittori.
Tuttavia, l’utilizzo di questi strumenti rimane relegato nell’analisi del testo, come una forma statica. Quando si parla di tempo, nella comunità NLP, si parla più spesso del concetto per codificare la successione di elementi testuali di un’opera e non per parlare del processo di scrittura.
Finalità e obiettivi
In questo progetto ci proponiamo di analizzare il potenziale trasformativo di questi strumenti in tre direzioni:
- Il loro impatto sociale ed economico;
- La loro capacità di aumentare la creatività e l’innovatività;
- La possibilità di utilizzarli come strumenti per aumentare la nostra comprensione dei fenomeni economici e sociali
La ricerca verrà dunque articolata secondo molteplici linee che affrontano questi temi in maniera interconnessa:
- Analisi dell’impatto sul mercato del lavoro. Verrà studiata la dinamica delle competenze richieste dal mercato del lavoro e come questa sia correlata all’emergere della disponibilità di nuovi strumenti di IA. Grazie allo sviluppo delle tecniche di previsione e di continuous learning descritte sotto, si intende anche mantenere una analisi in “tempo reale” della dinamica e integrarla con la produzione di scenari di previsione.
- Uso di LLM per l’analisi delle dinamiche economiche e di innovazione. Grazie alla crescente disponibilità di LLM open source diventa possibile l’analisi automatizzata di enormi quantità di informazioni non strutturate liberamente disponibili, quali siti web, pubblicazioni scientifiche e brevetti. Uno degli obiettivi di questo progetto è di fare uso di questi strumenti, con opportuni fine-tuning, per estrarre segnali dinamici sui processi di innovazione tecnologica e di sviluppo economico.
- Uso di LLM per l’ottimizzazione di policy di transizione verde. Gli LLM possono essere utilizzati per connettere le prescrizioni di policy con la reale disponibilità di capabilities sui territori. Ad esempio è possibile connettere i brevetti con le legislazioni europee sulla riduzione dell’inquinamento industriale, o è possibile ricostruire la necessità di materie prime critiche per l’implementazione di queste policy.
- Esplorazione di tecniche di apprendimento di sistemi non stazionari. Come già accennato sopra, l’inclusione di nuove informazioni nei sistemi di IA è ancora un tema irrisolto nel panorama delle moderne tecniche di apprendimento. La principale finalità in questo ambito consiste nel creare sistemi in grado di implementare apprendimenti dinamici che siano conservativi nel mantenere in memoria le informazioni precedentemente apprese, ma che allo stesso tempo siano in grado di includere rapidamente le novità in processi di continuous learning.
- Supporto alla creatività artistica. Una classe di sistemi di IA dotata delle caratteristiche riportate sopra ha le capacità di codificare e includere processi di innovazione artistica quale processo evolutivo non stazionario. In quest’ambito, si vuole realizzare un sistema di IA in grado di comprendere, a diversi livelli di complessità, le procedure creative umane in modo da elaborare un dialogo costruttivo per un supporto bidirezionale uomo-macchina alla creatività
- Rappresentazione e previsione di sistemi evolutivi. Lo studio di specifici ambiti evolutivi, come ad esempio la diffusione dell’IA in diverse aree di ricerca o lo sviluppo dei codici tecnologici nel caso di brevetti tecnologici, permette di comprendere la natura storica di tali evoluzioni e consentendo di anticipare le prossime aree che coinvolgeranno questi processi. In questo caso, l’IA oltre a essere in grado di includere le novità delle serie storiche, deve essere in grado di costruire scenari probabilistici compatibili con il passato e verosimili per le predizioni future.
- Creatività nei processi di scrittura collettiva in ambito ibrido persona-IA. Le caratteristiche in termini di innovatività delle intelligenze artificiali generative e le conseguenze che ha il loro uso ricorrente nella scrittura di testi, quale la riduzione della sorpresa, qualità di una serie temporale che ne descrive il carattere inaspettato di un dato elemento dati i precedenti. I modelli di lavoro del processo creativo ibridi persona-IA, in termini di organizzazione delle fasi del lavoro e distribuzione degli obiettivi volti al miglioramento dell’attività creativa nei termini definiti dall’utente (innalzamento della qualità finale del prodotto, godibilità del processo, maggiori probabilità di innovazione, etc.). La creazione di strumenti di IA atti al coordinamento e la curatela dei processi di scrittura collaborativi.
- IA per potenziare l’analisi economica: e.g. BloombergGPT
- LLM for innovation analysis (patents, papers)
- LLM for web scraping of economic activity data (services, job ads) – with IFC, AirBnB, Translated.com
Contenuti e metodi
Analisi delle dinamiche tecnologiche e di innovazione. Il processo di esplorazione della conoscenza è largamente documentato attraverso la produzione di articoli scientifici, brevetti e repositories di codice. La vastità e varietà di questa produzione rende sostanzialmente impossibile tracciare le dinamiche di innovazione con metodi tradizionali, se non a livello di tendenze macroscopiche. Tuttavia una conoscenza dettagliata di queste dinamiche consente l’anticipazione di scoperte imminenti. Tramite l’uso di LLM verranno costruiti dei sistemi di rappresentazione matematica dei concetti di innovazione (embeddings) espressi nei diversi domini documentali (articoli scientifici, brevetti, repositories di codice), ne verranno studiate le dinamiche e si costruiranno modelli di previsione basati sulla prossimità semantica dei concetti.
Mappatura delle competenze tecnologiche verdi. Le tecniche di riduzione delle emissioni inquinanti sono oggetto di numerose normative. In particolare, la normativa europea sulla riduzione delle emissioni industriali è considerata uno standard di riferimento a livello mondiale. Mediante l’uso di LLM ci proponiamo di connettere tutte le specifiche tecniche dettagliate nella normativa europea con la produzione di brevetti a livello mondiale. Questo consentirà una mappatura dettagliata delle impronte tecnologiche di questi processi e della disponibilità geografica delle competenze connesse
Materie prime critiche. Sulla base di recenti studi che connettono la produzione di singole tecnologie in tutto lo spettro tecnologico o guardando in particolare alle tecnologie per l’adattamento ai e la mitigazione dei cambiamenti climatici (de Cunzo et al., 2022) e l’export al livello di singoli prodotti (Pugliese et al., 2019), abbiamo l’obiettivo di integrare gli studi sulla transizione sostenibile e l’utilizzo di innovative metodologie di intelligenza artificiale. In particolare, intendiamo portare avanti una ricerca sul contenuto di materie prime critiche (MPC) nelle tecnologie per l’adattamento ai e la mitigazione dei cambiamenti climatici, tramite lo studio degli abstract dei brevetti presenti negli ambiti tecnologici Y02-Y04S tramite language models di grandi dimensioni, sistemi di elaborazione del linguaggio naturale (NLP) con miliardi di parametri che hanno dimostrato nuove capacità di rispondere a domande di comprensione della lettura, così come generare testi creativi o risolvere problemi matematici. Infatti, la diffusione delle tecnologie verdi rappresenta un passo fondamentale per il raggiungimento degli obiettivi di policy sulla mitigazione dei cambiamenti climatici, ma comporta una significativa espansione della produzione e del commercio di materie prime critiche fondamentali per il loro funzionamento e al momento insostituibili per esempio nei pannelli solari, nelle turbine eoliche, nei veicoli elettrici e nell’illuminazione ad alta efficienza energetica (International Energy Agency, 2021; Herrington, 2021; Hund et al., 2020; Kowalski and Legendre, 2023). Le MPC sono una serie di materie prime di importanza strategica ed elevato rischio di approvvigionamento identificate dalla Commissione Europea, che aggiorna in modo continuo una lista di queste risorse collegate alla tecnologia odierna (European Commission, 2011, 2020a, 2020b).Il lavoro che intendiamo portare avanti potrebbe fornire un’analisi empirica descrittiva completa della presenza di CRM nelle tecnologie verdi, inizialmente utilizzando tecniche di text mining sulle descrizioni dei brevetti verdi e poi con language models più complessi. Combinando questo risultato con le informazioni sui paesi in cui i brevetti sono depositati, è possibile identificare quali tecnologie verdi fanno maggiore affidamento sui CRM e dove vengono impiegate. Inoltre, tenendo conto dei dati di produzione dei materie prime critiche, sarà possibile, da un lato, di articolare meglio la dipendenza delle tecnologie verdi da questi materiali, per esempio, includendo un indice di concentrazione della loro produzione e, dall’altro, di geolocalizzare la distribuzione spaziale di questi input e confrontarla con quella dei paesi in cui vengono impiegate le tecnologie verdi dipendenti dai MPC. Analisi preliminari indicano che materiali come il litio, il silicio, le terre rare, il cobalto e la grafite si sono componenti chiave per lo sviluppo delle tecnologie verdi (in particolare le tecnologie di generazione e trasmissione dell’energia e quelle legate alla produzione o alla lavorazione dei beni) e necessitano senz’altro un attento monitoraggio a causa della scarsa diversificazione della loro produzione. Infine, notiamo una chiara divergenza tra i produttori delle materie prime necessarie per lo sviluppo delle tecnologie verdi e i paesi in cui tali tecnologie sono sviluppate. L’utilizzo di metodologie di AI più avanzate ci permetteranno di affinare i risultati preliminari e di distinguere tra l’utilizzo dei materiali come input necessari per la costruzione delle tecnologie o la loro presenza all’interno delle descrizioni dei brevetti che mirano alla rimozione dell’inquinamento ambientale e al riciclo delle MPC.
Impatto dell’AI sul mercato del lavoro. I dati degli annunci di lavoro sono considerati uno dei migliori strumenti per osservare le dinamiche di domanda di competenze da parte dei datori di lavoro. Questi annunci vengono raccolti in grandi database di dati scarsamente strutturati. Mediante l’uso di strumenti di language modeling è possibile estrarre informazioni da questi annunci come il settore a cui fa riferimento l’annuncio, il luogo di lavoro e le skills richieste. In questo progetto faremo uso di queste basi di dati per studiare (anche in tempo reale) come l’avvento e la diffusione di strumenti di AI modifica la domanda di skills a livello geografico e di settore.
Scraping web per l’economia dei servizi. Contrariamente ai dati sul commercio di beni fisici, i dati sul commercio dei servizi sono scarsamente disponibili, non armonizzati e generalmente poco affidabili. Questo limita molto le analisi economiche, specialmente in ambito economic complexity. Con la collaborazione di Translated.com, la più grande azienda nel mercato di traduzioni al mondo, che ha sede a Roma, intendiamo sviluppare, utilizzando LLM, una pipeline di analisi per identificare e geolocalizzare i providers di servizi attraverso uno scraping sistematico di grandi database di pagine web (CommonCrawl). Questa attività coinvolgerà anche la International Finance Corporation, con la quale il CREF ha sottoscritto un MoU, che ha manifestato interesse alle possibilità di analisi dell’economia dei servizi nei mercati emergenti. Un primo progetto pilota verrà realizzato su Capo Verde.
Dreaming Learning. Questa tecnica di apprendimento delle IA è al momento in sviluppo e in fase di finalizzazione. Essa permette di dotare una rete neurale generativa dalla proprietà di anticipare nuove informazioni che possono pervenire all’ingresso di tali sistemi, consentendo di includere con grande facilità le novità all’interno dalla base di conoscenza precedente. Inoltre la sua descrizione teorica permette di stabilire una precisa connessione con gli approcci Bayesiani per la descrizione automatica di prior opportuni. Queste caratteristiche consentono alla macchina di generalizzare l’informazione di training in maniera molto efficace e, allo stesso tempo, di focalizzare l’attenzione sulle novità rilevanti in termini di impatto sulla sequenza temporale non stazionaria sotto analisi.
Sistemi neurali evoluzionistici. Il vantaggio dimostrato nell’applicazione del Dreaming Learning induce a ritenere che sistemi neurali dotati di architetture meno vincolate al modello feed-forward e in cui l’informazione può circolare più liberamente all’interno dalla rete, siano più efficaci nella comprensione di dinamiche di innovazione flessibili e adattive. In questa direzione, si intende sviluppare nuovi sistemi di IA basati sulle dinamiche evoluzionistiche nei quali l’architettura possa adattarsi in maniera efficace e naturale al problema proposto.
WeWrite. Un’innovativa piattaforma di scrittura non-lineare collaborativa, volta a facilitare il processo di traduzione di idee complesse in forme testuali fruibili, quali articoli scientifici e brani di narrativa, ma anche reti testuali navigabili come nel caso di giochi interattivi. La piattaforma stessa, o le competenze sviluppate nella sua costruzione, possono gettare le basi per uno studio sulla distribuzione del lavoro in un ambito di scrittura ibrida, proponendo alternative facilmente esplorabili e permettendo di ricostruire la storia del processo creativo e accreditare il lavoro dei differenti partecipanti persona o IA.
Metriche per l’individuazione delle fasi creative nei processi di scrittura. Il recente lavoro sul processo di scrittura permette di utilizzare sequenze di testi ordinate temporalmente per individuare la quantità di esplorazione, in termini di idee e di soluzioni retoriche, compiuta dal team di scrittura tra una versione e la successiva del testo. Utilizzando queste tecniche in concomitanza con i nuovi strumenti di intelligenza artificiale generativa si può sviluppare un assistente di scrittura consapevole del processo creativo e capace di dare indicazioni basate sul percorso dello scrittore.
FC – International Finance Corporation
Translated.com
Mamacrowd
Sony CSL Rome partecipa al progetto STARTS-AIR all’intersezione tra Arte e Scienza.
Aterballetto, per lo sviluppo di tecnologie di interazione artistica performativa tra performer e
sistemi di IA per il supporto alla creatività naturale.
Linguistics/Centre for Behaviour and Evolution (Christine Cusckley)
CSL-Rome è parte del progetto francese “ScientIA” sullo studio dell’impatto dell’Intelligenza Artificiale in altre discipline scientifiche.
Ricercatori CREF
Andrea Tacchella, Angelica Sbardella, Francesco De Cunzo (CREF)
Ricercatori Sony
Alessandro Londei, Vittorio Loreto, Ruggiero Lo Sardo (CREF – SONY)
De Cunzo, F., Petri, A., Zaccaria, A., & Sbardella, A. (2022). The trickle down from environmental innovation to productive complexity. Scientific Reports, 12(1), 22141.
Napolitano, L., Sbardella, A., Consoli, D., Barbieri, N., & Perruchas, F. (2022). Green innovation and income inequality: A complex system analysis. Structural Change and Economic Dynamics, 63, 224-240.
Caldarola, B., Grazzi, M., Occelli, M., & Sanfilippo, M. (2023). Mobile internet, skills and structural transformation in Rwanda. Accepted in Research Policy.
Bruno, M., Lambiotte, R., & Saracco, F. (2022). Brexit and bots: characterizing the behaviour of automated accounts on Twitter during the UK election. EPJ Data Science, 11(1), 17.
Patuelli, A., & Saracco, F. (2023). Sustainable development goals as unifying narratives in large UK firms’ Twitter discussions. Scientific Reports, 13(1), 7017.