
la ricerca
Tecnologie Fotoniche e Intelligenza Artificiale
Il progetto si propone di sviluppare nuovi sistemi fotonici con lo scopo principale di realizzare innovative macchine di calcolo ottico in grado di superare i limiti delle architetture di calcolo tradizionali.
L’attività sperimentale esplora l’uso della luce laser e la sua interazione con mezzi fotonici complessi per accelerare la soluzione di problemi di ottimizzazione combinatoria e per implementare reti neurali ibride elettroniche e fotoniche.
La ricerca verte anche sull’utilizzo del machine learning per rendere più efficaci alcune delle tradizionali tecniche ottiche di caratterizzazione di materiali.
L’attività teorica è volta a sviluppare modelli matematici avanzati per la simulazione di sistemi combinatori rappresentabili come sistemi di spin, con lo scopo di esplorare la fisica classica e quantistica alla base dei dispositivi in esame, e di testare l’efficienza di nuovi algoritmi di calcolo.
Enrico Fermi è stato un vero pioniere nel campo delle macchine calcolatrici, e ne abbiamo esempi tangibili anche qui al Museo del CREF. Oggi, il concetto di “macchina computazionale” si è espanso enormemente, spingendo le maggiori realtà industriali globali come IBM, NTT, Huawei e numerose startup a esplorare nuove frontiere, incluse le tecnologie quantistiche e fotoniche.
Questa spinta è alimentata dalla fine della Legge di Moore, la regola empirica che per decenni ha guidato la crescita esponenziale della potenza di calcolo nei semiconduttori tradizionali. Negli ultimi anni, questa crescita ha subito un brusco rallentamento, raggiungendo un plateau dovuto principalmente a limiti fisici intrinseci.
Questa circostanza ha acceso i riflettori sulla ricerca di nuove tecnologie computazionali. A ciò si aggiungono le recenti preoccupazioni sull’impatto ambientale dell’Intelligenza Artificiale. Gli algoritmi che stanno plasmando la nostra società richiedono risorse di calcolo che crescono esponenzialmente: addestrare una singola intelligenza artificiale può produrre emissioni di carbonio paragonabili a decine di voli intercontinentali.
È quindi cruciale sviluppare tecnologie che siano più performanti dei processori convenzionali e al contempo meno energivore, magari operando a temperatura ambiente senza la necessità di complessi sistemi di raffreddamento.
In questo contesto, la fotonica emerge come la tecnologia più promettente. Studi recenti dimostrano la capacità di elaborare in parallelo enormi quantità di dati tramite raggi laser, che codificano l’informazione attraverso tecniche di modulazione avanzate. A lungo termine, l’integrazione di algoritmi quantistici potrebbe rivoluzionare la velocità di calcolo e aprire la strada a metodi di crittografia innovativi.
I sistemi fotonici e quantistici hanno il potenziale per risolvere problemi di ottimizzazione in un tempo polinomiale rispetto alla dimensione del sistema – un concetto spesso definito “Vantaggio Quantistico”. È proprio questo l’obiettivo che il CREF persegue con la linea di ricerca “Tecnologie fotoniche e intelligenza artificiale“: sviluppare sistemi quantistici fotonici per accelerare la computazione, fornendo risultati robusti e in formato classico, non soggetti a decoerenza e quindi immediatamente interfacciabili con i calcolatori tradizionali.
Questo ambizioso lavoro si articola su due linee di ricerca parallele: una sperimentale, incentrata sulle attività del Laboratorio di Fotonica Computazionale del CREF, diretto dal Dr. Romolo Savo; e una teorica, focalizzata sullo sviluppo di modelli matematici e simulazioni numeriche per testare l’efficienza su larga scala di nuovi algoritmi di calcolo combinatorio, sotto la guida del Dr. Marcello Calvanese Strinati.
L’attività sperimentale del Laboratorio di Fotonica Computazionale si distribuisce su due linee di ricerca che guardano alla fotonica ed alle tecnologie di intelligenza artificiale (IA) in maniera speculare. La prima direzione di ricerca – “Fotonica per il machine learning” – ha lo scopo di realizzare macchine di calcolo innovative basate su sistemi fotonici, in grado di accelerare il calcolo combinatorio nei problemi di ottimizzazione (es. macchine di Ising) e di implementare su larga scala reti neurali fotoniche. Entrambe le architetture di calcolo sono largamente diffuse nelle intelligenze artificiali e la loro implementazione analogica basata sulla propagazione di luce ha il potenziale di ridurre in modo significativo le risorse computazionali, il consumo energetico e l’impatto ambientale associate all’uso dell’IA. La seconda direzione di ricerca – “Machine learning per la fotonica” – mira ad utilizzare le potenti tecniche di elaborazioni dati offerte dal machine learning per rendere più efficaci alcune delle tradizionali tecniche ottiche di caratterizzazione di materiali, come l’interferometria e lo scattering di luce. I risultati ottenuti in questa direzione permetteranno di semplificare i protocolli di implementazione delle tecniche ottiche e di estendere il loro utilizzo a situazioni e materiali più complessi.
Anche l’attività teorica si divide in due direzioni, in questo caso “classica” e “quantistica”. L’analisi classica riguarda la formulazione e lo studio di nuovi modelli di dinamica nonlineare di un sistema di oscillatori parametrici accoppiati. Lo scopo è simulare il rilassamento di un sistema di spin vettoriali verso il minimo dell’energia di interazione tra gli spin. Questo sistema chiamato “macchina di hyperspin” è proposto con un duplice scopo: (i) Trovare il minimo dell’energia di interazione tra gli spin simulati; (ii) Implementare nuovi schemi di “annealing dimensionali”, per aumentare la capacità del sistema di trovare il minimo energetico di un sistema di spin binari (Ising). L’analisi quantistica è basata principalmente sul formalismo dei sistemi dissipativi aperti. Lo scopo è trovare effetti quantistici non banali in questi modelli di oscillatori e capire se essi possano essere usati per potenziare il calcolo classico.
La ricerca sperimentale: il laboratorio di fotonica computazionale
Il laboratorio ha l’infrastruttura per sviluppare prototipi di macchine di calcolo fotonico e condurre gli esperimenti ottici correlati. I metodi sperimentali si basano sulla modulazione di luce laser mediante modulatori di luce spaziali e sull’interazione della luce con materiali fotonici complessi. La modulazione spaziale della fase del campo ottico consente di codificare milioni di variabili in un singolo punto luminoso di pochi millimetri. La propagazione della luce nello spazio libero e attraverso materiali fotonici con proprietà controllate consente l’elaborazione parallela di questa enorme quantità di dati. I materiali di interesse sono mezzi complessi e policristallini ingegnerizzati con disordine fotonico e nonlinearità del secondo ordine, utilizzati come piattaforme fisiche per l’elaborazione dell’informazione trasportata dalla luce. Lo studio e lo sviluppo di questo tipo di materiali è parte dell’attività di ricerca del laboratorio e viene condotto nell’ambito di collaborazione internazionali (ETH Zurigo, Université Sorbonne, TATA institute Mumbai). L’utilizzo di sorgenti laser impulsate “ultraveloci” (femtosecondo) è un elemento chiave della ricerca del laboratorio che permette di utilizzare e studiare i materiali di interesse nel regime ottimo nonlineare.
Il laboratorio ha recentemente dimostrato la realizzazione dell prima rete neurale fotonica di tipo “deep” su larga scala basata su scattering multiplo di impulsi laser e sulla generazione nonlineare di seconda armonica in campioni policristallini disordinati fabbricati assemblando nanocristalli di niobato di litio (LNO). Uno schema dell’apparato sperimentale è mostrato in Fig. 1. Questo risultato è stato ottenuto all’interno di una collaborazione internazionale (Université Sorbonne, ETH Zurigo, Tsinghua University Pechino) e pubblicato sulla prestigiosa rivista Nature Computational Science. Il risultato è stato anche selezionato tra i dieci “breakthrough” dell’anno 2024 dalla rivista IEEE Photonics.
Ulteriori attività sperimentali in corso comprendono:
- la realizzazione di una macchina di Ising fotonica con interazione a multi-corpo, basata su scattering multiplo di impulsi laser e sulla generazione nonlineare di seconda armonica in campioni policristallini disordinati fabbricati assemblando nano cristalli di niobato di litio (LNO). Sono in fase di sperimentazione tre tipologie di algoritmo di ottimizzazione: i) sequenziale, ii) genetico e iii) simulate annealing. Questo studio sta permettendo una migliore comprensione dei fenomeni non lineari in mezzi fotonici disordinati. La realizzazione di questa macchina permetterà di implementare su piattaforma fotonica problemi di ottimizzazione combinatoriale finora difficilmente trattabili.
- la realizzazione di una macchina di Ising in regime lineare su larga scala che utilizza luce laser continua e propagazione in spazio libero, contenente un innovativo schema interferometrico che permette di monitorare simultaneamente il piano ottico di elaborazione dati (piano di Fourier) ed il piano ottico di codificazione dati (piano fasi reale). Questa macchina fotonica di Ising vuole essere la prima utilizzata per la classificazione di dati nell’ambito della fisica delle alte energie, nello specifico per classificare le coordinate di rivelazioni di raggi cosmici.
- lo sviluppo di una tecnica innovativa di “phase unwrapping” per mappe di fase bidimensionali a quadranti basata su una procedura di classificazione da reti neurali artificiali convolutive. Il lavoro prevede la creazione in laboratorio della collezione di immagini interferometriche necessarie all’addestramento della rete neurale, consistente in decine di migliaia di immagini. Questa tecnica è potenzialmente applicabile in numerosi altri campi, come i radar, l’acustica e le telecomunicazioni
Il laboratorio sviluppa anche una linea di ricerca numerica che indaga tramite simulazioni la realizzazione di sistemi fotonici integrati in niobato di litio per la manipolazione della luce tramite scattering multiplo (collaborazione con ETH Zurigo).
La ricerca teorica
Data la sua recente idealizzazione, la macchina di hyperspin rimane al momento implementata a livello numerico in due modi: Descrivendo la dinamica degli oscillatori parametrici in tempo continuo come un sistema di numerose equazioni differenziali accoppiate (nello specifico equazioni nonlineari di Mathieu), oppure simulando la dinamica in tempo discreto tramite opportune mappe nonlineari, simulando ad ogni tempo i processi fisici fondamentali che regolano la dinamica del sistema (amplificazione parametrica, perdite intrinseche, accoppiamento e non linearità). Mentre il primo approccio permette di mostrare la validità generale del sistema proposto in quanto il modello analitico non è direttamente pensato per una specifica realizzazione sperimentale, il secondo approccio risulta particolarmente versatile e numericamente efficiente per proporre e soprattutto testare specifiche realizzazioni sperimentali della macchina di hyperspin, simulando nella maniera desiderata i processi fondamentali sopra indicati.
L’analisi fino ad ora effettuata dalla presente attività teorica sulla macchina di hyperspin, e in precedenza anche da attività sulle macchine di Ising, ha mostrato come l’efficienza della macchina per i due scopi sopra indicati dipenda in maniera non banale da tutti i parametri fisici che governano la dinamica del sistema. Abbiamo osservato che la macchina di hyperspin usata come minimizzatore dell’energia di interazione di spin vettoriali mostra una capacità di convergere al minimo globale che dipende in particolar modo da quanta potenza (in termini del campo di pompa che realizza l’amplificazione parametrica) viene immessa nel sistema. Similmente, è noto che un problema analogo si osserva nelle macchine di Ising, dove la performance del sistema come minimizzatore del modello di Ising dipende fortemente dai parametri fisici.
Abbiamo recentemente testato con successo la capacità della macchina di hyperspin con annealing dimensionale di incrementare notevolmente la performance del sistema come minimizzatore del modello di Ising e di ridurre la dipendenza di essa dai vari parametri (in particolare il campo di pompa) rispetto alla macchina di Ising convenzionale. L’analisi è stata condotta implementando numericamente sia la macchina di hyperspin sia la macchina di Ising basandosi sul formalismo delle mappe nonlineari in tempo discreto, simulando due possibili implementazioni sperimentali: ottica e opto-elettronica.
Rimane aperta la domanda di come limitare la sensibilità della macchina di hyperspin usata come minimizzatore di modelli di spin vettoriali. Nel prosieguo di questa analisi studieremo un’estensione del modello di oscillatori parametrici usato per la macchina di hyperspin su larga scala con lo scopo di garantire sia una maggiore accuratezza del sistema nel convergere verso il minimo dell’energia del modello di spin simulato, sia una robustezza dei risultati ottenuti a variazioni dei parametri del sistema.
Un altro aspetto che l’attività teorica si pone di studiare sono gli effetti quantistici in questi sistemi. Abbiamo recentemente proposto uno studio di correlazioni quantistiche (entanglement) descrivendo la dinamica del sistema quantistico con il formalismo dei sistemi dissipativi aperti (formalismo di Lindblad), ottenendo numericamente la matrice densità completa del sistema grazie a metodi di diagonalizzazione esatta. L’analisi è limitata a pochi (due o tre) oscillatori a causa della notevole complessità numerica del problema, ma è riuscita a mostrare come la presenza dell’accoppiamento tra oscillatori responsabile della formazione degli hyperspin dia origine ad uno stato fortemente correlato anche nei regimi di parametri dove invece il sistema usato come macchina di Ising realizza uno stato semi-classico. Le implicazioni di questo risultato sono attualmente in esame.
Claudio Conti, (Responsabile – Università Sapienza)
Marcello Calvanese Strinati, Ricercatore
Romolo Savo, Ricercatore
Michael Raju, Assegnista
Ahmed Tari, Assegnista
- Weizmann Institute for Science, Israel (Prof. Nir Davidson)
- Ecole Normale de Paris (Prof. Sylvain Gigan)
- Universitè de Paris (Prof. Cristiano Ciuti)
- University of St. Adrews (Prof. Andrea Di Falco)
- ETH Zurich (Prof. Rachel Grange)
- Institute for Complex Systems, CNR-Italy (Dr.ssa Pilozzi, Dr.ssa Brosco, Dr.ssa Gentilini, Dr. Pierangeli, Dr.ssa Ghofraniha, Dr. Felicetti)