Accelerazione del machine learning grazie a un nuovo schema di calcolo
L'intelligenza artificiale (AI) si basa su complessi algoritmi e enormi volumi di dati per il suo funzionamento, ma cosa succede quando la capacità di elaborazione dati raggiunge un limite? Un team di ricercatori, guidato dal Professor Sun Zhong dell'Università di Pechino, ha sviluppato un nuovo schema che migliora drasticamente sia la velocità di calcolo che l'efficienza energetica.
Superamento del collo di bottiglia von Neumann
Le operazioni matematiche, come la moltiplicazione matrice-vettore (MVM), sono fondamentali per il funzionamento delle reti neurali, che costituiscono l'architettura base dei modelli di intelligenza artificiale. Tuttavia, man mano che i dataset diventano più grandi, la performance dei sistemi di calcolo tradizionali è spesso limitata dal collo di bottiglia von Neumann, ovvero la discrepanza tra velocità di elaborazione e trasferimento dati.
La soluzione del doppio IMC
Tradizionalmente, lo schema di computazione in-memoria (IMC) singola permette di memorizzare i pesi delle reti neurali nel chip di memoria, mentre i dati in input vengono forniti esternamente. Questo approccio però presenta delle inefficienze, in particolare a causa del consumo energetico elevato e dell'uso di convertitori digitale-analogico (DAC).
Il team di ricerca ha introdotto uno schema innovativo chiamato doppio IMC, che consente di eseguire completamente all'interno della memoria sia le operazioni sui pesi che quelle sugli input. In questo modo, l'elaborazione dati diventa più veloce e efficiente.
Vantaggi del doppio IMC
- Maggiore efficienza: Grazie al calcolo completamente in-memoria, si riducono i tempi e i consumi energetici rispetto ai metodi tradizionali.
- Performance ottimizzate: La rimozione della necessità di trasferire dati tra memoria e processore elimina uno dei principali limiti alla velocità di calcolo.
- Riduzione dei costi di produzione: Non essendo più necessari i convertitori DAC, si riducono i costi e lo spazio richiesto sui chip.
Il doppio IMC è stato testato su dispositivi RRAM per compiti come il recupero del segnale e l'elaborazione di immagini, dimostrando la sua efficacia nel migliorare le prestazioni e ridurre il consumo di energia. Con l'aumento esponenziale della richiesta di elaborazione dati nell'era digitale, queste scoperte potrebbero segnare una rivoluzione nell'architettura computazionale e nel futuro dell'intelligenza artificiale.