Miniaturizzare i supercomputer con un chip grande come un wafer

Un chip grande quanto un wafer consente di miniaturizzare i supercomputer e offre una nuova frontiera del calcolo per le intelligenze artificiali

Se fossi un device, quale saresti?
Fai il test

LinkedIn X Facebook WhatsApp Email

Il mondo dell'informatica ci ha ormai abituati all'esigenza della miniaturizzazione: chip e dispositivi sempre più piccoli quanto potenti. Con l'avvento dei supercomputer lo spazio necessario alle grandi potenze di calcolo delle intelligenze artificiali è aumentato, ma ora c'è un'azienda che ha realizzato un chip grande quanto un wafer che consente di miniaturizzare queste potenti macchine.

La Cerebras si è specializzata nella progettazione e realizzazione dei chip più grandi al mondo, come il Cerebras Wafer-Scale Engine (WSE), lungo 8,5 pollici (poco meno di 22 cm) e che ospita 1200 miliardi di transistor, che sarebbe in grado di aiutare le intelligenze artificiali a svolgere super calcoli in appena pochi giorni rispetto ai mesi richiesti da un "classico" supercomputer. Il nuovo chip sfida quindi la GPU Nvidia A100, che nelle dimensioni di un pollice (2,54 cm) ospita 54 miliardi di transistor ed è l'attuale star del mondo del supercalcolo. Inoltre, si pone come tecnologia del futuro per lo sviluppo e la progettazione dei futuri supercomputer miniaturizzati in grado di far progredire l'intelligenza artificiale.

Perché produrre un grande chip?

mega chip Il chip WSE di Cerebras nasce con un obiettivo ben preciso: contribuire all'evoluzione del supercalcolo, accelerando la formazione dei modelli di deep learning dell'intelligenza artificiale. In appena un anno dal lancio, già diversi laboratori di supercalcolo lo stanno mettendo alla prova, in particolare il National Energy Technology Laboratory (NETL), che sta testando il chip per capirne le potenzialità oltre all'uso nell'AI (Artificial Intelligence).

Fastweb Mobile Full

10,95€/mese

Internet 200 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

I ricercatori del laboratorio statunitense NETL guidati da Dirk Van Essendelft e in collaborazione con Michael James di Cerebras hanno messo a confronto il chip WSE, alloggiato in un sistema all-in-one chiamato CS-1 e grande quanto un mini-frigo, e il supercomputer Joule 2.0 per lo svolgimento di una simulazione fluidodinamica. La simulazione del movimento dei fluidi comporta calcoli particolarmente complessi, ma è anche una delle attività più comuni svolte dai supercomputer, trovando applicazione, ad esempio, nelle previsioni meteorologiche o nella progettazione delle ali degli aerei.

I risultati del recente studio sono stati presentati alla conferenza SC20 di supercalcolo e hanno visto il chip grande quanto un wafer battere la tecnologia "tradizionale". Il CS-1 è riuscito a completare anche la simulazione della combustione in una centrale elettrica 200 volte più velocemente rispetto al supercomputer Joule 2.0, che è classificato come l'81° supercomputer più veloce al mondo.

A fare la differenza tra i due sistemi di calcolo non è solo la velocità di esecuzione di calcoli complessi, ma anche le prestazioni in termini di consumi energetici e dimensioni. Il supercomputer Joule occupa dozzine di rack di server, consuma fino a 450 kilowatt di potenza ed è costato decine di milioni di dollari. Il CS-1 di Cerebras invece occupa un terzo di un server rack, consuma 20 kilowatt di potenza ed è costato pochi milioni di dollari.

Chip WSE: il segreto è nel design

mega chip Nel campo della microelettronica, un wafer è una sottile fetta di materiale semiconduttore su cui vengono incisi i circuiti integrati che andranno a realizzare i chip. Solitamente, si tratta di un wafer di silicio che poi verrà tagliato in più pezzi dando vita ai chip individuali. Nel caso del WSE, il wafer viene lasciato intero, come se fosse una singola unità operativa che contiene quasi 400.000 core di elaborazione, ognuno dei quali è connesso alla propria memoria dedicata e ai quattro core adiacenti.

Proprio questo design è il segreto del funzionamento del chip di Cerebras. Quando si esegue un'elaborazione su larga scala, l'attività viene distribuita tra centinaia o migliaia di chip che operano in parallelo, lavorando in comunicazione costante e spostando le informazioni avanti e indietro tra i core del processore, che sta eseguendo i calcoli, e la memoria condivisa, per salvare i risultati ottenuti.

Immaginiamo di avere una grande azienda dislocata in più filiali nella città e con gli archivi che si trovano in sedi diverse da quella dell'elaborazione dei documenti. Le informazioni tra le filiali saranno scambiate attraverso l'uso di corrieri, che anche ottimizzando i percorsi tra un edificio e l'altro, dovranno comunque effettuare un viaggio che richiede un determinato minimo di tempo che, sommato a distanza e traffico, rallenta lo scambio dei documenti cartacei. Se la stessa azienda si spostasse in un grattacielo, dove sono riunite tutte le filiali, e ogni dipendente avesse un suo schedario in ufficio dove archiviare i documenti, anche dovendo accedere a quelli di un collega a un piano diverso (e quindi ad una diversa filiale) potrebbe farlo molto più rapidamente: basterebbe prendere l'ascensore.

Il chip di Cerebras funziona proprio come il grattacielo: il design gli permette di trasportare le informazioni in modo molto più efficiente e di elaborarle più velocemente rispetto a un supercomputer che si basa su una rete composta da tantissimi chip tradizionali che operano distanziati tra loro.

Limiti e potenzialità del WSE

mega chip4 Nonostante la sua velocità sia superiore rispetto a un supercomputer, il mega chip di Cerebras ha anche dei limiti. Il WSE può gestire solo problemi che siano abbastanza "piccoli" da essere supportati dal wafer, ma la sua capacità di gestirli praticamente in tempo reale ha una enorme potenzialità. Si pensi, ad esempio, alla simulazione accurata del flusso d'aria intorno a un elicottero che cerca di atterrare su una pista. Utilizzando il mega-chip sarebbe possibile semi-automatizzare il processo con una elaborazione in tempo reale, un'applicazione impensabile ad oggi da eseguire con i tradizionali chip.

Tra le altre applicazioni, sicuramente spiccano quelle legate al deep learning e all'addestramento delle reti neurali. Il chip consente infatti di velocizzare il machine learning delle intelligenze artificiali e questo è solo l'inizio. L'azienda sta già lavorando a un chip di nuova generazione dotato di 2.6 trilioni di transistor, 850.000 core e oltre il doppio della memoria. Cerebras punta ad affermarsi nel campo dei chip dei supercomputer del futuro, trovando il suo posto tra i chip neuromorfici basati su memristori che imitano il cervello umano e ancora i computer quantistici. Tre tecnologie diverse che potrebbero lottare tra loro per affermarsi, o trovare il modo di unirsi per la progettazione e realizzazione di computer sempre più potenti.

A cura di Cultur-e

#CuriositaTech

#DigitalDevelopment

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

TecnologicaMente

Se fossi un device, quale saresti?

Se fossi un device, quale saresti?

Scopri il tuo alter ego tech: uno smartphone, un drone o un e-reader

Fai il test gratuito

LinkedIn X Facebook WhatsApp Email

Google Wallet, la funzioni che non conosci

Che cosa è possibile fare con Google Wallet, la lista delle funzioni ancora poco conosciute ma che in realtà possono essere molto utili per tutti gli utenti

Digital Magazine

Come prepararsi agli Amazon Prime Day

Il Prime Day di Amazon è alle porte e per non lasciarsi sfuggire i migliori sconti su decine di prodotti il carrello dell’e-commerce diventa un alleato prezioso

Digital Magazine

Su IT Wallet in arrivo ISEE e Titoli di studio, l'Italia si prepara a EUDI Wallet

L’IT Wallet si prepara al prossimo step con AGID e Governo che stanno per sbloccare nuove funzioni cruciali per lo sviluppo del portafoglio digitale italiano

Scopri i corsi gratuiti della Fastweb Digital Academy

Il significato di autostima

Il corso “Il significato di autostima” è un percorso formativo che ti aiuterà a imparare il vero significato di autostima e a che cosa serve; a…

Node.js e Typescript – corso base

Creare applicazioni web moderne richiede molte competenze in ambito sviluppo web e la conoscenza di diverse tecnologie e linguaggi. Fortunatamente,…

Introduzione al Growth Hacking

Il Growth hacking è una disciplina, nata all’interno del mondo startup, che combina i diversi approcci di Marketing, Programmazione e Prodotto. Ma è…