Il chip AI Blackwell di Nvidia presenta problemi di surriscaldamento
Paul Grieselhuber
Nvidia chip AI Blackwell, presentato nel marzo 2024 e celebrato come un salto rivoluzionario nell'hardware AI, sta affrontando problemi critici. I rapporti rivelano problemi di surriscaldamento quando più chip sono collegati in rack di server, costringendo Nvidia a richiedere una riprogettazione ai principali fornitori di cloud come Meta, Google e Microsoft.
Il chip Blackwell, in particolare la sua variante GB200, avrebbe dovuto offrire prestazioni senza precedenti. Combinando due GPU con una singola CPU Grace, prometteva una potenza di elaborazione fino a 30 volte superiore rispetto alle architetture esistenti per modelli linguistici di grandi dimensioni. Questo salto di velocità ha posizionato Blackwell come pietra miliare per l'infrastruttura di IA di prossima generazione, consentendo un addestramento e un'implementazione più rapidi dei modelli di IA.
Tuttavia, i problemi di surriscaldamento delle configurazioni di server progettate per ospitare fino a 72 GPU hanno sconvolto questi piani, ritardando le implementazioni inizialmente previste per il secondo trimestre del 2024. Per i fornitori di servizi cloud che si affidano a Blackwell per far progredire le proprie capacità di IA, questi ritardi hanno sollevato preoccupazioni sulla scalabilità e sulle tempistiche operative.
Nvidia, tuttavia, sostiene che iterazioni ingegneristiche come queste sono tipiche delle prime fasi di implementazione. Nonostante questa rassicurazione, le sfide hanno avuto un impatto tangibile: Le azioni di Nvidia sono scese del 3% dopo la notizia. La capacità di risolvere questi problemi termici determinerà se Blackwell manterrà la sua promessa di rimodellare l'infrastruttura AI e di mantenere il dominio di Nvidia nel settore.
Il chip Blackwell di Nvidia rappresenta un'importante pietra miliare tecnologica, ma le sue sfide evidenziano la complessità di spingersi oltre i confini dell'innovazione. Per i giganti del cloud e per l'industria dell'IA, la posta in gioco rimane alta in attesa dell'implementazione finale del chip.
Riferimenti
- I nuovi chip AI di Nvidia si surriscaldano nei server, riporta The Information. Reuters (2024). Available online. Accesso: 18 novembre 2024.
- Blackwell è fondamentale per la prossima fase di crescita di Nvidia. Il nuovo chip per l'intelligenza artificiale avrebbe avuto un problema di surriscaldamento. Business Insider (2024). Available online. Accesso: 18 novembre 2024.
- Blackwell di Nvidia: Una nuova centrale di intelligenza artificiale. The Verge (2024). Available online. Accesso: 18 novembre 2024.
- I chip Blackwell AI di Nvidia, in ritardo, si surriscaldano nei server. Yahoo News (2024). Available online. Accesso: 18 novembre 2024.