Nvidia's Blackwell AI Chip kampt met oververhittingsproblemen
Paul Grieselhuber
Nvidia's Blackwell AI-chip, geïntroduceerd in maart 2024 en gevierd als een revolutionaire sprong in AI-hardware, wordt geconfronteerd met kritieke uitdagingen. Rapporten onthullen oververhittingsproblemen wanneer meerdere chips worden aangesloten in serverracks, waardoor Nvidia gedwongen is om herontwerpen aan te vragen bij grote cloudproviders zoals Meta, Google, en Microsoft.
Van de Blackwell-chip, met name de GB200-variant, werd verwacht dat deze ongekende prestaties zou leveren. Door twee GPU's te combineren met een enkele Grace CPU beloofde het tot 30 keer de verwerkingskracht van bestaande architecturen voor grote taalmodellen. Deze enorme sprong in snelheid positioneerde Blackwell als een hoeksteen voor de volgende generatie AI-infrastructuur, waardoor AI-modellen sneller konden worden getraind en ingezet.
Problemen met oververhitting in serverconfiguraties die zijn ontworpen voor maximaal 72 GPU's hebben deze plannen echter verstoord, waardoor de inzet die aanvankelijk was gepland voor het tweede kwartaal van 2024 is vertraagd. Voor cloudserviceproviders die vertrouwen op Blackwell om hun AI-mogelijkheden uit te breiden, hebben deze vertragingen geleid tot zorgen over schaalbaarheid en operationele tijdlijnen.
Nvidia beweert echter dat dergelijke technische iteraties typisch zijn voor vroege implementatiefasen. Ondanks deze geruststelling hebben de uitdagingen een tastbare impact gehad: Nvidia's aandelen daalden 3% na het nieuws. Het vermogen om deze thermische problemen op te lossen zal bepalen of Blackwell zijn belofte nakomt om de AI-infrastructuur opnieuw vorm te geven en Nvidia's dominantie in de sector te behouden.
Nvidia's Blackwell-chip is een belangrijke technologische mijlpaal, maar de uitdagingen benadrukken de complexiteit van het verleggen van de grenzen van innovatie. Voor cloudgiganten en de AI-industrie blijft er veel op het spel staan in afwachting van de uiteindelijke implementatie van de chip.
Referenties
- Nieuwe Nvidia AI-chips raken oververhit in servers, meldt The Information. Reuters (2024). Available online. Geraadpleegd: 18 november 2024.
- Blackwell is de sleutel tot de volgende groeifase van Nvidia. De nieuwe AI-chip heeft naar verluidt een probleem met oververhitting. Business Insider (2024). Available online. Geraadpleegd: 18 november 2024.
- Blackwell van Nvidia: Een nieuwe AI-krachtcentrale. The Verge (2024). Available online. Geraadpleegd: 18 november 2024.
- Nvidia's vertraagde Blackwell AI-chips oververhit in servers. Yahoo News (2024). Available online. Geraadpleegd: 18 november 2024.