Nvidias KI-Chip Blackwell hat Probleme mit Überhitzung
Paul Grieselhuber
Nvidia's Blackwell AI Chip, der im März 2024 vorgestellt und als revolutionärer Sprung in der AI-Hardware gefeiert wurde, steht vor kritischen Herausforderungen. Berichten zufolge kommt es zu Überhitzungsproblemen, wenn mehrere Chips in Server-Racks verbunden sind. Dies zwingt Nvidia dazu, von großen Cloud-Anbietern wie Meta, Google und Microsoft ein Redesign zu verlangen.
Der Blackwell-Chip, insbesondere seine GB200-Variante, sollte eine noch nie dagewesene Leistung liefern. Durch die Kombination von zwei Grafikprozessoren mit einer einzigen Grace-CPU versprach er eine bis zu 30-mal höhere Verarbeitungsleistung bei großen Sprachmodellen im Vergleich zu bestehenden Architekturen. Dieser drastische Geschwindigkeitssprung machte Blackwell zu einem Eckpfeiler für die KI-Infrastruktur der nächsten Generation und ermöglichte ein schnelleres Training und eine schnellere Bereitstellung von KI-Modellen.
Überhitzungsprobleme in Serverkonfigurationen, die für bis zu 72 GPUs ausgelegt sind, haben diese Pläne jedoch durchkreuzt und die ursprünglich für das zweite Quartal 2024 geplante Bereitstellung verzögert. Für Cloud-Service-Provider, die sich bei der Weiterentwicklung ihrer KI-Fähigkeiten auf Blackwell verlassen, haben diese Verzögerungen Bedenken hinsichtlich der Skalierbarkeit und der Betriebszeiten aufkommen lassen.
Nvidia behauptet jedoch, dass solche technischen Iterationen in frühen Bereitstellungsphasen typisch sind. Trotz dieser Zusicherung haben die Herausforderungen spürbare Auswirkungen: Die Nvidia-Aktie ist nach dieser Nachricht um 3 % gefallen. Die Fähigkeit, diese thermischen Probleme zu lösen, wird darüber entscheiden, ob Blackwell sein Versprechen, die KI-Infrastruktur neu zu gestalten und Nvidias Dominanz in diesem Sektor aufrechtzuerhalten, erfüllen kann.
Der Blackwell-Chip von Nvidia stellt einen wichtigen technologischen Meilenstein dar, aber seine Herausforderungen verdeutlichen, wie komplex es ist, die Grenzen der Innovation zu verschieben. Für Cloud-Giganten und die KI-Branche steht viel auf dem Spiel, denn sie warten auf den endgültigen Einsatz des Chips.
Referenzen
- Neue KI-Chips von Nvidia überhitzen in Servern, berichtet The Information. Reuters (2024). Available online. Accessed: 18. November 2024.
- Blackwell ist der Schlüssel zu Nvidias nächster Wachstumsphase. Der neue KI-Chip ist Berichten zufolge auf ein Überhitzungsproblem gestoßen. Business Insider (2024). Available online. Accessed: 18. November 2024.
- Nvidia's Blackwell: Ein neues KI-Kraftpaket. The Verge (2024). Available online. Accessed: 18 November 2024.
- Nvidia's Delayed Blackwell AI Chips Overheating in Servers. Yahoo News (2024). Available online. Accessed: 18. November 2024.