虎嗅

Huang Renxuns nächster „Goldmine“ verbirgt sich in den CPUs.

原文:黄仁勋的下一座金矿,藏在CPU 里

Zusammenfassung der Kerninhalte

In den letzten drei Jahren dominierte in der AI-Branche die Ansicht, dass nur GPUs für die nötige Rechenleistung sorgen. Mit dem Aufkommen von Agenten, die komplexe Aufgaben eigenständig ausführen können, hat sich die Rolle des CPUs jedoch von einem „Hilfsmittel“ zu einem „kritischen Koordinator“ entwickelt. Der CPU ist nun für die Aufteilung der Aufgaben der Agenten, den Aufruf von Tools sowie die Koordination von Unteragenten verantwortlich und stellt somit eine neue Engpassstelle in der AI-Rechenleistung dar. Die drei großen Chiphersteller (NVIDIA, AMD, Intel) haben ihre Investitionen im CPU-Markt deutlich erhöht, was zu einer Knappheit an Kapazitäten geführt hat: Die Lieferzeiten für Server-CPUs haben sich verlängert, die Preise gestiegen – und diese Entwicklung wirkt sich sogar auf den Verbrauchersektor aus; das nächste Computergerät für den Durchschnittsbürger könnte teurer werden.

Detaillierte Analyse

#### 1. Die Ära der Agenten: Der CPU wird zum „zentralen Akteur“

Früher wurde in der AI hauptsächlich mit dem Training von Modellen gearbeitet (z. B. ChatGPT), wobei GPUs auf parallele Berechnungen spezialisiert sind (die gleichzeitige Verarbeitung großer Datenmengen). Der CPU übernahm dabei nur „nebenliche“ Aufgaben wie das Initialisieren des Systems, das Verschieben von Daten und die Verwaltung der Aufgaben. Agenten hingegen funktionieren wie „Super-Assistenten“, die komplexe Aufgaben in mehrere Schritte unterteilen können (z. B. beim Buchen eines Fluges: Suche nach Flügen, Preisvergleiche, Eingabe von Informationen, Bestätigung des Zahlungsvorgangs) und externe Tools aufrufen sowie Dutzende von Unteragenten koordinieren müssen. Diese Koordination- und Steuerungsaufgaben können nur vom CPU übernommen werden. Studien zeigen, dass der CPU-Anteil an der Gesamtwartzeit bei der Arbeit von Agenten zwischen 50 % und 90 % liegt (wenn Sie auf eine Antwort des AI-Systems warten, ist es nicht so sehr die Geschwindigkeit des GPUs, sondern die Beschäftigung des CPUs mit der Koordination, die das Problem darstellt). Die Verhältnisse von CPU zu GPU in AI-Servern haben sich von 1:8 (1 CPU pro 8 GPUs) auf 1:4 verändert und könnten in Zukunft sogar 1:1 werden – der CPU erhält somit endlich mehr Bedeutung.

#### 2. Die drei Giganten kämpfen um den Markt

  • NVIDIA: Hat seinen eigenen CPU „Vera“ entwickelt, dessen Ziel nicht der Preiswettbewerb mit AMD und Intel ist, sondern zu verhindern, dass externe CPUs die Leistung der GPUs einschränken. Vera ist speziell auf die Koordination von Agenten optimiert und soll die Effizienz der eigenen GPUs steigern; zudem möchte NVIDIA in den 20-Milliarden-Dollar-Segment des CPU-Marktes eindringen (Jeff Huang bezeichnet dies als das nächste „Milliarden-Dollar-Geschäftsfeld“). Vera wurde bereits an Unternehmen wie OpenAI und Anthropic geliefert.
  • AMD: Setzt auf den Prozessor „Venice“ – den ersten hochleistungsfähigen Chip der Branche, der in 2-Nanometer-Technologie massenproduziert wird – sowie auf den „Verano“, um den hohen Speicherbedarf von Agenten zu decken. Im vierten Quartal 2025 stieg der Umsatz im Datacenter-Geschäft von AMD um 39 % auf Rekordwerte von 5,4 Milliarden Dollar.
  • Intel: Dank der Massenproduktion der „Xeon 6“ und „Core 3“ stieg der Nettogewinn im ersten Quartal 2026 um 156 %. Allerdings reichen die Kapazitäten nicht aus, um den Bedarf zu decken; der CEO sagt: „Der Markt ist noch nicht vollständig bedient“, und das Wachstum wird auch im nächsten Jahr anhalten.

#### 3. Warum fehlt plötzlich CPU-Kapazität?

  • Plötzlicher Anstieg der Nachfrage: Die neuen Anforderungen durch Agenten haben die jährliche Wachstumsrate des CPU-Marktes von einstelligen Prozent auf über 35 % gesteigert.
  • Konkurrenz um Fertigungskapazitäten: Chipfabriken (z. B. TSMC) bevorzugen lukrativere GPU-Aufträge, wodurch die CPU-Produktionskapazitäten eingeschränkt werden.
  • Speicherknappheit verschärft die Situation: Aufgrund einer globalen Speicherknappheit kaufen Kunden CPUs im Voraus, um Preiserhöhungen zu vermeiden, was die Versorgung weiter belastet.
  • Konsequenzen: Die Lieferzeiten für einige Intel-Server-CPUs dauern bis zu 6 Monate; einige AMD-Produkte sind 8–10 Wochen erhältlich. In China stiegen die Preise für Intel-Server-CPUs um 10 % (China macht 20 % des Umsatzes aus).

#### 4. Der Durchschnittsbürger ist betroffen: Das nächste Computergerät könnte teurer werden

Da der Großteil der Produktionskapazitäten für Server-CPUs genutzt wird, werden die Produktionslinien für den Verbrauchersektor (Personen-Computer, kleine Unternehmen) in den Hintergrund gedrängt. Lieferanten bevorzugen Kunden mit höheren Angeboten (z. B. Cloud-Anbieter), wodurch die Preise für normale Nutzer steigen. Kurz gesagt: Je beliebter AI wird, desto höher könnte der Preis für Computer werden – schließlich wird die Produktionskapazität von der AI-Branche in Anspruch genommen.

#### 5. Der „Eimer-Effekt“ der AI-Rechenleistung: Jeder fehlende Baustein ist entscheidend

Heute geht es bei der AI-Rechenleistung nicht mehr nur um GPUs; auch CPU, Speicher, Hochbandbreitennetze und effiziente Kühlsysteme sind wichtige Faktoren. Es ist wie mit einem Eimer, in den Wasser gefüllt wird – das schwächste Teil bestimmt die Gesamtkapazität. Selbst starke GPUs nützen nichts, wenn der CPU nicht mithalten kann; die Umsetzung von AGI (Allgemeiner Künstlicher Intelligenz) hängt letztendlich von einer umfassenden Infrastruktur ab – nicht nur von einzelnen Chips.

Diese Nachricht zeigt, dass sich die AI-Branche wieder auf die grundlegenden Hardwarekomponenten konzentriert: Auch fortschrittliche Technologien benötigen eine solide Rechenleistungsbasis. Die Rückkehr des CPUs ist der beste Beweis dafür.