虎嗅

„Alt Huang will den PC neu erfinden – die ganze Internetgemeinschaft diskutiert über die Preisgestaltung. NVIDIA und Microsoft arbeiten zusammen: Kommt das dünnste, leistungsstärkste Notebook der Welt?“

原文:老黄要重新发明PC,全网热议定价,英伟达微软联手,地表最强轻薄本要来了?

Zusammenfassung der Kerninhalte

NVIDIA hat sich mit Microsoft zusammengetan, um mit einem Superchip namens RTX Spark den PC „neu zu erfinden“: Sie bringen Rechenleistung auf Datenzentren-Ebene in leichte Notebooks und ermöglichen es so, große Modelle mit bis zu 120 Milliarden Parametern lokal auszuführen. Zudem wurde die Vera CPU speziell für AI-Agenten entwickelt, um die Grundlage der Rechenleistung in Datenzentren zu erneuern. Außerdem wurde eine „Betriebssysteme für AI-Agenten“ mit vier Softwareschichten aufgebaut, die es den Nutzern ermöglicht, von „Helfern“ zu „Befehlshabern“, die AI arbeiten lassen. Diese Veränderung stellt nicht nur die seit 40 Jahren dominierende x86-Plattform von Intel und AMD in Frage, sondern soll auch den PC in einen 24/7-AI-Partner verwandeln. Bis zum Jahresende werden Marken wie ASUS und Dell entsprechende Produkte auf den Markt bringen; die Preise sind jedoch noch nicht bekannt, was zu heftigen Diskussionen unter den Nutzern geführt hat.

Detaillierte Analyse

#### 1. Rechenleistung aus Datenzentren in leichte Notebooks – Wie stark ist der RTX Spark?

Frühere PCs nutzten separate CPU- und GPU-Speicher, wodurch beim Ausführen großer Modelle Daten häufig hin- und her übertragen werden mussten, was zu Verzögerungen führte. Der RTX Spark beseitigt diese Einschränkung: CPU und GPU teilen einen gemeinsamen Speicherpool von 128 GB, wodurch die Bandbreite um das Zehnfache höher ist. Dadurch können Modelle mit bis zu 120 Milliarden Parametern lokal und offline ausgeführt werden – das entspricht etwa der Lektüre des gesamten „Trisolaris“-Buchs auf einmal. Zudem müssen keine privaten Daten in die Cloud übertragen werden.

Besonders bemerkenswert ist auch die Allround-Fähigkeit des Chips: Obwohl er auf der Arm-Architektur basiert, ist er zu 100 % mit Windows und CUDA (einem weit verbreiteten Entwicklertoolsatz) kompatibel. Spiele können in 1440p-Auflösung und mit 100 Bildern pro Sekunde ausgeführt werden, die AI-Funktionen von Adobe-Programmen wurden verdoppelt, und 90 GB große 3D-Szenen sowie 12K-Videos lassen sich auch in leichten Notebooks ohne Stromanschluss flüssig bearbeiten. Im Herbst dieses Jahres werden Marken wie ASUS und Lenovo Notebooks mit einer Dicke von nur 14 mm auf den Markt bringen – das ist das erste Mal seit 40 Jahren, dass Windows-PCs ein „neues Gehirn“ erhalten.

#### 2. Die CPU für die Arbeit mit AI – Wie effizient ist die Vera CPU?

Herkömmliche CPUs wurden für Menschen entwickelt (langsame Reaktionszeiten, Abrechnung nach Kernteilchen). Für AI-Agenten sind jedoch Nanosekunden-Spezifikationen erforderlich; herkömmliche CPUs werden dabei zum „hemmenden Faktor“ für die GPU. Die NVIDIA Vera CPU ist die erste CPU, die speziell für AI-Agenten entwickelt wurde:

  • Hohe Einzelkernleistung: Jeder Taktzyklus kann 10 Befehle verarbeiten (Weltrekord); die Kommunikationsgeschwindigkeit der 88 Kerne ist um 50 % schneller als bei herkömmlichen CPUs.
  • Hohe Energieeffizienz: SQL-Berechnungen werden dreimal so schnell ausgeführt wie auf x86-Systemen, und die Rechenleistung für Echtzeit-Flussverarbeitung ist sechsmal höher – zudem wird weniger Strom verbraucht.
  • Ausgeklügelte Plattform: Das Vera Rubin-Racksystem ist vollständig flüssig gekühlt und kabellos; die Montagezeit wurde von 2 Stunden auf 5 Minuten reduziert, und die Produktionskapazität ist das Doppelte der vorherigen Generation.

Dies bedeutet, dass der „Dirigent“ des Datenzentrums (die CPU) endlich mit dem „Orchester“ (der GPU) Schritt halten kann – die Effizienz der AI-Fabriken steigt damit erheblich.

#### 3. AI-Agenten als Computer-Verwalter – Wie schließt NVIDIA die Zukunft ab?

Hartware ist nur die Grundlage; NVIDIAS wahre Ambition besteht darin, ein „Betriebssystem für AI-Agenten“ zu entwickeln. Früher mussten Menschen Software selbst bedienen; heute übernehmen die Agenten diese Aufgaben: Sie rufen automatisch Programme wie Rhino zum Zeichnen oder Blender zur Rendering-Ausführung auf und koordinieren die Arbeit zwischen verschiedenen Anwendungen.

Um Entwickler an das System zu binden, stellt NVIDIA vier Werkzeuge bereit:

  • Modellebene: Das offene Nemotron 3 Ultra-Modell mit 550 Milliarden Parametern ermöglicht eine fünffach schnellere Inference und reduziert die Kosten um 30 %.
  • Framework-Ebene: Unterstützt direkt beliebte AI-Agenten wie Claude Code.
  • Tool-Ebene: Tausende von CUDA-Geschwindigkeitsverbesserungsbibliotheken mit integrierten „Fähigkeiten“, die sofort einsetzbar sind.
  • Sicherheitsebene: Die OpenShell-Sandbox schützt vor Risiken und dämpft private Daten.

Zum Beispiel kann ein mit Cadence entwickelter Chip-Agent automatisch Simulationen durchführen, Fehler beheben und die Validierungszeiten von Wochen auf Stunden verkürzen. In Zukunft könnte man über die Windows-Taschebenstufe lokale AI-Agenten aufrufen, um E-Mails zu schreiben oder das Smart Home zu steuern – sobald diese Technologie etabliert ist, werden Entwickler Schwierigkeiten haben, ohne sie auszukommen.

#### 4. Wen betrifft diese Veränderung?

  • Intel und AMD sind besorgt: Die seit 40 Jahren dominierende x86-Architektur wird direkt von RTX Spark (Arm) und der Vera CPU herausgefordert; sowohl die „Gehirne“ von PCs als auch von Datenzentren müssen erneuert werden.
  • Die Nutzer werden fauler: Sie müssen keine komplizierten Programme mehr lernen; sie geben einfach ihre Anforderungen vor, und der Computer erledigt die Arbeit für sie.
  • Die Richtung der Branche ändert sich: Der PC ist nicht mehr nur ein Werkzeug für Menschen, sondern wird zu einem AI-Partner – wer das AI-Ecosystem kontrolliert, kontrolliert die Zukunft.

Manche kritisieren, dass diese Entwicklung nicht so spektakulär sei wie die des iPhones; doch das iPhone veränderte die Beziehung zwischen Mensch und Gerät. NVIDIA hingegen verändert die Frage „Wer ist der Herr über das Gerät“: In Zukunft werden die AI-Agenten im Computer mehr über Software wissen als der Nutzer selbst – man muss nur Befehle geben.

#### 5. Wie hoch werden die Preise sein?

Die Nutzer sind sich uneinig; NVIDIA hält die Preisinformationen zurück. Als Referenz dienen ähnliche Konfigurationen:

  • Leichte Notebooks: Die Einbaukosten des RTX Spark sind nicht niedrig; sie könnten über 10.000 Euro betragen, da das Gerät große Modelle ausführen kann.
  • Workstations: Versionen mit bis zu 768 GB Speicher könnten mehrere Male so teuer sein wie herkömmliche Workstations.
  • Desktop-AI-Systeme: 24/7-verfügbare Systeme wären zwar teurer als leichte Notebooks, aber günstiger als herkömmliche Workstations.

Unabhängig davon ist dieser AI-PC, der Rechenleistung aus Datenzentren in ein handliches Gerät bringt, eines der am meisten erwarteten Technologieprodukte dieses Jahres.

Fazit

NVIDIA setzt mit Chips, CPUs und einem umfassenden Ecosystem die seit 40 Jahren geltende Logik der PCs auf den Kopf – in Zukunft wird Ihr Computer nicht mehr nur ein Werkzeug sein, sondern ein AI-Partner, der Ihre Aufgaben übernimmt. Der Preis ist noch unbekannt; lassen Sie uns gerne in den Kommentaren Ihre Schätzungen abgeben!