虎嗅

Liang Wenfeng hat 50 Milliarden Yuan aufgenommen und beginnt nun mit umfangreichen Infrastrukturprojekten.

原文:融了500亿,梁文锋开始大搞基建了

Zusammenfassung der Kerninhalte

DeepSeek hat kürzlich eine Bewertung von 350 Milliarden Yuan erreicht und erstmals externe Kapitalgeber wie Tencent und Alibaba eingebunden. Das aufgebrachte Geld wird in zwei Richtungen investiert: die Errichtung einer eigenen, ultragroßen Recheninfrastruktur sowie die Produktisierung von Anwendungssoftware (insbesondere Tools für künstliche Intelligenz). Von der Rekrutierung von Ingenieuren für den Entwurf von Rechenzentren über die Wartung und Instandhaltung dieser Infrastruktur bis hin zur Gründung eines Entwicklungsteams, das auf Claude Code abzielt, zeigt DeepSeek sein Bestreben, nicht nur ein Unternehmen für KI-Modelle zu sein, sondern eine vollständige Wertekette von der Rechenleistung über die Anwendungen bis hin zum Endkunden zu schaffen.

I. Finanzierungswertung von 350 Milliarden Yuan: Woher kommt das Geld und wofür wird es verwendet?

Bisher finanzierte sich DeepSeek hauptsächlich aus eigenen Mitteln, erhielt jedoch kaum externe Investitionen. Mit der neuen Finanzierungswertung von 350 Milliarden Yuan (ca. 48 Milliarden US-Dollar) sind potenzielle Investoren wie Tencent und Alibaba an Bord. Wie wird das Geld eingesetzt? Die Rekrutierungsaktivitäten geben die Antwort: Die Hälfte des Geldes fließt in die Recheninfrastruktur, die andere Hälfte in die Produktisierung.

  • Recheninfrastruktur: Es werden Ingenieure für den Entwurf von Rechenzentren und Mitarbeiter für die Wartung dieser Infrastruktur eingestellt, um eigene, ultragroße Rechenzentren zu bauen.
  • Produktisierung: Ein Team wird gegründet, das Tools entwickelt, die auf Claude Code abzielen, um den Markt der Entwickler zu erobern.

II. Warum will ein Unternehmen für KI-Modelle die Geschäfte von Cloud-Anbietern übernehmen?

Die überraschendste Stelle in den Rekrutierungsaktivitäten ist die Position des „IDC-Designplanungingenieurs“ – dieser ist verantwortlich für den gesamten Bauprozess, von der Standortwahl über die Planung bis zur Umsetzung. Dies zeigt, dass DeepSeek nicht mehr damit zufrieden ist, Rechenzentren zu mieten, sondern selbst große Rechenzentren errichten möchte, die in der Größenordnung von 1 GW (1000 MW) liegen – das entspricht der Kapazität, um Tausende von GPUs gleichzeitig zu betreiben.

Warum baut man eigene Rechenzentren?

  • Mangelnde Auslastung durch Mieten: Das Training großer Modelle mit Billionen von Parametern erfordert enorme Rechenkapazitäten. Die Miete von Rechenzentren ist teuer und kann zu Engpässen führen (z. B. bei knappen GPU-Ressourcen, die bevorzugt von Cloud-Anbietern genutzt werden).
  • Geringere Kosten: Durch den Bau eigener Rechenzentren kann man Orte wie Ulanqab auswählen, wo das kühle Grasland eine effiziente Kühlung der Server ermöglicht und die Energieeffizienz (PUE) bei etwa 1,2 liegt – das sind mehr als 20 % weniger als in Großstädten.
  • Bessere Kontrolle: Man kann die Rechenzentren nach eigenen Bedürfnissen nutzen und so die Stabilität des Modelltrainings sowie zukünftiger Inferenzdienste sicherstellen.

III. Produktisierung: Die Gründung eines „Teams für künstliche Intelligenz-Tools“ zur Markteroberung

Während die Infrastrukturbauaktivitäten darauf abzielen, die Grundlagen zu schaffen, zielt die Entwicklung von Tools darauf ab, den Markt zu erobern. DeepSeek hat neue Positionen wie „Agent Harness-Produktmanager“ und Entwickler eingestellt und beauftragt erfahrene Forscher, Tools zu entwickeln, die auf Claude Code basieren (ein sehr beliebtes KI-Programmierwerkzeug).

Der Zweck dieser Maßnahme ist klar:

  • Differenzierung bei zunehmender Konvergenz der Modelle: Da die Grundfähigkeiten großer Modelle immer ähnlicher werden, muss man diese in nutzbare Tools umwandeln, um die Nutzer zu binden.
  • Eroberung der Entwicklergemeinschaft: Diese Tools helfen Entwicklern beim Programmieren und Fehlerbeheben – ähnlich wie GitHub Copilot. Indem DeepSeek die Entwickler für sich gewinnt, kann es seine Modelle in mehr Anwendungen integrieren und so eine eigene Ökologie schaffen.
  • Kommerzialisierung: Tools lassen sich leichter vermarkten (z. B. nach der Anzahl der Nutzung oder über Abonnements), was eine stabile Einnahmequelle bietet, im Gegensatz zum Verkauf von Modell-APIs.

IV. Der umfassende Ansatz von Liang Wenfeng: Vom Rechenzentrumbau bis zur Produktisierung

Liang Wenfeng, der Leiter von DeepSeek, ist bisher eher zurückhaltend aufgetreten, doch diese Rekrutierungsaktivitäten zeigen sein großes Ziel: Nicht nur als „Einzelakteur“ in einer bestimmten Phase agieren, sondern als Gigant, der die gesamte Wertekette von der Rechenleistung über die Anwendungen bis zum Endkunden kontrolliert.

  • Recheninfrastruktur: Um Engpässe zu beseitigen und genügend Rechenkapazität für das Training großer Modelle zu sichern.
  • Anwendungsentwicklung: Die Fähigkeiten der Modelle werden in nutzbare Tools umgewandelt, die direkt von den Nutzern genutzt werden können.
  • Langfristiges Ziel: Ein geschlossenes Ökosystem aus Rechenleistung, Modellen und Anwendungen zu schaffen – ähnlich wie OpenAI (Modelle), Microsoft Azure (Rechenleistung) und Copilot (Tools). DeepSeek möchte all diese Komponenten selbst bereitstellen.

Dieser „Asset-intensive“ Ansatz ist zwar kostspielig, aber wenn er erfolgreich ist, kann DeepSeek eine unüberwindbare Barriere im AI-Markt schaffen – schließlich können nicht alle Unternehmen Milliarden in den Bau von Rechenzentren investieren oder Modelle in nutzbare Tools umwandeln.

Fazit: DeepSeeks „kraftvolles Engagement“

Mit einer Bewertung von 350 Milliarden Yuan wagt DeepSeek etwas Risikoreiches, aber Notwendiges: Es versucht, sein Schicksal selbst in die Hand zu nehmen. Indem es sowohl die Recheninfrastruktur als auch die Anwendungen weiterentwickelt, möchte das Unternehmen zum „Full-Stack-Spieler“ im AI-Markt werden. Wenn es erfolgreich ist, könnte es zu einem führenden Akteur auf diesem Gebiet werden; sollte es scheitern, könnte es sein gesamtes Kapital verbrauchen. Doch Liang Wenfeng setzt auf die Zukunft – der Wettbewerb in der KI-Branche wird letztendlich um Rechenleistung und Ökosysteme entschieden.