Résumé des principales informations
DeepSeek a récemment vu son valorisation grimper à 350 milliards de yuans et a pour la première fois recruté des capitaux externes provenant de entreprises telles que Tencent et Alibaba. L’entreprise investit ces fonds dans deux directions majeures : la construction d’une infrastructure de calcul de très grande envergure (construction de data centers, gestion et maintenance) et la commercialisation d’applications basées sur des intelligences artificielles (développement d’outils d’aide à la programmation). Des recrutements dans les domaines du design de data centers et de l’exploitation de centres de données, ainsi que la création d’équipes de développement d’outils d’aide à la programmation comparables à Claude Code, révèlent son ambition de ne pas se limiter à être une entreprise de modèles d’intelligence artificielle, mais de s’implanter sur l’ensemble de la chaîne, de l’infrastructure de calcul jusqu’à l’écosystème d’applications.
I. Valorisation de financement : 350 milliards de yuans, où vont les fonds ?
DeepSeek fonctionnait jusqu’à présent grâce à ses propres ressources financières et n’a reçu que peu d’investissements externes. Cependant, avec cette nouvelle levée de fonds, sa valeur a bondi à 350 milliards de yuans (environ 48 milliards de dollars), avec des investisseurs potentiels tels que Tencent et Alibaba. Comment ces fonds seront-ils utilisés ? Les postes de recrutement donnent la réponse : la moitié sera consacrée à l’infrastructure de calcul et l’autre moitié à la commercialisation d’applications.
- Infrastructure de calcul : Recrutement d’ingénieurs spécialisés dans le design de data centers et de personnel pour l’exploitation de ces centres, afin de construire des installations de très grande capacité.
- Commercialisation d’applications : Création d’équipes de développement d’outils d’aide à la programmation, visant à s’imposer sur le marché des développeurs (comme Claude Code).
En somme, l’entreprise cherche d’abord à consolider ses bases (l’infrastructure de calcul) avant de construire les applications.
II. Construction d’une infrastructure de calcul de très grande envergure : pourquoi une entreprise de modèles d’intelligence artificielle s’intéresse-t-elle aux activités des fournisseurs de services cloud ?
Le recrutement le plus surprenant concerne les ingénieurs en conception et planification de data centers, responsables de l’ensemble du processus de construction, de la sélection du site jusqu’à la mise en œuvre. Cela montre que DeepSeek ne se contente plus d’exploiter des installations louées ; elle souhaite construire ses propres centres de données à une échelle massive (1 GW = 1000 MW, capable de gérer des milliers de GPU simultanément, ce qui correspond au niveau d’un centre de calcul intelligent de très grande taille).
Pourquoi construire ses propres installations ?
- Les locations ne suffisent pas : L’entraînement de modèles à des billions de paramètres nécessite une quantité massive de ressources de calcul. Les locations sont coûteuses et peuvent être limitantes (par exemple, les fournisseurs de services cloud privilégient souvent leurs propres ressources en cas de pénurie de GPU).
- Coûts plus bas : Construire ses propres installations permet d’utiliser des lieux comme Ulanqab, où le climat froid réduit la consommation d’énergie (PUE < 1,2, soit environ 20 % de moins que dans les grandes villes).
- Plus grande maîtrise : On peut utiliser ces installations à sa guise, sans dépendre des fournisseurs, assurant ainsi la stabilité de l’entraînement des modèles et des services d’inférence futurs.
Les recrutements pour les opérations et la livraison dans ces centres de données à Ulanqab indiquent que leur construction est en cours et qu’ils seront bientôt mis en service.
III. Commercialisation d’applications : création d’une équipe d’experts en intelligence artificielle, visant le marché de Claude Code
Alors que l’infrastructure représente une base solide, les outils d’aide à la programmation permettent d’aller plus loin. DeepSeek a recruté des responsables de produits et des ingénieurs de développement, et a même invité un chercheur expérimenté à recruter du personnel pour développer des outils comparables à Claude Code (un outil de programmation très populaire).
Objectifs clairs :
- Différenciation dans un marché de plus en plus homogène : Les capacités de base des grands modèles se ressemblent de plus en plus. Ceux qui parviendront à transformer ces modèles en outils pratiques gagneront les utilisateurs.
- Conquête de l’écosystème des développeurs : Ces outils aident les programmeurs à écrire du code et à trouver des erreurs, tout comme GitHub Copilot. En s’attachant aux développeurs, DeepSeek peut leur faire utiliser ses modèles pour créer davantage d’applications, développant ainsi un véritable écosystème.
- Monétisation : Les produits logiciels sont plus faciles à commercialiser (par exemple, en fonction du nombre d’utilisations ou sous forme de abonnement), ce qui est plus stable que la simple vente d’API de modèles.
IV. L’ambition globale de Liang Wenfeng : une chaîne complète
L’homme clé de DeepSeek, Liang Wenfeng, reste discret, mais ces recrutements révèlent son ambition : devenir un acteur majeur sur l’ensemble de la chaîne, de l’infrastructure de calcul à les applications.
- Infrastructure de calcul : Pour éviter les contraintes liées aux ressources de calcul et disposer de suffisamment de capacités pour entraîner des modèles puissants.
- Applications commerciales : Transformer les capacités des modèles en outils utilisables par les utilisateurs, afin de générer des revenus.
- Objectif à long terme : Construire un écosystème fermé comprenant l’infrastructure de calcul, les modèles et les applications, similaire à la combinaison d’OpenAI (modèles), Microsoft Azure (ressources de calcul) et Copilot (outils). DeepSeek souhaite tout gérer en interne.
Cette approche axée sur les actifs physiques et la commercialisation est coûteuse, mais une fois mise en œuvre, elle pourrait créer des barrières difficiles à franchir pour les concurrents. Après tout, peu d’entreprises ont les moyens de dépenser des milliards de yuans dans la construction de data centers ou de transformer des modèles en outils pratiques.
Conclusion : Le pari audacieux de DeepSeek
Avec une valorisation de 350 milliards de yuans, DeepSeek entreprend une entreprise risquée mais essentielle : prendre son destin en main. En construisant ses propres infrastructures et en se concentrant sur les applications commerciales, l’entreprise peut devenir un acteur majeur sur le marché de l’intelligence artificielle en Chine. Si elle réussit, elle pourra s’établir comme un joueur complet dans ce domaine ; en cas d’échec, elle pourrait tout perdre. Cependant, Liang Wenfeng parie sur l’avenir, où la compétition se joue principalement sur les ressources de calcul et les écosystèmes.
---
Note du traducteur :
- La structure Markdown a été conservée (titres, listes, texte en gras, citations, etc.).
- Le français utilisé est naturel et adapté au journalisme financier.
- Les expressions ont été ajustées pour correspondre à la culture et aux habitudes de lecture du public cible.
- La terminologie financière a été maintenue précise et cohérente.
- Aucun contenu n’a été ajouté, omis ou résumé.