Résumé des points clés
Récemment, dans le domaine de l'intelligence incarnée (en d'autres termes, les robots capables de percevoir, de prendre des décisions et d'agir comme des humains), on a observé un phénomène où ceux qui vendent les outils nécessaires à la création des robots se sont enrichis avant même que ces derniers ne génèrent de bénéfices significatifs. En effet, bien que les robots eux-mêmes ne soient pas encore rentables à grande échelle, l'activité de collecte de données utilisées pour leur entraînement connaît un fort développement : de nombreuses entreprises spécialisées dans cette collecte ont reçu des investissements importants et de nombreux contrats, attirant l'attention de géants tels que Bosch et JD.com. Ce secteur est passé d'une activité annexée aux entreprises de robotique à une entité indépendante, valorisée par le capital. Derrière ce développement se trouvent des raisons telles qu'un manque important de données, une demande réelle et un soutien financier significatif. Actuellement, les acteurs du marché se divisent en trois catégories, et l'entrée de grands groupes modifie la logique du secteur. À l'avenir, la qualité et l'intégration des données seront déterminantes pour le succès final.
1. Pourquoi la collecte de données est-elle plus rentable que la fabrication des robots ?
Pour comprendre cela, il faut saisir l'importance des données dans le contexte de l'intelligence incarnée :
- Un manque énorme de données : les grands modèles linguistiques (comme GPT) disposent de dizaines d'années de textes en ligne pour leur apprentissage, tandis que les modèles destinés aux robots ont besoin de données issues des interactions avec le monde réel (par exemple, des trajectoires 3D lors de la manipulation d'objets ou de l'évitement d'obstacles). Ces données sont difficiles à obtenir et leur quantité mondiale est très limitée (moins d'un pour mille par rapport à celle utilisée par les grands modèles linguistiques). De plus, les formats des données varient d'un robot à l'autre et ne peuvent pas être partagés, accentuant le problème.
- Une demande urgente : tant les développeurs de modèles que les fabricants de robots sont prêts à payer cher pour ces données, car elles leur permettent de mettre rapidement en œuvre leurs produits et de s'imposer sur le marché. Par exemple, Bosch et CATL investissent massivement dans des entreprises de collecte de données en ouvrant leurs lignes de production aux robots pour recueillir des informations précieuses.
- Le capital se dirige vers l'amont de la chaîne d'approvisionnement : depuis 2026, le seuil d'investissement dans la fabrication des robots a augmenté (les entreprises leaderes sont évaluées à plusieurs milliards d'euros), rendant difficile l'accès pour les petites structures. Elles se tournent donc vers la collecte de données, considérée comme une option plus sûre que le développement de produits individuels.
Ces trois facteurs combinés ont permis à l'activité de collecte de données de devenir rentable plus rapidement que la fabrication des robots eux-mêmes.
2. Les acteurs du marché se divisent en trois catégories
Les entreprises spécialisées dans la collecte de données, celles qui séparent la production des robots de leur activité de collecte de données, et les géants transversaux ont chacun leurs stratégies distinctes :
- Entreprises spécialisées : elles ne fabriquent pas de robots mais se concentrent sur l'infrastructure nécessaire à la collecte de données. Par exemple, Guanglun Intelligence, fondée il y a seulement trois ans, est devenue le premier unicorn mondial dans ce domaine (évaluée à plus de 1 milliard de dollars) et a reçu 550 millions de dollars en investissements au premier trimestre. Ses clients incluent des entreprises comme Nvidia et ByteDance. D'autres entreprises, comme Wuwen Zhike, ont créé les plus grands centres d'entraînement physiques en Chine (couvrant des secteurs tels que la logistique et l'industrie), produisant des milliers d'heures de données par jour et attirant des investisseurs issus de domaines tels que l'énergie éolienne et le contrôle automobile.
- Entreprises qui séparent la production des robots de la collecte de données : elles ont créé des départements dédiés à cette activité. Par exemple, Zhuyuan Robot a scindé ses activités de collecte et de vente de données en une entité distincte, Meifeng Technology, qui a reçu des investissements de plusieurs centaines de millions de yuans en dix jours. Ce modèle permet aux entreprises de se concentrer sur la fabrication de robots tout en générant des revenus grâce à la collecte de données.
- Géants transversaux : ils entrent sur le marché en tirant parti de leurs connaissances dans leurs domaines d'activité. JD.com, par exemple, a mobilisé 600 000 personnes pour collecter 10 millions d'heures de données réelles en deux ans, utilisant ses propres infrastructures logistiques et de stockage. Baidu Smart Cloud propose un « supermarché de données pour l'intelligence incarnée », tandis que China Mobile a créé des centres d'entraînement pour les scénarios domestiques. Ces géants ne visent pas à prendre la place des petites entreprises, mais à construire des plateformes permettant aux entreprises de robotique d'accéder facilement aux données.
3. L'entrée de grands groupes comme JD.com modifie le secteur
L'arrivée de ces géants apporte deux changements majeurs :
- Effet de masse : JD.com dispose d'infrastructures logistiques et de stockage déjà en place, ce qui permet de collecter des quantités de données considérables rapidement, réduisant ainsi les coûts pour les entreprises de robotique.
- Vers une approche plateformée : des initiatives comme le « supermarché de données » de Baidu et les infrastructures complètes de JD.com transforment les données en produits standardisés. Les petites entreprises n'auront plus besoin de créer leurs propres équipes de collecte de données, pouvant simplement acheter celles nécessaires via des plateformes (tout comme elles utilisent le cloud computing aujourd'hui). Cela incite les startups à se positionner soit en tant que fournisseurs de données, soit en tant que développeurs d'outils pour la gestion de ces données, soit en s'intégrant profondément dans leurs scénarios d'activité.
4. Le futur du secteur dépendra de la qualité et de l'intégration des données
Le succès final de ce marché ne dépendra pas de la quantité de données collectées, mais plutôt de deux facteurs :
- Pouvoir décider des normes de qualité : des entreprises comme CATL et Bosch sélectionnent leurs partenaires en fonction de la qualité des données fournies (par exemple, des données d'exactitude industrielle vérifiées dans des conditions réelles). Ceux qui pourront définir les standards de qualité des données contrôleront l'avenir du secteur.
- Capacité à intégrer les données : si les données provenant de sources diverses (collecte réelle, simulation, données fournies par les utilisateurs finaux) peuvent être harmonisées, elles deviendront des actifs clés pour l'ère de l'intelligence artificielle. À l'avenir, ceux qui posséderont ces données domineront le secteur.
En somme, ce ne sont peut-être pas les robots eux-mêmes qui changeront la face de l'intelligence incarnée, mais plutôt les données qui les alimentent et qui seront à l'origine de son développement.