Résumé des points clés :
Récemment, de nombreuses entreprises ont commis une grave erreur dans leur transformation vers l’IA : elles ont considéré la quantité de tokens utilisés par les systèmes IA comme un indicateur de performance (KPI) pour leurs employés, ce qui a conduit à des dépenses exorbitantes et inutiles (par exemple, une entreprise a consommé 500 millions de dollars en un mois ; Meta, Uber et MiHoYo ont également connu des incidents similaires). En revanche, les entreprises fournisseurs de modèles (comme Anthropic) et de puces (comme Nvidia) se sont enrichies grâce à ces dépenses. Amazon a été l’un des premiers à réaliser son erreur en supprimant le classement basé sur la quantité de tokens et en se concentrant plutôt sur les résultats concrets obtenus grâce à l’IA.
I. Les factures de tokens hors de contrôle : la faute d’une orientation axée sur les KPIs
Pour commencer, expliquons ce qu’est un token : on peut le considérer comme le “carburant” de l’IA. Chaque fois que l’IA traite du texte ou écrit du code, des tokens sont consommés, et plus la consommation est élevée, plus la facture est coûteuse.
Pourquoi ces dépenses deviennent-elles hors de contrôle ? La raison principale réside dans le fait que les entreprises utilisent la quantité de tokens comme KPI :
- Le patron d’une entreprise a donné à tous ses employés l’accès à Claude sans fixer de limite, ce qui a entraîné des tentatives répétées et des erreurs, coûtant 500 millions de dollars en un mois ;
- Meta a même créé un classement basé sur la consommation de tokens, avec un employé utilisant 28,1 milliards de tokens par mois, pour un coût de près de 500 000 dollars ;
- Les employés de MiHoYo ont créé plusieurs assistants IA pour leurs projets, consommant 2 millions de yuans en une seule nuit ;
- Uber a fourni des outils IA à 5 000 ingénieurs, épuisant ainsi le budget annuel pour 2026.
Pire encore, le modèle d’assistant IA est très coûteux : il nécessite de nombreuses étapes (réflexion, recherche d’informations, utilisation d’outils, lecture du contexte), ce qui entraîne une consommation de tokens 1000 fois supérieure à celle des interactions simples. En réalité, ces assistants IA “brûlent de l’argent” sans vraiment apporter de valeur.
II. Les entreprises fournisseurs profitent de vos dépenses
Les factures de tokens des entreprises utilisatrices deviennent une source de revenus pour les entreprises fournisseurs :
- Anthropic : ses revenus ont atteint 4,8 milliards de dollars au premier trimestre et devraient doubler au deuxième trimestre, grâce aux achats d’APIs et à l’utilisation du service Claude ;
- Nvidia : ses revenus ont augmenté de 8,16 milliards de dollars au dernier trimestre, car les systèmes IA nécessitent de nombreuses puces GPU ; plus il y a de consommation de tokens, plus la demande en GPUs augmente, ce qui profite fortement à Nvidia.
Ces entreprises présentent ces dépenses comme une preuve de leur “progrès technologique”, mais pour les utilisatrices, les tokens ne sont qu’un coût et non un atout. Seules les améliorations réelles dans les processus d’affaires rendent ces dépenses utiles.
III. Amazon supprime le classement basé sur les tokens
Amazon a initialement créé un classement appelé “KiroRank” qui mesurait la consommation de tokens par ingénieur, avec l’exigence que huit employés utilisent de l’IA chaque semaine. Cela a conduit à des comportements artificiels (utilisation inutile de l’IA juste pour améliorer les performances en apparence).
Finalement, Amazon a réalisé son erreur et a remplacé ce classement par un indicateur plus pertinent : le nombre d’implémentations standardisées d’IA. Derrière cela se trouve la “loi de Goodhart” : lorsqu’un indicateur devient un objectif à atteindre, il perd sa valeur réelle (autrefois, on se concentrait sur les heures de travail ; maintenant, c’est sur la consommation de tokens).
D’autres entreprises ont suivi cet exemple : Shopify a modifié son classement en un tableau de bord neutre avec des mécanismes de limitation des dépenses ; Duolingo a retiré l’évaluation basée sur l’IA ; Microsoft a réduit les autorisations pour les outils IA externes.
IV. L’efficacité réelle de l’IA ne réside pas dans la quantité de tokens, mais dans leur intégration aux processus d’affaires
De nombreuses entreprises comprennent mal la transformation vers l’IA : elles pensent que créer des comptes et consommer des tokens suffisent pour réussir. En réalité :
- Uber a constaté que l’utilisation de l’IA a augmenté, mais sans apporter de fonctionnalités plus utiles aux utilisateurs ;
- Selon GitClear, le taux de révision du code assisté par l’IA a doublé en deux semaines, tout en augmentant la quantité de code répétitif, ce qui ne fait que transférer l’inefficacité humaine vers une inefficacité plus coûteuse.
L’efficacité réelle de l’IA réside dans son intégration efficace aux processus d’affaires. Des entreprises comme OpenAI et Anthropic recrutent des ingénieurs spécialisés dans l’intégration de l’IA au sein des processus clients, afin que celle-ci résolve véritablement les problèmes.
Conclusion :
La transformation vers l’IA ne consiste pas à voir qui consomme le plus d’argent, mais à savoir comment utiliser l’IA pour améliorer réellement les performances de l’entreprise (raccourcir les processus, réduire les révisions, accélérer les livraisons). L’utilisation de tokens n’est qu’un aspect secondaire ; ce qui compte, c’est l’impact concret de l’IA sur les résultats commerciaux.
En résumé :
La transformation vers l’IA ne consiste pas à voir qui dépense le plus d’argent, mais à savoir comment utiliser l’IA pour résoudre le plus de problèmes. Ne laissez pas vos factures de tokens devenir de simples chiffres dans les rapports financiers des autres entreprises.