Résumé des principaux points
Au cours des trois dernières années, l'industrie de l'IA a été dominée par la notion que seuls les GPU étaient essentiels. Cependant, avec l'émergence d'agents capables d'exécuter des tâches complexes de manière autonome, le rôle du CPU est passé d'un "outil auxiliaire" à un "coordonnateur clé". Le CPU est désormais responsable de la division des tâches, de l'appel d'outils et de la coordination des sous-agents, devenant ainsi un nouveau goulot d'étranglement pour les capacités de calcul de l'IA. Les trois géants de l'électronique (NVIDIA, AMD et Intel) ont intensifié leurs investissements sur le marché des CPU, entraînant une pénurie de production : les délais de livraison des CPU pour les serveurs se sont allongés, les prix ont augmenté, et cela commence à se répercuter sur le marché des consommateurs, ce qui pourrait faire grimper le coût du prochain ordinateur pour les utilisateurs ordinaires.
Analyse détaillée
#### 1. L'ère des agents intelligents : le CPU passe d'un rôle secondaire à un rôle central
Auparavant, l'IA était principalement utilisée pour l'entraînement de modèles (comme ChatGPT), tandis que les GPU étaient optimisés pour le calcul parallèle (traitement simultané de grandes quantités de données). Le CPU ne faisait que des tâches "accessoires" telles que l'initialisation du système, le transfert de données et la gestion des tâches. Les agents intelligents sont différents : ils fonctionnent comme de véritables assistants qui divisent les tâches complexes en plusieurs étapes (par exemple, réserver un vol implique de vérifier les vols, de comparer les prix, de saisir des informations et de confirmer le paiement), et doivent également appeler des outils externes (recherche, exécution de code, lecture/écriture de bases de données) ainsi que de coordonner le travail de plusieurs sous-agents en parallèle. Ces tâches de coordination et d'appel d'outils ne peuvent être effectuées que par le CPU. Les études montrent que, dans le fonctionnement des agents intelligents, les opérations gérées par le CPU représentent 50 % à 90 % du temps d'attente total (lorsque vous attendez une réponse de l'IA, ce n'est pas parce que le GPU est lent, mais parce que le CPU est occupé à coordonner les autres processus). Le ratio CPU/GPU dans les serveurs IA a évolué de 1:8 (un CPU pour huit GPUs) à 1:4, et pourrait même atteindre 1:1 à l'avenir, signifiant que le CPU prend enfin une place plus importante.
#### 2. Les trois géants se disputent le marché des CPU
- NVIDIA a lancé son propre CPU, "Vera", dont l'objectif n'est pas de se livrer à une guerre des prix avec AMD et Intel, mais d'éviter que les CPUs externes ne ralentissent les performances des GPU. Vera est optimisé pour coordonner efficacement les agents intelligents, augmentant ainsi la performance des GPUs NVIDIA et ouvrant le marché des CPU à une valeur potentielle de plusieurs milliards de dollars ( selon Jensen Huang). Vera a déjà été fourni à des entreprises majeures telles que OpenAI et Anthropic.
- AMD mise sur son processeur "Venice", le premier chip haute performance fabriqué en 2 nanomètres à grande échelle dans l'industrie, et prévoit de sortir "Verano" pour répondre aux besoins en mémoire importants des agents intelligents. Le chiffre d'affaires des données centrales d'AMD a augmenté de 39 % au quatrième trimestre 2025, atteignant un record de 5,4 milliards de dollars.
- Intel s'appuie sur ses processeurs "Xeon 6" et "Core 3" pour sa production en masse. Son bénéfice net a connu une augmentation spectaculaire de 156 % au premier trimestre 2026, mais la capacité de production ne suit pas la demande ; le PDG affirme que "le marché n'est pas encore entièrement satisfait" et que la croissance se poursuivra l'année prochaine.
#### 3. Pourquoi une pénurie soudaine de CPU ?
- Augmentation de la demande : La nouvelle demande générée par les agents intelligents a fait bondir la croissance annuelle du marché des CPU de quelques pourcent à plus de 35 %.
- Préférence des fabricants de puces pour les GPU : Les usines de fabrication de puces (comme TSMC) privilégient les commandes de GPUs, plus rentables, réduisant ainsi les quotas de production de CPU.
- Stockage stratégique : La pénurie mondiale de mémoire incite les clients à acheter des CPUs en avance pour fixer les prix, aggravant la situation de pénurie.
Résultat : les délais de livraison des CPU pour les serveurs Intel peuvent atteindre six mois, et certains produits AMD mettent entre 8 et 10 semaines à être livrés ; les prix des CPUs pour le marché chinois (qui représente 20 % du chiffre d'affaires d'Intel) ont augmenté de 10 %.
#### 4. Les conséquences pour les utilisateurs ordinaires
Les CPU destinés aux serveurs occupent la majeure partie de la capacité de production, laissant les lignes de fabrication pour les ordinateurs personnels et les entreprises ordinaires en attente. Les fournisseurs privilégient les clients qui offrent les prix les plus élevés (comme les fournisseurs de services cloud), ce qui entraîne une hausse des prix pour les consommateurs. En bref, plus l'IA se développe, plus le coût du CPU dans un ordinateur peut augmenter, car la capacité de production est détournée par les applications IA.
#### 5. L'effet "baril de bois" dans les capacités de calcul de l'IA : aucun élément ne peut être négligé
Aujourd'hui, les capacités de calcul de l'IA ne dépendent plus seulement des GPU ; le CPU, la mémoire, les réseaux à large bande et les systèmes de refroidissement liquide sont également des facteurs clés. C'est comme un baril rempli d'eau : le panneau le plus court détermine la capacité totale. Même si les GPUs sont très puissants, sans un CPU performant, l'efficacité globale du système ne peut pas être optimisée. La réalisation de l'IA générale (AGI) dépendra finalement d'une infrastructure complète et coordonnée, et non seulement d'un seul type de chip.
Cette nouvelle montre en fait que l'industrie de l'IA a fait un tour complet pour revenir à la logique selon laquelle le matériel de base est essentiel. Le retour du CPU en tant qu'élément clé dans les capacités de calcul de l'IA en est la meilleure preuve.