Résumé des principales annonces
Lors de la conférence Build 2026, Microsoft a dévoilé toute une série de produits, notamment sa propre famille de modèles AI (MAI), du matériel hardware pour l'IA local (Surface RTX Spark Dev Box), une nouvelle forme d'Agent (Project Solara) et un outil de sécurité pour les agents d'entreprise (l'ensemble OpenClaw), afin de construire une écosystème AI complet couvrant les modèles, la puissance de calcul, les appareils, la sécurité et la gouvernance. L'objectif principal est de se défaire de sa dépendance excessive envers OpenAI, de passer d'une phase axée sur les bénéfices des modèles à une phase centrée sur les plateformes, de s'emparer de l'accès principal au marché de l'IA d'entreprise et de prouver qu'elle est le leader de l'ère de l'IA, et non simplement un fournisseur de services cloud pour OpenAI.
1. Modèles AI développés en interne : combler les lacunes de la chaîne d'approvisionnement et réduire la dépendance à un seul modèle
Auparavant, les capacités IA de Microsoft reposaient principalement sur OpenAI, mais maintenant l'entreprise a développé 7 modèles propres (couvrant l'inférence, le code, les images, la reconnaissance vocale, etc.), ce qui signifie qu'elle détient le « moteur central » de l'IA.
- Pourquoi développer en interne ? Les entreprises et les développeurs n'utilisent pas un seul modèle pour tout : par exemple, des modèles spécifiques sont nécessaires pour écrire du code ou traiter de longs documents, avec des exigences différentes en termes de coût, de vitesse et de performances. Microsoft souhaite offrir une « supérette de modèles » permettant aux utilisateurs de choisir celui qui leur convient le mieux, au lieu de dépendre uniquement d'OpenAI.
- Points forts des modèles :
- Le modèle d'inférence MAI Thinking 1 peut traiter des documents de 600 pages (256 K tokens) ; les données utilisées sont propres et conformes aux normes (sans contenu généré par l'IA) et il est optimisé pour les puces Maia, ce qui permet d'économiser 1,4 fois plus d'énergie.
- Le modèle de code MAI Code 1 Flash écrit mieux du code que Claude Haiku 4.5 (score de 51,2 % contre 35,2 % sur le SWE Bench Pro) et peut permettre à l'IA d'écrire ou de modifier automatiquement du code.
- Les modèles d'image/voix, tels que MAI Transcribe 1.5, sont jusqu'à 5 fois plus rapides que leurs concurrents pour la transcription, et MAI Voice 2 peut imiter votre voix (adaptation à des échantillons courts).
- Personnalisation pour les entreprises : Les entreprises peuvent entraîner leurs propres processus de travail (comme les étapes d'approbation ou les scripts de service client) dans ces modèles, afin que l'IA comprenne mieux leurs activités.
2. Matériel hardware pour l'IA local : transformer l'ordinateur en un assistant capable de travailler indépendamment
Auparavant, la plupart des tâches IA étaient exécutées dans le cloud, mais le Surface RTX Spark Dev Box propose une solution avec la puissance de calcul déplacée localement :
- Quelles sont les spécifications ? Une puissance de calcul AI de 1 petaflop (c'est-à-dire capable d'exécuter des modèles complexes localement), 20 cœurs CPU et 128 Go de mémoire, disponible à l'automne.
- Quelles possibilités ? Vous pouvez envoyer des instructions à votre ordinateur depuis n'importe où pour que l'agent IA localise modifie du code ou avance dans le processus de conception, puis continue les itérations à votre retour. L'ordinateur n'est plus seulement un outil à utiliser, mais un assistant capable de travailler de son propre chef.
- Convivialité pour les développeurs : Il est préinstallé avec une version optimisée de Windows 11 Pro et inclut des outils tels que VS Code et GitHub Copilot ; l'interface est simple (pas de fenêtres pop-up ou d'alertes) et l'expérience à la ligne de commande est proche de celle de Linux, ce qui facilite le débogage des modèles IA.
3. Project Solara : explorer de nouvelles formes d'interfaces pour l'ère des agents
Microsoft considère que les ordinateurs du futur ne seront pas des appareils isolés, mais un ensemble d'outils collaboratifs, et a présenté deux prototypes :
- Terminal de bureau : Fixé sur le bureau de travail, il utilise une puce MediaTek. Il reconnaît automatiquement l'utilisateur lorsqu'il s'en approche, affiche les tâches du jour et permet de demander à l'agent de les traiter par voix ou en appuyant sur des boutons ; il peut également se connecter à un ordinateur cloud. Il fonctionne comme un « centre de contrôle AI » pour les bureaux d'entreprise.
- Carte d'identité portative : Utilisant une puce Qualcomm, elle est adaptée aux scénarios mobiles. Par exemple, une infirmière peut l'utiliser pour enregistrer des informations sur les patients ou scanner des médicaments ; ou vous pouvez lui demander de prendre des photos sur place et l'agent choisira automatiquement la meilleure perspective ou de nettoyer l'image.
Ces prototypes ne sont pas des produits finaux, mais témoignent des recherches de Microsoft sur le type de matériel qui sera plus adapté aux besoins humains dans l'ère des agents.
4. L'ensemble OpenClaw : mettre en place des mesures de sécurité pour les agents personnels d'IA
L'un des principaux soucis lors de l'introduction d'agents IA personnels dans les entreprises est la sécurité (suppression de fichiers ou fuite de données). L'ensemble OpenClaw, développé en collaboration avec Peter Steinberger (père du « lobster computing »), vise à résoudre ce problème :
- Contrôle des droits détaillé : Vous pouvez spécifier quels répertoires l'agent peut accéder (lecture seule, écriture, cachage), s'il peut utiliser le presse-papiers ou se connecter au réseau. Lors de la démonstration, l'agent a tenté de supprimer un fichier du bureau, mais n'a pas réussi car ce dernier était configuré en lecture seule.
- Adaptation aux entreprises : Les entreprises peuvent intégrer leurs propres règles (comme les politiques de confidentialité des données) dans OpenClaw pour que l'agent fonctionne en toute sécurité au sein de l'entreprise et puisse être utilisé via Slack ou Teams.
Cela équivaut à mettre en place des mesures de sécurité strictes pour garantir que les agents IA soient utilisés de manière responsable.
5. Ambition de plateforme : passer des modèles aux systèmes pour s'emparer de l'accès principal au marché de l'IA d'entreprise
La stratégie de Microsoft ne se limite pas à des produits individuels ; elle vise à construire un « système d'exploitation AI » complet :
- Couverture complète du processus : Des modèles (MAI), de la puissance de calcul (matériel Surface), des outils de développement (GitHub Copilot, Raven SDK), de la gouvernance (Agent365) à la recherche scientifique (plateforme Discovery) et au calcul quantique (puce Majorana 2).
- Quel est l'objectif ? La première étape de l'IA a été dominée par des entreprises spécialisées dans les modèles (comme OpenAI), mais la deuxième étape sera dominée par les plateformes. Celui qui permettra aux entreprises d'utiliser et de gérer facilement l'IA gagnera. Microsoft souhaite devenir cette plateforme : le choix des modèles, l'affectation des tâches, les droits des agents et la surveillance de leur activité seront tous gérés par son système.
En somme, alors que Microsoft s'appuyait sur OpenAI pour accéder aux avantages de l'IA, elle cherche maintenant à devenir le leader de cette industrie en développant ses propres solutions.
Conclusion
Cette conférence marque la volonté de Microsoft de se positionner comme le protagoniste de l'écosystème AI, plutôt que simplement un acteur secondaire. Grâce à ses modèles développés en interne, à sa puissance de calcul locale, à ses nouveaux appareils et à ses outils de sécurité, l'entreprise cherche à prendre le contrôle de l'IA des mains des entreprises spécialisées dans les modèles pour en faire son propre marché. Pour les entreprises, l'utilisation de l'IA deviendra de plus en plus dépendante de ses systèmes ; pour les utilisateurs finaux, les ordinateurs et les appareils deviendront plus intelligents et capables d'aider davantage dans leurs tâches quotidiennes. Dans la « seconde phase » de l'IA, la compétition se jouera principalement sur les plateformes.