虎嗅

Tencent’s Tang Daosheng in conversation with Yao Shunyu: Why do you think the outside world thinks we are falling behind in AI?

原文:腾讯汤道生对话姚顺雨:你觉得为啥外界觉得咱在AI上慢了?

Résumé des points clés

Cette conversation entre Tang Daosheng, vice-président exécutif senior du groupe Tencent, et Yao Shunyu, scientifique en chef en IA, porte essentiellement sur le rôle de Yao Shunyu au sein de Tencent après son intégration, l'essence de la seconde moitié de la phase d'évolution de l'IA, les nouvelles stratégies d'IA de Tencent (coordination des modèles et des produits, mise à niveau de Hunyuan 3), ainsi que la réponse aux critiques selon lesquelles l'IA de Tencent serait en retard. Yao Shunyu a établi la confiance entre les équipes grâce à des actions concrètes (comme l'aide apportée à Yuanbao pour s'adapter à DeepSeek) et a obtenu le pouvoir de décision concernant la coordination des modèles et des produits d'IA de Tencent. Il estime que l'essentiel de la seconde moitié de cette phase réside dans la définition des bonnes problématiques, plutôt que dans les méthodologies techniques, et que l'avantage de Tencent réside justement dans ses scénarios d'utilisation de produits. L'IA de Tencent passe d'une approche concurrentielle (chacun des départements travaillant de manière indépendante) à une approche collaborative, où les capacités des produits se complètent mutuellement. Le point fort du mise à niveau de Hunyuan 3 repose sur l'infrastructure, les données et la prise de décision basée sur l'expérience. Enfin, il répond aux doutes concernant le retard de l'IA en soulignant que l'IA est un marathon à long terme et diversifié, qui ne fait que commencer.

1. Yao Shunyu chez Tencent : derrière son pouvoir de décision en IA, il y a la confiance

Après son arrivée chez Tencent, Yao Shunyu est passé de la responsabilité de l'extension des modèles à celle de toute l'infrastructure IA, devenant ainsi le responsable clé de la coordination des modèles et des produits d'IA (à l'exception de WeChat). Il a obtenu ce pouvoir grâce à des actions concrètes qui ont renforcé la confiance entre les équipes :

  • Au début, lorsque le modèle pré-entraîné de Hunyuan n'était pas prêt, il a envoyé l'équipe la plus compétente en retraitement d'entraînement aider Yuanbao (le robot de conversation de Tencent) à s'adapter à DeepSeek. Beaucoup de membres des équipes de modèles ne comprenaient pas pourquoi ils devaient aider un autre projet ;
  • Cependant, Yao Shunyu était convaincu que le maintien du nombre d'utilisateurs quotidiens (DAU) de Yuanbao était crucial pour les itérations futures des modèles et la coopération à long terme. Cette initiative a montré aux équipes de produits que l'équipe de modèles pensait du point de vue des utilisateurs, ce qui a jeté les bases de la confiance nécessaire au lancement de Hunyuan 3.
  • Cette conversation en elle-même envoie un signal fort à l'extérieur : Yao Shunyu a gagné la confiance de la direction et est considéré comme le décideur clé dans le domaine de l'IA.

2. La seconde moitié de l'IA manque pas d'outils, mais de bonnes problématiques ; l'avantage de Tencent réside là

Selon Yao Shunyu, la seconde moitié de l'ère de l'IA est caractérisée par un abus des outils. Il explique que :

  • Au cours des dernières décennies, l'IA consistait à trouver des solutions spécifiques pour chaque problème (par exemple, des modèles dédiés au jeu d'échecs ou à la traduction) ;
  • Aujourd'hui, avec le développement des modèles pré-entraînés et post-entraînés, ces outils sont devenus plus universels, mais ce qui manque vraiment, ce sont des problématiques pertinentes et bien définies. Les entreprises doivent clarifier quels problèmes ils souhaitent résoudre avec l'IA et quelles valeurs elles cherchent à créer ;
  • La raison principale de son arrivée chez Tencent est que l'entreprise dispose de nombreux scénarios d'utilisation potentiels (WeChat, Yuanbao, WorkBuddy), chacun représentant un véritable défi en termes d'IA.

3. Tencent a changé : de la concurrence indépendante à une collaboration guidée par l'IA

Auparavant, Tencent adoptait une approche concurrentielle, avec plusieurs départements développant des produits similaires (par exemple, plusieurs robots de conversation) sans coopération significative ; cependant, à l'ère de l'IA, les choses évoluent :

  • Yao Shunyu souligne que le cœur des modèles linguistiques larges (LLM) réside dans leur capacité à généraliser leurs fonctions (par exemple, un assistant de codage nécessite des données de code, mais aussi des capacités de conversation et de recherche). ;
  • Les différents produits de Tencent commencent à partager leurs ressources : les fonctionnalités de conversation et de recherche de Yuanbao peuvent être intégrées à d'autres produits comme ima ou WorkBuddy, et les données ainsi collectées peuvent améliorer les modèles, créant un système collaboratif ;
  • Cette collaboration permet à l'IA de Tencent de jouer son plein potentiel de manière plus systématique.

4. Le mise à niveau de Hunyuan 3 : pas de secrets, mais une approche axée sur l'infrastructure et les données

Yao Shunyu affirme que le mise à niveau de Hunyuan 3 ne cache aucun secret et repose sur trois éléments clés :

  • Réconstruction de l'infrastructure : réorganisation complète des systèmes sous-jacents pour l'entraînement des modèles, afin d'en améliorer l'efficacité ;
  • Optimization des données : définition de problématiques plus réalistes (utilisation de données réelles plutôt que de données de test), enrichissement des catégories de données et amélioration de la qualité des données (par exemple, les questions floues des utilisateurs sont plus importantes que les questions précises issues de tests standard) ;
  • Prise de décision basée sur l'expérience : de nombreuses décisions cruciales (recrutement, rythme d'itération des modèles, allocation des ressources) ne suivent pas de règles fixes ; elles sont basées sur l'expérience et le jugement des équipes.

5. L'IA de Tencent est-elle vraiment en retard ? C'est un marathon à long terme et diversifié

Face aux critiques selon lesquelles l'IA de Tencent serait en retard, Yao Shunyu souligne deux points :

  • L'IA est un projet à long terme : il ne s'agit pas d'une opportunité pour gagner rapidement de l'argent, comme c'était le cas avec les ordinateurs dans les années 70 ; ChatGPT n'est sûrement pas la seule application majeure du futur, et de nombreuses nouvelles opportunités émergeront (par exemple, des assistants de codage, des technologies multimodales, de l'intelligence incarnée) ;
  • L'IA est un domaine diversifié : il ne s'agira pas seulement d'une seule direction de développement (par exemple, des robots de conversation). Il est normal que Tencent ait emprunté des chemins détournés par le passé, mais l'important est de faire face honnêtement aux retours et de continuer à évoluer avec patience.
  • Tang Daosheng ajoute que les nombreux scénarios d'utilisation de Tencent (comme le contexte de WeChat ou les données des utilisateurs de Yuanbao) constituent un atout majeur pour l'IA, et que l'entreprise ajuste simplement son rythme de développement.

Cette conversation transmet clairement la stratégie d'IA de Tencent : nous avons identifié le responsable clé et mis en place une approche collaborative pour aborder la seconde moitié de l'évolution de l'IA de manière à long terme. Pour les utilisateurs finaux, les produits de Tencent (comme WeChat ou les outils de travail) deviendront de plus en plus intelligents, grâce à un modèle d'IA centralisé et à un système collaboratif efficace.