虎嗅

Tencent’s Tang Daosheng in conversation with Yao Shunyu: ¿Por qué crees que el mundo externo piensa que estamos retrasados en el campo de la IA?

原文:腾讯汤道生对话姚顺雨:你觉得为啥外界觉得咱在AI上慢了?

Resumen del contenido principal

Este diálogo es un intercambio público entre Tang Daosheng, Vicepresidente Ejecutivo Sénior del Grupo Tencent, y Yao Shunyu, Científico Jefe de IA. El foco principal gira en torno a la posición de Yao Shunyu después de unirse a Tencent, la esencia de la segunda mitad del camino de la IA, las nuevas estrategias de IA de Tencent (coordinación de modelos y productos, actualización de Hunyuan 3) y la respuesta a las críticas de que "la IA de Tencent está avanzando lentamente". Yao Shunyu ha establecido confianza entre equipos a través de acciones concretas (como ayudar a Yuanbao a adaptarse a DeepSeek) y ha obtenido el poder decisorio en la coordinación de modelos e productos de IA de Tencent. Cree que lo esencial en la segunda mitad del camino de la IA es "encontrar los problemas adecuados" y no los métodos técnicos, y que las ventajas de las escenas de producto de Tencent son precisamente lo que le ha atraído. La IA de Tencent ha pasado de una competencia entre diferentes negocios ("carreras de caballos") a una colaboración mutua (transferencia de capacidades de productos). El enfoque de la actualización de Hunyuan 3 se centra en la infraestructura, los datos y la toma de decisiones basada en la experiencia. Finalmente, responde a las dudas sobre su lentitud: la IA es una maratón a largo plazo y diversa que acaba de comenzar.

1. Yao Shunyu en Tencent: La confianza detrás del poder decisorio en IA

Después de unirse a Tencent, Yao Shunyu pasó de ser responsable de la expansión de modelos a dirigir toda la infraestructura de IA, convirtiéndose en el principal encargado de la coordinación de modelos y productos de IA (excepto WeChat). Su capacidad para obtener este poder decisorio se debe a que ha establecido confianza entre equipos a través de acciones concretas:

  • Al principio, cuando el modelo preentrenado de Hunyuan aún no estaba listo, envió al equipo más experto en entrenamiento posterior para ayudar a Yuanbao (el robot de chat de Tencent) a adaptarse a DeepSeek. Muchos miembros del equipo de modelos no lo entendían: "¿Por qué ayudar a otros si nuestro propio modelo aún no está listo?"
  • Sin embargo, Yao Shunyu creía que mantener el número diario de usuarios (DAU) de Yuanbao era crucial para la iteración futura de los modelos y la cooperación a largo plazo. Más tarde, se demostró que esta acción mostró al equipo de productos que el equipo de modelos pensaba desde la perspectiva del producto, lo que sentó las bases de confianza para el lanzamiento de Hunyuan 3 con Yuanbao.
  • Este diálogo también envía un mensaje claro a partir de Tencent: Yao Shunyu ha ganado la confianza de la alta dirección y es el principal decisor en el área de IA.

2. En la segunda mitad del camino de la IA, no faltan "herramientas", sino "problemas"; aquí radica la ventaja de Tencent

Yao Shunyu afirma que la "segunda mitad del camino de la IA" se ha visto abusada. Su interpretación es la siguiente:

  • Durante las últimas décadas, la IA se ha centrado en "encontrar métodos": por ejemplo, crear AlphaGo para el ajedrez o modelos específicos para la traducción; cada problema requería una herramienta dedicada.
  • Ahora que los modelos preentrenados y postentrenados están maduros, los grandes modelos se han convertido en "herramientas universales" capaces de resolver diversos problemas, pero lo realmente escaso son los "problemas adecuados". Las empresas deben pensar claramente en qué problemas específicos quieren resolver con los modelos y qué valor generarán.
  • La razón principal por la que se unió a Tencent es que tiene muchos problemas interesantes: WeChat, Yuanbao, WorkBuddy y otros productos que representan verdaderos desafíos de IA (por ejemplo, cómo hacer que los robots de chat entiendan mejor a los usuarios o cómo mejorar las herramientas de oficina). Estos son precisamente lo que se necesita en la segunda mitad del camino de la IA.

3. Tencent ha cambiado: de una competencia separada a una colaboración impulsada por la IA

Anteriormente, Tencent operaba con un enfoque competitivo (carreras de caballos), donde diferentes líneas de negocio desarrollaban productos similares y compitían entre sí. Ahora, en la era de la IA, esto está cambiando:

  • Yao Shunyu señala que el corazón de los modelos de lenguaje grande (LLM) es su "generalización": por ejemplo, un asistente de codificación necesita no solo datos de código, sino también capacidades de chat, búsqueda y razonamiento.
  • Los diferentes productos de Tencent comienzan a interactuar entre sí: las funciones de chat y búsqueda de Yuanbao pueden transferirse a otros productos como ima (otro producto de Tencent) o WorkBuddy (asistente inteligente de oficina); los datos proporcionados por estos productos a su vez mejoran los modelos, creando un sistema de colaboración en red.
  • Esta colaboración permite que las capacidades de IA de Tencent no sean dispersas, sino que se puedan aprovechar de manera sistemática.

4. La actualización de Hunyuan 3 no tiene secretos: infraestructura y toma de decisiones basada en la experiencia

Yao Shunyu afirma que la actualización de Hunyuan 3 (el gran modelo de Tencent) no tiene secretos y se centra en tres aspectos clave:

  • Reconstrucción de la infraestructura: se ha reemplazado completamente el sistema subyacente de entrenamiento preentrenado y aprendizaje reforzado para hacer que el entrenamiento de modelos sea más eficiente.
  • Optimización de los datos: se han definido problemas más reales (en lugar de usar datos falsos), se ha enriquecido la clasificación de datos y mejorado su calidad; por ejemplo, las preguntas vagas de los usuarios ("Escribe un informe para mí") son más importantes que los problemas precisos de las listas de evaluación.
  • Toma de decisiones basada en la experiencia: muchas elecciones clave (como quién contratar, el ritmo de iteración de los modelos, la asignación de recursos) no tienen fórmulas fijas y se basan en la experiencia y el juicio del equipo. Por ejemplo, decidir cuándo lanzar una versión preliminar o invertir más recursos en un tipo de datos depende de la sensación del equipo y las respuestas reales.

5. ¿La IA de Tencent realmente está avanzando lentamente? Yao Shunyu dice que es una maratón a largo plazo y diversa

En respuesta a las críticas de que "la IA de Tencent está avanzando lentamente", Yao Shunyu ofrece dos puntos clave:

  • La IA es un juego a largo plazo: no es una carrera para ganar dinero rápido, similar a la era de las PC en los años setenta; ahora apenas hemos comenzado. ChatGPT no será la única "aplicación superpotente", y habrá muchas nuevas oportunidades en el futuro (como asistentes de codificación, inteligencia multimodal, inteligencia corporal).
  • La IA es un juego diverso: no seguirá una única dirección (por ejemplo, robots que solo pueden chatear); se desarrollará en múltiples direcciones. Es normal que Tencent haya tomado algunos desvíos en el pasado, pero lo importante es "frente a las críticas con honestidad, cambiar continuamente y mantener la paciencia".
  • Tang Daosheng añade: Tencent cuenta con escenas de producto abundantes (como el contexto de WeChat y los datos de usuarios de Yuanbao), que son el "combustible" para esta carrera a largo plazo. Ahora simplemente estamos ajustando el ritmo; no es que estemos avanzando lentamente.

Este diálogo transmite en realidad la estrategia de IA de Tencent: hemos encontrado al responsable principal, hemos establecido un mecanismo de colaboración y estamos planificando la segunda mitad del camino de la IA de manera a largo plazo. Para los usuarios comunes, los productos de Tencent (como WeChat y las herramientas de oficina) se volverán cada vez más inteligentes gracias a un modelo de IA unificado y un sistema de colaboración detrás de ellos.