虎嗅

¿Ha llegado el superagente de 1 mil millones de personas? ¿Por qué ChatGPT y Codex anunciaron oficialmente su unión en una sola noche?

原文:10亿人的超级Agent来了?一夜之间,ChatGPT与Codex为何官宣合体

Resumen del contenido principal

OpenAI ha anunciado recientemente la integración oficial de Codex (que originalmente era una herramienta para programadores) en ChatGPT, junto con tres importantes actualizaciones de funcionalidades: plugins exclusivos para seis tipos de puestos de trabajo, una función de comentarios que permite modificar directamente los contenidos generados por el AI, y la capacidad de generar sitios web compartibles con solo una frase. Esta integración no es simplemente una suma de funciones, sino un cambio estratégico de OpenAI: transformar a ChatGPT de un “consejero que solo sabe hablar” en un “colaborador capaz de realizar tareas prácticas”, con el objetivo de capturar la cuota del mercado de ofimática basada en IA y competir con Anthropic (su principal rival) por los escenarios de trabajo de mil millones de usuarios.

I. ¿Por qué ChatGPT tiene que “absorber” a Codex?

En resumen, hay tres razones principales: el cambio en la composición de los usuarios, la complementariedad de las capacidades y un reajuste en la dirección interna de OpenAI:

1. Los usuarios ya no son solo programadores: Codex era originalmente una herramienta para escribir código, pero ahora el 20% de sus usuarios no lo son (analistas, diseñadores, empleados de bancos de inversión, etc.), y la tasa de crecimiento de este grupo es tres veces mayor que la de los programadores. Estos usuarios lo utilizan no para escribir código, sino para crear tablas, analizar datos y realizar otras tareas ofimáticas, lo que indica que Codex se ha convertido en una herramienta de uso general.

2. ChatGPT no puede hacer todo lo que Codex puede: ChatGPT es como un “hablante” en la nube: puede conversar y crear textos, pero no puede acceder a los archivos del ordenador ni realizar tareas que requieren múltiples pasos (como consultar datos de tablas locales o generar PPTs). En cambio, Codex funciona localmente, puede leer y escribir archivos directamente y operar herramientas, lo que le otorga una mayor capacidad práctica.

3. Ha cambiado la persona a cargo en OpenAI: En mayo de este año, se fusionaron los equipos de desarrollo de ChatGPT y Codex; el responsable de Codex ahora dirige las actividades generales de ChatGPT, mientras que el equipo anterior se dedicó al desarrollo de soluciones empresariales. Por lo tanto, aunque parece que es ChatGPT quien ha absorbido a Codex, en realidad son las tecnologías y el enfoque de Codex los que guían el nuevo ChatGPT.

II. Las tres nuevas funcionalidades: hacer que el trabajo inteligente sea realmente útil

Estas tres funciones están diseñadas para que incluso las personas no especializadas puedan utilizar la IA con facilidad:

1. Plugins para seis tipos de puestos: Son como tener un nuevo colega que entiende los procesos de trabajo. Los primeros plugins cubren áreas como análisis de datos, creación de contenido creativo, ventas, diseño de productos, inversión en acciones y banca de inversión. Cada plugin incluye las herramientas y procedimientos específicos de cada puesto (por ejemplo, gestión de clientes con Salesforce o herramientas de diseño como Figma). Por ejemplo, si preguntas “¿Cuántas suscripciones se han cancelado recientemente?”, el plugin generará automáticamente un informe a partir de datos SQL y lo convertirá en un PPT. Esto que antes requería días de trabajo para el equipo creativo ahora se puede completar en minutos.

2. Función de comentarios: Permite modificar directamente los contenidos generados por el AI sin tener que reingresar toda la información. Antes, para cambiar cualquier parte del contenido generado por el AI, era necesario introducir todo el pedido nuevamente; ahora puedes seleccionar las partes que necesitas modificar (como conclusiones en un informe o gráficos en un PPT) y indicar cambios como “añadir una fuente de información” o “cambiar la fuente de tipo de letra”, y el AI solo modificará esas partes, manteniendo el resto intacto. Esto mejora significativamente la colaboración entre humanos y AI.

3. Generación de sitios web compartibles: Antes, los contenidos generados por la IA (como predicciones financieras o planes de productos) solo podían almacenarse en documentos o PPTs, lo que no era muy intuitivo. Ahora, con una sola frase, Codex puede generar un sitio web interactivo que puedes compartir fácilmente con tus colegas. Incluso quienes no son programadores pueden crear herramientas internas o pequeños sitios web por sí mismos, reduciendo así las barreras de entrada.

III. La competencia por el “lugar en tu escritorio”

El mercado de la ofimática basada en IA es muy importante, y Anthropic, el rival de OpenAI, ya ha comenzado a actuar:

  • Claude Code: La herramienta de programación de Anthropics tiene una buena reputación entre los desarrolladores, pero tiene restricciones de uso y es cara, lo que la hace poco práctica para un uso diario.
  • La estrategia de OpenAI: Consiste en “aplar su gran cantidad de usuarios”. Al integrar Codex en ChatGPT (que ya cuenta con casi mil millones de usuarios), los usuarios pueden utilizar sus funciones sin necesidad de descargar nada adicional. Además, Codex es más económico; para el mismo resultado, el costo de uso es solo un tercio del de Claude.

La clave de esta competencia es “quién se convierte en el asistente de trabajo AI por defecto” para los usuarios. OpenAI apuesta a que si los usuarios utilizan ChatGPT de manera habitual, no cambiarán a otras herramientas.

IV. La ambición final de OpenAI: hacer que la IA sea como un “practicante en tu escritorio”

OpenAI no se limita a fusionar dos herramientas; su objetivo es crear un “sistema operativo de trabajo integral” donde ChatGPT se encarga de comprender las necesidades del usuario a través de conversaciones y Codex de ejecutar las tareas. Se cree que, con la adición de una supuesta herramienta de navegación (que completaría la funcionalidad de manejo de sitios web), una sola aplicación podría abarcar todo desde la comunicación hasta la realización de tareas. Su objetivo es romper el monopolio de las grandes empresas en el valor de la IA (actualmente, el 74% del valor de la IA corresponde al 20% de las compañías) y permitir que pequeñas empresas y personas comunes también puedan utilizar la IA en su trabajo. En el futuro, ChatGPT podría dejar de ser simplemente un cuadro de diálogo para hacer preguntas para convertirse en un asistente que realiza las tareas por ti; incluso el nombre “Chat” podría perder importancia.

Conclusión

Esta actualización representa un paso crucial en la evolución de la IA, pasando de ser una herramienta de ayuda para el pensamiento a una herramienta para la ejecución directa de tareas. Para las personas comunes, podría significar que ya no sea necesario cambiar constantemente de una herramienta a otra en el trabajo diario: hacer preguntas, buscar datos, crear informes y compartir resultados todo puede ser gestionado por un único ChatGPT. Para la industria, la competencia en la ofimática basada en IA acaba de comenzar; aquellos que logren hacer que las funciones de ejecución sean más sencillas y económicas ganarán esta batalla por el control de los escenarios de trabajo.