虎嗅

El término nuevo “harness” que todos comentan en el ámbito de la IA no es tan misterioso como parece.

原文:AI圈都在说的新词harness,没你想的那么神秘

Resumen del contenido central

El término “Harness Engineering”, que ha cobrado popularidad recientemente en el ámbito de la IA, no es más que una denominación para lo que todos han estado haciendo desde hace tiempo: proporcionar a los modelos de IA un conjunto de “restricciones” (reglas, herramientas, mecanismos de verificación, etc.) para evitar que cometan errores repetidamente, en lugar de tener que corregirlos cada vez de forma ad hoc. Este término ha ganado notoriedad porque ofrece una denominación común a estas prácticas y señala que el efecto inicial de las sugerencias utilizadas para guiar al modelo (el llamado “bónus de las palabras clave”) ya ha disminuido; estudios demuestran que el entorno externo en el que opera el modelo puede influir significativamente en su rendimiento, hasta en un 60%. Esto indica un cambio en el enfoque del sector de la IA, que deja de centrarse en comparar la capacidad de los modelos entre sí para enfocarse en cómo cada uno cuenta con un conjunto más efectivo de restricciones. Incluso las personas no especializadas pueden comenzar a aplicar estas técnicas, siempre y cuando logren resolver los problemas de repetición en el comportamiento del AI.

Desglose detallado

1. ¿Qué es realmente el “Harness Engineering”? En lenguaje sencillo: darle a un modelo de IA unas “restricciones” para que no actúe de manera errática

El término “Harness” proviene de los arreos y la silla de montar de los caballos, y en el ámbito de la IA se refiere al conjunto de sistemas que sirven para guiar el comportamiento del modelo.

  • ¿Qué es un modelo de IA? Es como un caballo fuerte pero descontrolado (por ejemplo, GPT o Claude): tiene inteligencia, pero carece de regulación y tiende a cometer errores (como entrar en un campo de vegetales o perderse).
  • ¿Qué hace el “Harness”? Se trata de un conjunto de instrucciones, listas de verificación automática y sistemas de alerta que indican al modelo qué puede y no puede hacer, y que le permiten corregirse por sí mismo si comete errores.
  • Lógica fundamental: El modelo se encarga de “saber cómo hacer las cosas” (tener la capacidad de razonar y generar resultados), mientras que el “Harness” se asegura de que lo haga de manera correcta (según las reglas establecidas, sin repetir errores).

2. Cómo distinguir si algo es realmente un ejemplo de “Harness Engineering”: ¿Se trata de una solución temporal o de una medida permanente?

Es importante diferenciar entre medidas paliativas y soluciones duraderas:

  • No es un ejemplo de Harness Engineering: Si correges un error del modelo de manera improvisada durante una conversación (por ejemplo, diciéndole “Esta vez no uses paréntesis cuadrados”), es probable que el mismo error se repita en otra ocasión; esto solo resuelve el problema inmediato.
  • Es un ejemplo de Harness Engineering: Si incorporas la solución en el entorno de funcionamiento del modelo (por ejemplo, instrucciones personalizadas para ChatGPT que exigen el uso de caracteres chinos completos en las citas), o si compartes documentos corporativos que el modelo pueda consultar en cada ocasión, o si estableces procesos de verificación automáticos; esto resuelve el problema de manera permanente.

Escenarios comunes: Crear instrucciones personalizadas para el modelo, cargar bases de datos con información útil, configurar flujos de trabajo automatizados o crear plantillas de agentes inteligentes son ejemplos de aplicaciones del “Harness Engineering”.

3. ¿Por qué ha cobrado tanta popularidad en el ámbito de la IA? Tres razones clave

  • Existe ahora una denominación común: Aunque todos llevaban haciendo estas cosas, no había un término unificado; con el surgimiento de “Harness Engineering”, todo queda más claro.
  • El efecto inicial de las palabras clave ha disminuido: Antes, la competencia se centraba en cómo diseñar las sugerencias para guiar al modelo; ahora, el éxito de las aplicaciones de IA complejas (como asistentes de programación o flujos de trabajo autónomos) depende del entorno en el que operan, no solo de las palabras clave utilizadas.
  • Los datos lo demuestran: Estudios de Stanford y Tsinghua han demostrado que, para el mismo modelo, diferentes configuraciones de “Harness” pueden generar diferencias significativas en su rendimiento: el mismo modelo puede funcionar casi inutilmente con un diseño inadecuado o alcanzar un nivel cercano al humano con uno adecuado.

4. ¿Está a punto de cambiar completamente el sector de la IA? En el futuro, lo que se comparará no será tanto los modelos en sí, sino la calidad de las restricciones que les impone cada entorno.

Antes, la competencia se basaba en qué modelo utilizar (GPT-4 o Claude); ahora, los modelos son cada vez más similares entre sí (baratos, con capacidades parecidas y sustituibles). La competitividad se desplaza hacia cómo se diseñan estas restricciones, lo que convierte en un aspecto exclusivo para cada empresa o individuo. Quien logre construir un “Harness” más eficiente podrá hacer que su IA sea más productiva y menos propensa a cometer errores.

5. ¿Cómo pueden las personas no especializadas comenzar a aplicar estas técnicas? Recuerda este paso clave

No es necesario conocer código ni entender los principios detrás de los modelos de IA. La próxima vez que el modelo cometa el mismo error, en lugar de corregirlo de manera improvisada, piensa en cómo incorporar la solución en su entorno de funcionamiento:

  • Por ejemplo: Agrega reglas a las instrucciones personalizadas del modelo.
  • Por ejemplo: Carga los manuales de uso del producto en una base de datos para que el modelo los consulte cada vez que responde a una pregunta.
  • Por ejemplo: Utiliza herramientas para establecer procesos de verificación automáticos (por ejemplo, comprobar automáticamente el formato de los resultados generados por el modelo).

El objetivo es evitar que el modelo repita los mismos errores y convertir tu experiencia en reglas automatizadas que guíen su comportamiento.

Conclusión

El “Harness Engineering” no es algo nuevo; simplemente proporciona una forma estructurada de evitar que los modelos de IA cometan errores repetidamente. El mayor aumento de eficiencia en la era de la IA radica en hacer que estos sistemas aprendan de sus propios errores y eviten repetirlos.