虎嗅

Der neue Begriff „harness“ im Bereich KI wird in der Branche viel diskutiert – aber er ist nicht so geheimnisvoll, wie man vielleicht denkt.

原文:AI圈都在说的新词harness,没你想的那么神秘

Zusammenfassung des Kerninhalts

Das kürzlich in der AI-Szene sehr beliebte Konzept „Harness Engineering“ ist eigentlich etwas, das bereits seit längerem praktiziert wird: Man legt AI-Modellen eine Art „Gestell“ an – bestehend aus Regeln, Werkzeugen und Überprüfmechanismen –, um zu verhindern, dass sie immer wieder die gleichen Fehler machen. Der plötzliche Erfolg dieses Begriffs liegt darin, dass er all den bisherigen Bemühungen einen einheitlichen Namen gibt und darauf hinweist, dass der „Vorteil“ der speziellen Hinweisformulierungen („Prompt-Designs“) abgenommen hat. Studien haben gezeigt, dass die Umgebung, in der die Modelle betrieben werden, ihre Leistung um das Sechsfache beeinflussen kann. Dies markiert einen Wandel im Fokus der AI-Branche: Es geht nicht mehr darum, welche Modelle am stärksten oder leistungsfähigsten sind, sondern darum, wer die besten „Gestelle“ für diese Modelle entwickelt. Auch Laien können damit beginnen, solange sie die Probleme mit den wiederholten Fehlern der AI lösen.

Detaillierte Erklärung

1. „Harness Engineering“ im einfachen Sprachstil: Man legt dem AI ein „Gestell an“, damit es nicht wild herumläuft

„Harness“ bezeichnet ursprünglich das Zaumzeug und die Sattel eines Pferdes; in der AI-Szene wird damit ein umfassendes System zur Steuerung von AI-Modellen beschrieben.

Was ist ein Modell? Ein Modell ist wie ein starkes, aber unkontrolliertes Pferd (z. B. GPT oder Claude): Es verfügt über Intelligenz, aber keine Regeln und macht leicht Fehler (z. B. stürzt in einen Gemüsegarten oder läuft weg).

Was ist ein „Harness“? Es handelt sich dabei um eine Art „Anweisungsbuch für das Modell“, ergänzt durch automatische Überprüfungen und Warnsysteme, die dem AI mitteilen, was es tun darf und was nicht, sowie wie es Fehler selbst korrigieren kann.

Kernlogik: Das Modell ist dafür verantwortlich, Dinge zu „tun“ (z. B. Schlussfolgerungen zu ziehen), während das „Harness“ sicherstellt, dass dies richtig geschieht (z. B. gemäß festen Regeln).

2. Einfaches Kriterium, um zu erkennen, ob es sich um „Harness Engineering“ handelt: Handelt es sich um eine vorübergehende Korrektur oder um feste Regelungen?

Es wird unterschieden zwischen kurzfristigen Lösungen und dauerhaften Verbesserungen:

Nicht „Harness Engineering“: Wenn man einen Fehler des AI-Modells nachträglich korrigiert (z. B. „Verwende dieses Mal keine eckigen Klammern“), kann das Modell beim nächsten Mal wieder den gleichen Fehler machen – das behebt nur den aktuellen Problemfall.

„Harness Engineering“: Wenn man die Lösung in die Betriebsumgebung des AI-Modells einbaut (z. B. spezielle Anweisungen für ChatGPT oder die Verwendung von chinesischen Zeichensätzen), oder wenn man automatische Überprüfungsmechanismen einrichtet, löst man das Problem dauerhaft.

Typische Anwendungen: Die Erstellung eigener Anweisungen, das Hochladen von Wissensbasen, die Einrichtung automatischer Arbeitsabläufe sowie die Entwicklung intelligenter Agenten sind Beispiele für „Harness Engineering“.

3. Warum ist „Harness Engineering“ plötzlich so beliebt? Drei Hauptgründe:

Einheitlicher Begriff: Bislang gab es keine einheitliche Bezeichnung für diese Praktiken; nun kann jeder damit arbeiten.

Der Vorteil der speziellen Hinweisformulierungen ist abgenommen: Früher ging es darum, die beste Formulierung von Hinweisen zu finden; heute hängt der Erfolg komplexer AI-Anwendungen (z. B. Programmierhilfen oder automatischer Arbeitsabläufe) eher von der Umgebung ab als von einzelnen Hinweisformulierungen.

Ergebnisse von Studien: Untersuchungen an der Stanford- und Tsinghua-Universität haben gezeigt, dass derselbe AI-Modell mit unterschiedlichen „Harnesses“-Konstruktionen um das Sechsfache leistungsfähiger sein kann – das Modell selbst hat sich nicht verändert, nur die Umgebung.

4. Wird sich die AI-Branche grundlegend ändern? In Zukunft geht es nicht mehr darum, welche Modelle verwendet werden, sondern darum, wie gut die „Gestelle“ für diese Modelle sind

Früher wurde verglichen, welches Modell am besten ist (z. B. GPT-4 oder Claude); heute gleichen sich die Modelle zunehmend in ihren Funktionen – sie sind günstig, leistungsfähig und austauschbar.

Der Wandel der Kernkompetenz: Der Fokus verlagert sich von den verwendeten Modellen auf die Art und Weise, wie diese Modelle eingesetzt werden – das ist etwas, das privat gehalten werden kann und nicht einfach nachgeahmt werden kann. Unternehmen und Einzelpersonen, die gute „Gestelle“ entwickeln, können AI effizienter einsetzen und Fehler reduzieren.

5. Wie können Laien damit beginnen? Denken Sie an diese eine Sache:

Sie müssen kein Code schreiben oder die Funktionsweise von AI-Modellen verstehen. Wenn das AI-System denselben Fehler zweimal macht, korrigieren Sie ihn nicht mehr nachträglich, sondern überlegen Sie, wie Sie die Lösung in die Betriebsumgebung des Modells einbauen können:

– Fügen Sie Regeln zu den speziellen Anweisungen für ChatGPT hinzu.

– Laden Sie Produktanleitungen in Wissensbasen, damit das AI-System diese bei jeder Antwort berücksichtigt.

– Nutzen Sie Werkzeuge, um automatische Überprüfungsprozesse einzurichten (z. B. automatische Formatüberprüfungen nach der Ausgabe des Modells).

Das Ziel ist es, zu verhindern, dass das AI-System immer wieder die gleichen Fehler macht – und Ihre Erfahrungen in „automatische Regeln“ für das System umzuwandeln.

Fazit

„Harness Engineering“ ist nichts Neues; es handelt sich dabei lediglich um eine methodische Herangehensweise, um zu verhindern, dass AI-Systeme immer wieder die gleichen Fehler machen. Der größte Effizienzgewinn in der AI-Zeit besteht darin, dem AI beizubringen, aus Fehlern zu lernen.