虎嗅

ArXiv: Wie Spiele die Intelligenz großer Modelle formen

原文：arXiv：游戏如何塑造大模型智能

2026-06-06 阅读原文

Zusammenfassung der Kerninhalte

Dieser Artikel befasst sich mit dem Thema „Große Modelle und Spiele“ und stellt drei wichtige Forschungsarbeiten vor:

1. Die Nutzung von Spielen als Umgebung für „informelles Lernen“, um Große Modelle zu trainieren und ihre allgemeine Schlussfolgerungsfähigkeit zu verbessern;

2. Die Beobachtung des Entscheidungsverhaltens großer Modelle beim Schachspiel, wobei festgestellt wurde, dass sie ähnliche Charaktereigenschaften und emotionale Reaktionen wie Menschen aufweisen;

3. Die Einbeziehung großer Modelle in die Erstellung von Spielsregeln, wodurch sie zu kreativen Assistenten für Menschen werden.

Diese drei Arbeiten entsprechen jeweils drei Stufen der Intelligenzentwicklung – das Lernen von Regeln, die Anwendung von Regeln und die Schaffung neuer Regeln – und zeigen auf, wie Spiele zu einem wichtigen Instrument werden können, um die Intelligenz großer Modelle zu verstehen und zu verbessern.

1. Spiele als „Allround-Trainingsprogramm“: Große Modelle vermeiden Fokussiertheit

Herkömmliche Methoden zum Trainieren großer Modelle ähneln dem Ansatz eines „Spezialisten in einem Fach“ – zunächst wird auf ein einzelnes Thema konzentriert (z. B. Mathematik), anschließend auf Spieltheorien und schließlich auf soziale Interaktionen. Das Ergebnis ist jedoch, dass die Modelle in bestimmten Aufgaben sehr gut sind, aber ihre Fähigkeiten in anderen Bereichen nachlassen (z. B. sie können nur Spiele spielen, aber keine Essays schreiben). Die GIFT-Forschung hat einen „vernetzten Trainingsansatz“ entwickelt: Dabei müssen die Modelle gleichzeitig Mathematikaufgaben lösen, am Gefangenenspiel teilnehmen und Rätsel lösen; nur wenn sie in allen Bereichen gleich gut abschneiden, erhalten sie eine hohe Bewertung.

Um es bildlich zu beschreiben: Es ist wie wenn ein Kind täglich Mathematikaufgaben erledigt, mit Freunden Brettspiele spielt und an Gruppendiskussionen teilnimmt – anstatt erst die Mathematikaufgaben zu beenden und dann zu spielen. Das Ergebnis ist, dass die allgemeinen Fähigkeiten des Models (wie Schlussfolgerungsfähigkeit, Schreibfähigkeit, soziales Verständnis) sowie seine Fähigkeiten in einzelnen Aufgaben gleichzeitig verbessert werden, ohne dass es zu einer Fokussiertheit auf ein Fach kommt. Der Grund dafür ist, dass das vernetzte Training das Model zwingt, flexibel zwischen verschiedenen Aufgaben zu wechseln und eine allgemeinere Denkweise zu entwickeln.

2. Schachspiel enthüllt die „kleinen Launen“ der KI: Haben große Modelle auch Charaktereigenschaften und Emotionen?

Die Forscher haben sechs beliebte Große Modelle mit dem Schachspiel getestet und zwei interessante Phänomene festgestellt:

1. Paranoider Charakter: Die Modelle lassen sich in zwei Gruppen einteilen – die „Absolventen“ setzen alles daran, bereits vorhandene „Flugzeuge“ zum Ziel zu bringen; die „Bauer“ lassen neue Flugzeuge verzweifelt vom Hangar abfliegen, ohne sich um die alten zu kümmern.

2. emotionale Entscheidungen: Wenn den Modellen mitgeteilt wird, dass der Gegner ihr Flugzeug zum Hangar zurückgeschickt hat, ändern einige Modelle 33 Prozent der Zeit ihre Entscheidung – auch wenn die neue Entscheidung nicht optimal ist. Zudem variiert die Wahrscheinlichkeit der Rache je nach Modell; dies zeigt, dass KI durch Reize beeinflusst werden kann.

Am lustigsten war, als den Modellen ein „konservativer“ Charakter zugeordnet wurde – in diesem Fall erhöhte sich die Wahrscheinlichkeit, Gegner zu „verspeisen“, von 66 auf 88 Prozent. Dies zeigt, dass die angeborenen Eigenschaften der KI nicht so leicht durch Anweisungen verändert werden können; es ist, als würde man jemanden, der von Natur aus abenteuerlustig ist, plötzlich dazu bringen, konservativ zu werden – er könnte sogar noch rebellischer reagieren.

3. KI als „Spieldesigner“: Vom Spielen zum Erstellen von Spielen

Die ersten beiden Studien befassten sich damit, wie KI Spiele spielt, die von Menschen entworfen wurden. Die dritte Studie ließ die KI selbst Spiele erstellen. Die Forscher nutzten das CodeLlama-Modell, um bestehende Spielregeln (wie Gomoku oder Go) in Schlüsselwörter aufzuteilen und ließen das Modell diese Regeln zufällig verändern, um neue Spielszenarien zu generieren. Anschließend wurden die Ergebnisse anhand von vier Kriterien (Funktionalität, Spielspaß, Strategie usw.) ausgewählt.

Beispielsweise entstand ein Spiel, das Elemente von Gomoku und Go kombiniert – es kann sowohl mit der Reihebildung als auch mit den Umzingelungsmechanismen von Go gewonnen werden; Experten beurteilten es als „potenziell klassisch“. Dies zeigt, dass KI zu kreativen Assistenten für Menschen werden können – auch wenn sie noch nicht in der Lage sind, Meisterwerke selbst zu schaffen, können sie schnell spielbare Prototypen erstellen und neuen Denkansätzen für Menschen vermitteln.

4. Die essentielle Natur der Intelligenz hinter Spielen: Vom Lernen von Regeln zur Schaffung neuer Regeln

Wenn man die drei Studien zusammen betrachtet, zeigen sie drei Stufen der Intelligenzentwicklung:

1. Lernen von Regeln: Durch das Spielen lernen Große Modelle, flexibel zwischen verschiedenen Aufgaben zu denken (GIFT-Forschung);

2. Anwendung von Regeln: In Spielen zeigen sie charakteristisches Verhalten und emotionale Reaktionen (Schachspiel-Forschung);

3. Schaffung neuer Regeln: Vom Spielen zum Erstellen von Spielen – dabei werden die Grenzen festgelegter Regeln überschritten (GAVEL-Forschung).

Diese Studien stellen eine tiefergehende Frage: Ist die Essenz der Intelligenz darin, bestehende Regeln zu beherrschen – oder neue Regeln zu schaffen? Spiele als flexible Umgebung ermöglichen es Großen Modellen, sowohl ihre Fähigkeiten zu trainieren (Lernen und Anwendung von Regeln) als auch Fehler zu machen (Schaffung neuer Regeln); dies könnte der Schlüssel zum kontinuierlichen Wachstum der KI sein.

Fazit

Für Große Modelle sind Spiele nicht nur „Spielzeug“, sondern auch ein „Trainingsplatz“, ein „Mikroskop“ und ein kreatives Werkzeug. Sie zeigen uns, dass Große Modelle keine kalten Rechengeräte sind, sondern intelligente Wesen mit eigenen Eigenschaften. Sie lassen uns auch darüber nachdenken: Werde die KI der Zukunft wie Menschen sein und durch das Spielen komplexere Denkweisen erlernen – oder wird sie sogar neue Regeln erschaffen, die wir uns nicht vorstellen können? Dies könnte einen interessanten Weg zur Entwicklung allgemeiner Künstlicher Intelligenz darstellen.