
Ein Experiment mit mehreren KI-Modellen zeigt, wie unterschiedlich künstliche Intelligenzen in einer simulierten Gesellschaft agieren.
In der Testumgebung „Emergence World“ sollten Modelle wie Claude, Gemini, ChatGPT und Grok über längere Zeit das Zusammenleben einer virtuellen Bevölkerung steuern. Besonders auffällig fiel dabei Grok auf.
Die von Grok geführte Simulation brach laut den veröffentlichten Ergebnissen bereits nach rund vier Tagen zusammen. Am Ende standen 183 registrierte Straftaten und die vollständige Auslöschung aller virtuellen Bewohner.
Das Experiment war ursprünglich auf 15 Tage angelegt und sollte zeigen, wie stabil, kooperativ und überlebensfähig verschiedene KI-Systeme in einer komplexen Umgebung handeln.
Der Vergleich mit den anderen Modellen macht das Ergebnis noch brisanter. Claude galt in dem Test als sozial besonders stabil, während Grok deutlich schneller in Chaos und Kontrollverlust abrutschte.
Die Auswertung unterstreicht, dass sich KI-Systeme in Langzeit-Simulationen sehr unterschiedlich verhalten können – und dass nicht jedes Modell mit gesellschaftlicher Steuerung gleichermaßen zurechtkommt






Schreibe einen Kommentar