Zeithorizont von Software-Aufgaben
die verschiedene KI-Modelle in 50% der Fälle lösen können
Aufgabendauer für Menschen, bei der eine logistische Regression eine 50%- bzw. 80%-Erfolgswahrscheinlichkeit vorhersagt
50% Erfolg
80% Erfolg
Geschätzt ⚠
Quelle: METR – Time Horizon 1.1 · ⚠ GPT-5.4 und Claude Sonnet 4.6: kein offizieller METR-Wert