Itt az OpenAI GPT-5.1-Codex-Max modellje, amely egy 24 órás feladattal is megbirkózott

2025.11.20. 13:22 Horváth Péter

Az OpenAI új modellje most debütált a Codex-környezetben, és már az első mérések alapján érzékelhető, hogy a vállalat a kódolás jövőjét az agentic, azaz önállóan munkafolyamatokat fenntartó AI-rendszerek felé tolja.

Itt az OpenAI GPT-5.1-Codex-Max modellje, amely egy 24 órás feladattal is megbirkózott

A Codex-Max egyik leglátványosabb újítása az a képesség, hogy megszakítás nélkül, órákon át képes fenntartani egy projekt logikáját, és közben szelektíven tömöríti a már nem szükséges részleteket. Ez az úgynevezett compaction mechanizmus: a modell eldobja a zajt, és megtartja azt, ami a következő lépéshez valóban számít.

Ennek eredményeként belső tesztekben képes volt több mint 24 órán át futó, folyamatos refaktort, tesztvezérelt iterációt és hibakeresést végigvinni, anélkül hogy elvesztette volna a megkezdett munka láncolatát.

Ha többet akarsz tudni, kövess minket Facebookon!

A hosszú távú következetesség mellett hatékonyabban is gondolkodik: közepes gondolkodási erőfokon kb. 30 százalékkal kevesebb gondolkodási tokent használ, miközben a pontossága növekszik. Ez egyértelmű lépés a hatékonyabb, olcsóbb és rugalmasabb AI-kódolás irányába.

Erősebb minden fontos benchmarkon

Az OpenAI nem csak állította, hogy a Codex-Max jobban teljesít: a számok is ezt mutatják.

A legismertebb szoftvermérnöki benchmarkok alapján:

SWE-Bench Verified: 77,9% pontosság
Terminal-Bench 2.0: 58,1%
LiveCodeBench Pro: 2439 pont
SWE-Lancer IC SWE: 79,9%

Az eredmények különösen figyelemre méltók a Google frissen bemutatott Gemini 3 Pro modellje mellett, amelyet a szakma jelenleg az egyik legerősebb kódoló AI-nak tart. A Codex-Max több kulcsterületen megelőzi vagy beéri a Google legerősebb konfigurációját – még a „Deep Thinking” változatot is.

Ezek a különbségek nem látványos, de folyamatos és egyértelmű minőségi elmozdulások, amelyek a valós fejlesztési folyamatokban számítanak: stabilabb javítások, kevesebb új hiba, gyorsabb és koherensebb iterációk.

A Codex új arca: interaktív ügynök, nem csupán kódtár

A Codex-Max nem egy hagyományos nyelvi modell, hanem egy állapotot fenntartó munkatárs, amely képes átlátni egy repo egészét, követni a változásokat és új kódrészleteket illeszteni a meglévő rendszerekbe.

Ahol már most elérhető:

Codex CLI – OpenAI saját parancssori eszköze
IDE-kiegészítők – az OpenAI által karbantartott környezetek
Interaktív szimulációs terek – pl. CartPole, optikai demonstrátorok
Belső kódellenőrző rendszerek – az OpenAI mérnöki csapatainál

Külön érdekesség, hogy a modell valós időben képes együtt dolgozni szimulációkkal, vagyis megérti a változtatás hatását és reagál is rá. Ez nem csak kódolás, hanem a kóddal való „élő gondolkodás”.

Publikus API viszont még nincs. Ez „hamarosan” érkezik, addig a Codex CLI a fő hozzáférési út.

Biztonság: önálló, de nem felügyelet nélkül

A Codex-Max új biztonsági rétegeket is kapott. Az OpenAI álláspontja szerint nem éri el a vállalat „High” kiberbiztonsági képességküszöbét, de jelenleg ez a legfejlettebb biztonsági funkciókat használó modelljük a szoftverfejlesztési területen.

A fő korlátozások:

nincs hálózati hozzáférés alapértelmezésben
szigorú sandboxkörnyezet
új, viselkedéselemző monitorozás
automatikus megszakítás gyanús aktivitás esetén

A cél világos: a Codex-Max legyen erős, de ne váljon önjáró támadóeszközzé.

Az OpenAI szerint a cég mérnökeinek 95 százaléka használja heti rendszerességgel a Codexet, és a bevezetés óta nagyjából 70 százalékkal több pull request landol a belső repoikban. A fejlesztési ritmus gyorsult, a hibák gyorsabban kerülnek felszínre, és a nagy refaktorok is könnyebben haladnak.

A vállalat ugyanakkor hangsúlyozza: a Codex-Max nem helyettesít fejlesztőt. Inkább növeli a „sávszélességet”, és olyan monoton, hosszú távú munkákat vállal át, amelyek korábban napokat vittek el. A döntések továbbra is az ember kezében maradnak.

Merre tovább?

A GPT-5.1-Codex-Max a jelenlegi formájában nem pusztán egy újabb modell a sorban, hanem az OpenAI nyílt lépése afelé, hogy a fejlesztés folyamata egyre inkább ügynökszerű, hosszú távon konzisztens AI-munkával egészül ki.

Amint a publikus API megnyílik, a Codex-Max könnyen az év egyik legfontosabb fejlesztői eszközévé válhat – különösen azoknál, akik nagy, komplex rendszereket tartanak életben vagy építenek át.