Itt az OpenAI GPT-5.1-Codex-Max modellje, amely egy 24 órás feladattal is megbirkózott

Az OpenAI új modellje most debütált a Codex-környezetben, és már az első mérések alapján érzékelhető, hogy a vállalat a kódolás jövőjét az agentic, azaz önállóan munkafolyamatokat fenntartó AI-rendszerek felé tolja.

A Codex-Max egyik leglátványosabb újítása az a képesség, hogy megszakítás nélkül, órákon át képes fenntartani egy projekt logikáját, és közben szelektíven tömöríti a már nem szükséges részleteket. Ez az úgynevezett compaction mechanizmus: a modell eldobja a zajt, és megtartja azt, ami a következő lépéshez valóban számít.

Ha többet akarsz tudni, kövess minket Facebookon!

Ennek eredményeként belső tesztekben képes volt több mint 24 órán át futó, folyamatos refaktort, tesztvezérelt iterációt és hibakeresést végigvinni, anélkül hogy elvesztette volna a megkezdett munka láncolatát.

A hosszú távú következetesség mellett hatékonyabban is gondolkodik: közepes gondolkodási erőfokon kb. 30 százalékkal kevesebb gondolkodási tokent használ, miközben a pontossága növekszik. Ez egyértelmű lépés a hatékonyabb, olcsóbb és rugalmasabb AI-kódolás irányába.

Erősebb minden fontos benchmarkon

Az OpenAI nem csak állította, hogy a Codex-Max jobban teljesít: a számok is ezt mutatják.

A legismertebb szoftvermérnöki benchmarkok alapján:

  • SWE-Bench Verified: 77,9% pontosság
  • Terminal-Bench 2.0: 58,1%
  • LiveCodeBench Pro: 2439 pont
  • SWE-Lancer IC SWE: 79,9%

Az eredmények különösen figyelemre méltók a Google frissen bemutatott Gemini 3 Pro modellje mellett, amelyet a szakma jelenleg az egyik legerősebb kódoló AI-nak tart. A Codex-Max több kulcsterületen megelőzi vagy beéri a Google legerősebb konfigurációját – még a „Deep Thinking” változatot is.

Ezek a különbségek nem látványos, de folyamatos és egyértelmű minőségi elmozdulások, amelyek a valós fejlesztési folyamatokban számítanak: stabilabb javítások, kevesebb új hiba, gyorsabb és koherensebb iterációk.

A Codex új arca: interaktív ügynök, nem csupán kódtár

A Codex-Max nem egy hagyományos nyelvi modell, hanem egy állapotot fenntartó munkatárs, amely képes átlátni egy repo egészét, követni a változásokat és új kódrészleteket illeszteni a meglévő rendszerekbe.

Ahol már most elérhető:

  • Codex CLI – OpenAI saját parancssori eszköze
  • IDE-kiegészítők – az OpenAI által karbantartott környezetek
  • Interaktív szimulációs terek – pl. CartPole, optikai demonstrátorok
  • Belső kódellenőrző rendszerek – az OpenAI mérnöki csapatainál

Külön érdekesség, hogy a modell valós időben képes együtt dolgozni szimulációkkal, vagyis megérti a változtatás hatását és reagál is rá. Ez nem csak kódolás, hanem a kóddal való „élő gondolkodás”.

Publikus API viszont még nincs. Ez „hamarosan” érkezik, addig a Codex CLI a fő hozzáférési út.

Biztonság: önálló, de nem felügyelet nélkül

A Codex-Max új biztonsági rétegeket is kapott. Az OpenAI álláspontja szerint nem éri el a vállalat „High” kiberbiztonsági képességküszöbét, de jelenleg ez a legfejlettebb biztonsági funkciókat használó modelljük a szoftverfejlesztési területen.

A fő korlátozások:

  • nincs hálózati hozzáférés alapértelmezésben
  • szigorú sandboxkörnyezet
  • új, viselkedéselemző monitorozás
  • automatikus megszakítás gyanús aktivitás esetén

A cél világos: a Codex-Max legyen erős, de ne váljon önjáró támadóeszközzé.

Az OpenAI szerint a cég mérnökeinek 95 százaléka használja heti rendszerességgel a Codexet, és a bevezetés óta nagyjából 70 százalékkal több pull request landol a belső repoikban. A fejlesztési ritmus gyorsult, a hibák gyorsabban kerülnek felszínre, és a nagy refaktorok is könnyebben haladnak.

A vállalat ugyanakkor hangsúlyozza: a Codex-Max nem helyettesít fejlesztőt. Inkább növeli a „sávszélességet”, és olyan monoton, hosszú távú munkákat vállal át, amelyek korábban napokat vittek el. A döntések továbbra is az ember kezében maradnak.

Merre tovább?

A GPT-5.1-Codex-Max a jelenlegi formájában nem pusztán egy újabb modell a sorban, hanem az OpenAI nyílt lépése afelé, hogy a fejlesztés folyamata egyre inkább ügynökszerű, hosszú távon konzisztens AI-munkával egészül ki.

Amint a publikus API megnyílik, a Codex-Max könnyen az év egyik legfontosabb fejlesztői eszközévé válhat – különösen azoknál, akik nagy, komplex rendszereket tartanak életben vagy építenek át.