2025.10.19. 11:08 Horváth Péter
A Google következő generációs AI-modellje, a Gemini 3 minden jel szerint már október 22-én bemutatkozhat.

Egy kiszivárgott belső ütemterv szerint a vállalat szokásos szerdai menetrendjéhez igazítva ekkorra időzítette a rajtot. A dátumot a Google természetesen nem erősítette meg, de az iparági mozgások és a vállalat belső frissítései alapján valószínű, hogy a Gemini 2.5 korszak napjai meg vannak számlálva.
A Tom’s Guide elemzője öt konkrét pontban foglalta össze, miért várja már most a váltást – és ezek jól mutatják, hogy a Gemini 3 a Google-ökoszisztéma egyik legfontosabb fordulópontja lehet.
- A mesterséges gondolkodás új szintje
A Google minden egyes frissítéssel fejleszti a Gemini logikai és érvelési képességeit, de a Gemini 3-nál most egy valódi ugrásra számít a szakma. A cél az, hogy a modell ne csak válaszoljon, hanem többlépcsős gondolatmenetet kövessen, konzisztensen, kevesebb „hallucinációval”.
A kiszivárgott benchmark-grafikonok a „Deep Think” fejlesztésre utalnak, ami a szövegértésen túl a logikai láncolatok követését is javítja. Vagyis közelebb kerülhetünk ahhoz, hogy a Gemini valóban „átgondolja”, amit mond.
- Gyorsabb, könnyebb, zöldebb modell
A Gemini 2.5 Flash már eddig is a sebességre optimalizált változat volt, de a következő verzió még alacsonyabb késleltetést és gyorsabb válaszidőt ígér. Ez különösen fontos a mobilos és böngészős használat során, ahol a késlekedés percekben mérhető frusztrációvá válik.
Ha a Google-nek sikerül az energiahatékonyságot is javítania, az nemcsak a felhasználói élményt, hanem a környezeti lábnyomot is csökkentheti – egyre fontosabb szempont a nagy nyelvi modellek világában.
- Még mélyebb integráció a Google-ökoszisztémában
A Gemini már ma is működik a Gmail, a Docs és más Workspace-eszközök belsejében, például az új „Help Me Schedule” funkcióban. A következő lépés, hogy a Gemini 3 még szorosabban beépüljön a mindennapi munkafolyamatokba, az e-mailek megírásától a prezentációkig. A Google-t ismerve mindez fizetős korlátok nélkül érkezhet, legalábbis részben, hiszen a vállalat stratégiája továbbra is a széleskörű elérhetőségre épít.
- A multimodalitás új dimenziója
A pletykák szerint a Gemini 3 fejlettebb képi és videós feldolgozást is hoz. A modell képes lehet konzisztens képaláírások, hosszabb videó-szekvenciák vagy akár szöveggel kevert multimodális válaszok előállítására – ez az a terület, ahol jelenleg a Sora 2 és a Claude 3 Opus vezetnek. Egy belső fejlesztés, a „Cameo” kódnevű funkció például rövid videós jelenetek generálását célozza, ami a Google-nél új kategóriát teremthet az alkotói eszközök között.
- Egy asszisztens, ami nem akar mindent elvenni
A szerző egyik legerősebb érve, hogy a Gemini 3 nem hype-ra épít, hanem arra, hogy a mindennapi munkát segítse. Míg az OpenAI folyamatosan bővíti a ChatGPT-t új, sokszor kísérleti funkciókkal és előfizetési rétegekkel, a Google inkább a stabilitásra és átláthatóságra törekszik. Ha a Gemini 3 valóban letisztult, koncentrált eszköz marad, akkor az üzleti és kreatív felhasználók számára egyaránt ideális alternatíva lehet.
Mi jön ezután?
A kiszivárgott naptár bejegyzése alapján október 22-én fejlesztői bemutatóra vagy korlátozott előpremierre számíthatunk. Ha így lesz, a Gemini 3 azonnal mozgásba hozhatja az egész AI-piacot, hiszen a Google-nél egyszerre dolgoznak a multimodális alapmodelleken és a nagyvállalati Gemini Business Suite-on, amely közvetlen riválisa a Microsoft Copilot-nak és az OpenAI Team-csomagjának.
Bár a hivatalos bejelentés még várat magára, egyre biztosabbnak tűnik, hogy a Gemini 3 nem egyszerű frissítés, hanem a Google mesterséges intelligencia-stratégiájának új fejezete lesz.