2025.08.07. Horváth Péter
A Google legújabb frissítése új távlatokat nyit a kreatív tartalomkészítésben: a Gemini immár képes teljes, illusztrált mesekönyveket generálni, akár személyes képek alapján is.

A felhasználó mindössze egy rövid szöveges leírást ad meg – például „Egy kisfiú és a kutyája eltéved az erdőben, ahol beszélő állatok segítenek nekik” –, és a Gemini AI rendszere néhány másodpercen belül elkészíti a történet szövegét, illusztrációit és a könyv borítóját. A mesekönyv 10 oldalas, és minden oldalon saját generált képek szerepelnek.
A Google ígérete szerint az AI nem csupán angolul, hanem több nyelven is képes történeteket készíteni. A vizuális stílusokat tekintve is széles a választék: a klasszikus mesekönyves hangulattól a képregényes vagy pixel art stíluson át egészen a gyurmaalakos és horgolt (crochet) vizualitásig mindenféle esztétika elérhető.
A funkció egyik különösen izgalmas eleme, hogy a felhasználó saját képeket is feltölthet. Ez lehet egy családi fotó, egy gyermek által készített rajz, vagy bármilyen más vizuális tartalom, amelyet a Gemini képes beépíteni a történetbe. Így akár egy óvodai rajzverseny kedvenc figurája is a történet főhősévé válhat, vagy egy nyaraláson készült családi kép szolgálhat alapul egy személyes mesevilág megalkotásához. A végeredmény pedig nem csupán egy digitális könyv: a rendszer automatikus felolvasási funkciót is biztosít, amely a Google saját szövegfelolvasó technológiáján alapul.
Itt muszáj jeleznünk: adatvédelmi szempontból nem javasolt mindenféle saját kép, adat feltöltése, ez a történet jól mutatja, hogy még egyáltalán nem kiforrott a privát életünk védelme.
Mi lehet a háttérben?
A Google hivatalosan nem erősítette meg, de feltételezhető, hogy a generált képekért a Veo 2 modell felel, míg a szövegalkotás és felolvasás a Gemini nyelvi modell és a WaveNet-alapú TTS-rendszer együttműködésében történik. Az egész folyamat rendkívül gyors: a teljes könyvecske – illusztrációval, szöveggel, borítóval, hanggal – kevesebb mint egy perc alatt elkészül.
Ez a funkció nem csupán egy újabb AI-szolgáltatás a sok közül. A Google mesekönyvkészítője jól példázza, hogyan válhat az AI a kreatív önkifejezés, a játékos tanulás és a személyes tartalomkészítés társává – nemcsak fejlesztőknek, hanem hétköznapi felhasználóknak is. A lehetőségek pedagógiai, terápiás és szórakoztató célokra egyaránt izgalmas távlatokat nyitnak meg.