2023.08.25. AIWORLD
Az Ideogram, a mesterséges intelligencia képgenerálás új arca, egyedülálló tipográfiai képességeivel kelt hullámokat.
- A Google Brain korábbi kutatói által támogatott Ideogram jelentős, 16,5 millió dolláros finanszírozással indul.
- A startup egyedi értékesítési pontja, hogy képes megbízhatóan szöveget generálni a képeken belül, ami sok AI képgenerátor számára kihívást jelent.
- Innovatív tipográfiai funkciója ellenére az Ideogramnak versenytársakkal kell szembenéznie, és vannak fejlesztendő területei.
A hét elején a technológiai világot az Ideogram, egy új generatív AI-képgyártó startup elindítása járta be. A Google Brain öregdiákjai által alapított vállalat 16,5 millió dolláros finanszírozást kapott. De mi különbözteti meg az Ideogramot a zsúfolt AI-képgenerátorok piacán? Az, hogy úttörő módon képesek megbízható szöveget beépíteni a képekbe, ami sok versenytársuknak egyelőre nem adatott meg.
A vállalat webes alkalmazása előre beállított képkészítési stílusok sokaságát mutatja be. Az egyik kiemelkedő a "tipográfia" stílus, amely gyönyörűen megjeleníti a szöveget különböző színekben, betűtípusokban, méretekben és stílusokban. A felhasználók akár többféle stílust is keverhetnek és kombinálhatnak, ami gazdag teret kínál a kreativitáshoz. Ez a funkció különösen lenyűgöző, tekintve, hogy sok mesterséges intelligencia eszköznek nehézséget okoz a képeken belüli koherens és esztétikus szöveg létrehozása.
Bár a közösség első visszajelzései és példái ígéretesek, az Ideogram nem mentes a kihívásoktól. Egyes tesztek következetlenségeket mutattak ki a kimenetében, és időnként gondot okozott bizonyos szavak, köztük a saját neve megjelenítése. A mesterséges intelligencia képgenerálás területén gyors fejlődés zajlik, a versenytársak folyamatosan új funkciókat mutatnak be. A Midjourney például nemrégiben mutatta be a "vary region" funkcióját. Mégis, az Ideogram tipográfiára való összpontosítása lehet, hogy épp az az előny, amire szüksége van, különösen a grafikusok és vállalkozások számára, akik szemet gyönyörködtető, szöveggel integrált vizuális elemeket keresnek.