2025.07.03. Horváth Péter
Egy izraeli cég, amely legyőzte a Metát és Elon Muskot az amerikai bíróságon, most saját mesterséges intelligencia-infrastruktúrával készül új korszakot nyitni – nyílt webes adatokat kínálva olyan formában, amire a legnagyobb AI-rendszerek is éhesek.

A Bright Data nevű izraeli technológiai cég éveken át pereskedett a nyílt webes adatgyűjtés jogaiért. 2024-ben történelmet írt, amikor amerikai bíróságok jogszerűnek ítélték a közszemlére tett, belépés nélkül elérhető adatok automatikus letöltését – még akkor is, ha ezeket a Meta vagy épp Elon Musk cégei üzemeltetik. Most, 2025 júliusában a cég újabb hatalmas dobással rukkolt elő: bejelentette saját, több komponensből álló mesterségesintelligencia-platformját, amely nem kevesebbre vállalkozik, mint hogy leváltsa a Big Tech zárt adatszolgáltatási modelljeit - számolt be a
VentureBeat.
A „Deep Lookup” keresőmotor, a „Browser.ai” nevű, mesterséges intelligenciákra szabott böngésző, valamint az új MCP Servers protokoll mind azt a célt szolgálják, hogy az AI-rendszerek – chatbotok, autonóm ügynökök és más alkalmazások – valósidejű és szabad hozzáférést kapjanak a web aktuális adataihoz. Ez különösen fontos egy olyan időszakban, amikor a nagy techcégek egyre több tartalmat zárnak el és tesznek csak saját modelljeik számára elérhetővé.
A nyílt webért folytatott harc
A Bright Data vezérigazgatója, Or Lenchner szerint a mai mesterséges intelligenciákat nem a szűkös algoritmusok vagy gyenge hardverek korlátozzák, hanem az adatok elérhetősége. A cég célja, hogy az adatokhoz való hozzáférést demokratizálja, szembemenve azokkal a törekvésekkel, amelyek szerint csak a nagy techvállalatok férhetnének hozzá az internet legfontosabb információihoz.
A Deep Lookup nevű keresőmotor különösen összetett, rétegzett kérdésekre ad választ. Nem rövid kivonatokat nyújt, mint a mai AI-chatbotok, hanem teljes adatlistákat, például: „Mely hajózási cégek keltek át a Panama- és Szuezi-csatornán 2023-ban, és esett vissza a harmadik negyedéves árbevételük legalább 2%-kal?” Mindezt egy több mint 200 milliárd HTML-oldalt tartalmazó adatarchívumra támaszkodva, amely havonta 15 milliárd új elemmel bővül.
A Browser.ai ezzel szemben egy olyan AI-barát böngésző, amely szimulálja az emberi viselkedést, hogy elkerülje a botdetekciót. Képes repülőjegyeket foglalni, éttermi helyeket lefoglalni, vagy más, komplex interakciókat végrehajtani weboldalakon, természetes nyelvi utasításokra is reagálva.
Jogilag is precedensteremtő döntések
A Bright Data jogi győzelmei kulcsfontosságú fordulópontot jelentettek a webes adatgyűjtés szabályozásában. A bíróság kimondta: amit regisztráció nélkül, bárki számára elérhetővé tesz egy weboldal, az nyilvános adatnak minősül, és jogszerűen feldolgozható. Az ítéletben William Alsup bíró figyelmeztetett: ha a techcégek dönthetnének arról, ki fér hozzá az internet tartalmaihoz, „információs monopólium” jöhetne létre, ami sérti a közérdeket.
A per egyik meglepő részlete volt, hogy a Bright Data ügyfelei között ott volt mind a Meta, mind az X (Musk cége) – miközben éppen ők indítottak keresetet ellene. Ez is rávilágított arra, milyen kettős mércét alkalmaznak a legnagyobb szereplők, amikor az adatgyűjtésről van szó.
Az etikus adatgyűjtés útja
A Bright Data nem csak technológiailag, de adatvédelmi szempontból is meg kívánja különböztetni magát. Betartják az európai GDPR és a kaliforniai CCPA előírásait: ha egy nyilvánosan elérhető adat alapján személyes információt gyűjtenek, automatikusan értesítik az érintettet, és törlési lehetőséget biztosítanak.
A cég több mint 5.500 szabadalmi bejegyzéssel és 150 milliós IP-hálózattal dolgozik, amely 195 országra terjed ki – ez biztosítja azt, hogy még a legkomplexebb blokkolási technikákat is gyorsan kijátsszák.
Túl a ChatGPT-robbanáson
A Bright Data már jóval 100 millió dolláros éves árbevétel felett jár, és a cég szerint az igazi növekedést az OpenAI GPT-3 megjelenése indította be. Ahogy Lenchner fogalmazott:
„2023 márciusától, amikor a GPT-3 megváltoztatta a világot, az AI-hoz használt adatgyűjtés gyakorlatilag berobbant. Ilyen méretű keresletet még nem láttunk.”
A jövő mesterséges intelligenciái nemcsak tanulni fognak a múltból, hanem a jelen történéseire is reagálniuk kell majd. Ennek egyik alapja az azonnali hozzáférés a webes információkhoz – és ebben a Bright Data szerint senki sem nyújt versenyképesebb infrastruktúrát náluk.
A Deep Lookup jelenleg üzleti ügyfelek számára érhető el bétaverzióban, a nagyközönség várólistán keresztül csatlakozhat. A Browser.ai és az MCP Servers már elérhetőek a vállalati felhasználók számára.