Sokkot váltott ki az Egyesült Államok technológiai szektora egy kis kínai mesterséges intelligenciával foglalkozó vállalat megjelenése.

Technológia

Geszti Péter hatalmas ünneplést rendezett a Papp László Budapest Sportarénában a 60. születésnapja tiszteletére - a légkör pezsgő volt, és a fotók mindent elmondanak!

A mesterséges intelligencia váratlan és elképesztő mértékű térnyerése olyan helyzetet teremtett, amelyben úgy tűnt, hogy az amerikai technológiai ipar különösen nagy előnyre tehet szert az USA fő hatalmi ellenlábasával, Kínával szemben. Az 500 milliárd dolláros Stargate projekt - ami a tervezett beruházásoknak csak egy része - és a kormányzati szerepvállalás arra enged következtetni, hogy ha nem is olyan konfrontatív módon, mint annak idején a Csillagháborús kezdeményezéssel, de Amerika kész kesztyűt dobni a riválisa lába elé.

A nagy bejelentést követő vállveregetések még csak most csendesedtek el, a beruházásokhoz szükséges hatalmas összeg allokálásáról folytatott tárgyalások éppen csak kezdetüket vették, amikor váratlanul felbukkant egy apró kínai startup, amely komoly zavart keltett a pezsgőzés közepette. Hogy vajon végleg megakadályozza-e a nagyobb szereplők terveit, az még kérdéses, de a megjelenése máris jelentős keserűséget hozott a befektetők számára. A tőzsdei árfolyamok drámai zuhanásnak indultak, miután napvilágot látott néhány kulcsfontosságú információ a DeepSeek legújabb modelljéről.

Az amerikai óriásokhoz mérve aprócska DeepSeek a múlt héten kiadta a chatbotja frissített változatát, amely a jelek szerint még a ChatGPT legfrissebb verzióját is felülmúlja. De nem csak a DeepSeek teljesítménye borzolja a kedélyeket, hanem az is, hogy a vállalkozás mindössze néhány hónap alatt, gyengébb hardverrel és olyan kevés pénzből építette meg a modelljét, ami korábban lényegében elképzelhetetlen volt.

A DeepSeek mesterséges intelligencia laboratóriumot 2023-ban alapították Hangcsou városában, mintegy 150 kilométerre Sanghajtól. A cég hamarosan bemutatott egy nyílt forráskódú mesterséges intelligenciamodellt, amelyet szintén DeepSeeknek hívnak. Ennek a legújabb DeepSeek-V3 nevű verziója úgy tűnik, hogy vetekszik az OpenAI ChatGPT-jével, és sok vonatkozásban felül is múlja azt, beleértve az összehasonlításba a GPT-4o modellt és a legújabb o1 érvelési modellt is - olvasható a Fast Company cikkében.

Meglepő, hogy a DeepSeek-V3 chatbot képes felülmúlni olyan neves konkurenseit, mint az OpenAI ChatGPT, a Meta Llama 3.1 és az Anthropic Claude Sonnet 3.5. Az amerikai mesterséges intelligencia szakértők döbbenten figyelik, hogy a kínai mérnökök csupán néhány hónap alatt alkották meg a DeepSeek-V3-at olyan AI-hardverrel, amely nem éppen a legmodernebb, és amelyért a vállalat alig a költségek töredékét fizette ki, mint amit más cégek az LLM chatbotjaik fejlesztésére költöttek. A DeepSeek-V3 fejlesztésének összköltsége – a cég jelentése alapján – mindössze 5,576 millió dollárra rúgott. Ez azt jelenti, hogy Kínában egy startupnak sikerült kevesebb mint 6 millió dollárból létrehoznia egy versenyképes LLM modellt, míg más cégek milliárdokat fektettek a saját technológiájukba. Például az OpenAI állítólag 100 millió dollárt fordított a GPT-4 tréningjére, ahogy arról a Wired 2023-ban beszámolt.

Ez igazi mélyütés az amerikai techóriások számára, ami több egzisztenciális kérdést is felvet. Például azt, hogy vajon nem költöttek-e feleslegesen dollármilliárdokat a nagy nyelvi modelljeik megalkotására. A magas kutatási és fejlesztési költségek miatt a legtöbb LLM még egyáltalán nem hozta vissza a befektetett pénzt, és ha a DeepSeek módszere igazolódik, akkor soha nem is fogja. Hiszen senki sem lesz hajlandó megfizetni a rendkívül magas szolgáltatási díjakat, ha azok mögül eltűnik a hivatkozási alap.

A modell népszerűségét a nyílt forráskód növelheti, hiszen szakértők vizsgálhatják meg, ami enyhítheti a magánélet védelmével és a biztonsággal kapcsolatos aggodalmakat - hívja fel a figyelmet a Mashable. Másodszor, ingyenesen használható webalkalmazásként, míg az API-hozzáférés nagyon olcsó (0,14 dollár egymillió beviteli tokenért, szemben az OpenAI 7,5 dolláros árával a legerősebb érvelési modell, az o1 esetében, ami 54-szeres szorzó).

A Fast Company elemzése szerint ez azt jelenti, hogy a Meta, a Google és az OpenAI eddigi pénzügyi dominanciája hirtelen eltűnhet, és ezzel együtt intenzív verseny kezdődhet az Egyesült Államokban és világszerte a költséghatékony, ámde rendkívül hatékony AI-chatbotok fejlesztésében. Ez a helyzet távol áll a csillagháborús logikától, amely potenciálisan megteremthette volna az Egyesült Államok számára a valódi technológiai fölényt.

Pedig a Biden-kormányzat számos exportellenőrzést vezetett be a mesterséges intelligenciával kapcsolatos technológiákra, abban a reményben, hogy ezek célra vezetnek. A legfejlettebb AI-chipeket és más hardvereket tilossá vált kínai vállalatoknak eladni. Az Nvidia legfejlettebb mesterséges intelligencia hardverének egy része is az exportellenőrzés hatálya alá került.

A DeepSeek teljesítménye még lenyűgözőbbé válik, ha figyelembe vesszük a korlátozásokat, amelyekkel szembesült. A projekt során olyan hardveres háttérre támaszkodtak, amely közel sem volt a legmodernebb a piacon. Az Nvidia H800-as chipjei szolgáltak alapként az LLM kifejlesztéséhez, ami a középkategóriás mesterséges intelligencia termékek közé tartozik. Ennek ellenére a DeepSeek képes volt olyan LLM modellt alkotni, amely felülmúlja a ChatGPT-t, mind teljesítményben, mind pedig energiatakarékosságban. Ez utóbbi különösen fontos, hiszen a projekt környezetbarátabb megoldásokat is kínál, tükrözve egy felelősebb technológiai megközelítést.

A nagymenők is elképedve figyelték a fejlesztés folyamatát. Aravind Srinivas, a Perplexity vezérigazgatója a DeepSeek áttöréséről a CNBC-nek úgy nyilatkozott: "A szükségszerűség a találmányok anyja. Amikor szembe kellett nézniük a kihívásokkal, végül egy sokkal hatékonyabb megoldást alkottak meg." A svájci Davosban megrendezett Világgazdasági Fórumon, a múlt héten, Satya Nadella, a Microsoft vezérigazgatója hangsúlyozta, hogy a DeepSeeket komolyan kell venni. Az új modell fejlesztésének idejét és hatékonyságát figyelembe véve, rendkívül lenyűgözőnek találta. Marc Andreessen, a neves technológiai befektető pedig úgy fogalmazott, hogy a DeepSeek "az egyik legcsodálatosabb és leglenyűgözőbb áttörés", amellyel valaha találkozott.

A tervezett gigaberuházások sorsa jelenleg bizonytalan, hiszen az ilyen méretű projekteket nehezen állíthatják le, ha egyszer már megkezdődtek. Ugyanakkor talán igaz, hogy egyetlen fecske nem hoz nyarat. A nyílt forráskódú megoldások valóban növelhetik az AI fejlesztések hatékonyságát, de az elterjedésük nem garantált. Teljesen nyitott forráskódokat nem csupán jószándékú fejlesztők vehetnek kezelésbe, ami komoly, nem kívánt következményekkel járhat. A tőzsdei árfolyamok esetleges visszatérése a korábbi szintekre szorosan összefonódik az olyan AI-modellek teljesítményével, mint a DeepSeek, és más, hasonlóan feltűnő versenytársaké, különösen valós projektekben, ahol a teljesítmény skálázása és a nagy terhelés kezelése kulcsfontosságú. A piaci elemzők véleménye alapján a többség kétségbe vonja a DeepSeek 6 millió dolláros ígéretét, de ha mégis valósággá válna, az a piac bővülését hozhatná magával, ami kedvező fejlemény lehet. Ez az eset mindenesetre rávilágított arra, hogy a technológiai képességek egyre nehezebben tarthatók kordában.