Mi ez a DeepSeek, mi a sztori mögötte?
Ez egy nagy nyelvi modell (angol rövidítés: LLM), mint sok más, pl a ChatGpt, vagy a Google Gemini.
Más szóval egy AI dumagép, amelyeket most épp nagyon szeretünk.
Egy csapatnyi okos kínai mérnök, s egy befektetőkből álló startup elkezdett egy részvénykereskedő platformon dolgozni, s ez lett a melléktermék! Annak azért elég erős véleményem szerint.
Hogy működik?
A világ adatain lett tanítva és most nyitva van mindenkinek, hogy szabadon használjuk.
Mögötte pedig egy nagy kupac korábbi és újabb nvidia GPU (grafikus processzor) van a háttérben, még a szankciók előtt beszerezve.
Illetve a sejtések szerint hozzájutottak új modellekhez a szankciók alatt is valahogy…
Trump elnök úr dühös is emiatt 🙂
Tényleg jobb?
Ezt döntsd el inkább te, ha kipróbálod.
Kevesebb pénzből, kevesebb idő alatt közel ugyanolyan termék jött létre, mint a többi nagy (amerikai) rendszer.
Bár sok szakértő szerint eleve minden következő AI rendszer kötelezően jobb, mint az elődje és ez a jövőben is így lesz.
Én egyébként úgy látom leginkább kódolásban, programozásban és magas szintű matekban jó igazán.
Amúgy ha ismered és használod a Perplexity.AI-t, az már a DeepSeek-et használja válasz indokláshoz (ez a reasoning)
Hogy lett jobb, mint a többi AI?
Ez bekezdés kissé szakmai lesz, ha gondolod kihagyhatod.
Képzeld el, hogy a teljes hálózat (hívjuk AI agynak) fel van bontva több kisebb szakértő hálózatokra.
Egyik az érvelésben jó, másik az ötletelésben, megint másik a matematikában, vagy épp a kódolásban. Ezek a kisebb szakértő hálózatok bővíthetőek újabbakkal, sőt külön-külön taníthatóak, fejleszthetőek.
De a legjobb, hogy nem a teljes hálózat dolgozik egy-egy válaszon, csupán egy-egy része. Így kisebb erőforrásra (számítógép kapacitásra) van szüksége, ami óriási előny a többi hasonló rendszerrel szemben.
Ez a MOE technológia: MixtureOfExperts.
Mit okozott a világban?
Totális felbolydulást. Részvények a tech cégek világában fel-le mozogtak, sőt az Nvidia részvények inkább óriásit zuhantak.
(de még mindig ebbe fektetnék, ha visszamehetnék az időben, mondjuk 2020-ba)
S persze jött a meglepődés. Tényleg ilyen könnyű lenne megcsinálni?
Mások gigászi pénzeket és időt tettek bele, erre a kínaiak csak úgy mellékesen előálltak szinte ugyanolyan rendszerrel?
Mi lehet gyanús?
A szóbeszéd szerint lehet, hogy nem nulláról lett tanítva. Lehet, hogy az OpenAI ChatGPT rendszerét használják? S bár az OpenAI is ezt tette korábban az Interneten található (jogvédett) adatokkal, ők kizárják a lehetőségét, hogy más AI, az ő rendszerükkel legyen tanÍtva (ezt amúgy legális körülmények között desztillálásnak hívják)
Egyébként én amikor beszélgettem vele, néha CHatGPT-nek mutatkozott be. 🙂
De ez veszélyes is tud lenni.
Tudjuk, hogy erősen hallucinál az AI és ha azt az infót juttatjuk be egy másik tanuló AI-nak, mint tanító adat, abból nem sok jó sül ki, igaz?
Illetve úgy látom Kína specifikus kérdésekre nem szeret válaszolni, így volt amikor „kínjában” azt találta mondani, hogy Kínának nincs is elnöke, csak hagyjam már 🙂
Hogyan tovább?
Nos, zajlik a nagy vizsgálat. Mondhatni elnöki támogatással, hisz az egész az AI fölényről szól, hogy kinek lesz meg hamarabb. Mind az OpenAI-Microsoft páros részéről, mind a Meta is ezt vizsgálja. S bár állítólag már van, de igazi bizonyítékot még nem tettek közzé.
A DeepSeek persze hallgat, de a furcsa hajú zseni, aki mögötte áll, már a kínai kommunista párt legnagyobbjai között ül, ami igen szép elismerés.
Szerintem az egész év erről fog szólni, hogy újabb ilyen cuccok fognak jönni.
Például a múlt héten kijött az Alibaba AI chatbotja (Generative AI), ami persze frenetikus, ahogy ők mondják és jobb a kínai konkurensnél is.
Nekünk felhasználóknak csak jó és egyre olcsóbb a hétköznapi használata.
S eközben az EU-ban?
Mi feltaláltuk a nem levehető kupakot… (bocs)
Ha ötleted vagy kérdésed akad akár a DeepSeek-el kapcsolatban, erre az e-mail címre tudod elküldeni: pedro@amtech.hu
A témáról a Spirit Fm-en készült beszélgetés linkjét, ITT találod.
Szekrényi Péter – Pedro
tulajdonos, IT mérnök
AMtech Rendszerház
www.amtech.hu
Érdekelnek a hasonló tartalmak?
Ez is érdekelhet: