DeepSeek: Kitajski AI Preboj

Reni Markovič
Jan 28, 2025
Branje traja 4 min

Kitajski AI preboj: Kako je DeepSeek z malo denarja preoblikoval industrijo umetne inteligence?

Industrija umetne inteligence je že vrsto let pod nadzorom tehnoloških velikanov, kot sta OpenAI in Anthropic, ki vlagajo milijarde dolarjev v razvoj svojih modelov. A zdaj je Kitajski startup DeepSeek popolnoma preoblikoval pravila igre – z bistveno manjšimi viri in povsem drugačnim pristopom. Njihov revolucionarni model umetne inteligence ne le dohiteva, temveč v mnogih primerih celo presega zmogljivosti najboljših svetovnih modelov, vse to za delček stroškov.

Preboj z inovativnimi pristopi

DeepSeek je dokazal, da lahko omejen proračun postane prednost. Njihov model so razvili z le nekaj več kot 5 milijoni dolarjev – v nasprotju z milijardnimi vložki njihovih konkurentov. Uspelo jim je premagati ovire z uporabo inovativnih tehnik, ki jih velika tehnološka podjetja še vedno zanemarjajo.

8-bitno treniranje (FP8) je ena od teh ključnih inovacij. Namesto tradicionalnega pristopa, ki uporablja FP16 (16-bitne izračune), je DeepSeek prešel na 8-bitno natančnost, kar je zmanjšalo potrebo po pomnilniku za kar 75 %. To pomeni, da lahko njihove modele trenirajo z bistveno manjšo strojno opremo, kar hkrati občutno zniža stroške.

Poleg tega je DeepSeek razvil "multi-token" sistem, ki obdeluje cele fraze namesto posameznih besed. Ta tehnika je povečala hitrost procesiranja za 100 %, ob tem pa ohranila kar 90-odstotno natančnost.

Učinkovitost na prvem mestu

Ena najbolj fascinantnih tehnik, ki jo je uporabil DeepSeek, je bila "distilacija". Gre za proces, pri katerem manjši modeli posnemajo rezultate večjih modelov, ne da bi jih bilo treba učiti na enakih obsežnih podatkovnih zbirkah. To omogoča razvoj manjših, a izredno učinkovitih in natančnih modelov, ki so dostopni tudi napravam z omejenimi zmogljivostmi, kot so pametni telefoni.

Druga zanimiva tehnika je "mešanica ekspertov". Namesto da bi bili vsi parametri modela stalno aktivni, DeepSeek uporablja sistem, kjer od 671 milijard parametrov naenkrat aktivira le 37 milijard. To pomeni, da model deluje kot velika ekipa strokovnjakov, ki jih pokličejo le takrat, ko so potrebni. Rezultat? Večja učinkovitost in nižji stroški.

Dostopnost za vsakogar

DeepSeek je dokazal, da umetna inteligenca ni zgolj domena velikih korporacij. Razvili so t. i. majhne jezikovne modele (SLM), ki so tako kompaktni, da jih lahko uporabniki zaženejo kar na svojih pametnih telefonih. Njihov model DeepSeek-R1-Distill-Qwen-1.5B, ki ima le 1,5 milijarde parametrov, je na matematičnih testih presegel zmogljivosti vodilnih svetovnih modelov, kot sta OpenAI GPT-4o in Claude 3.5 Sonnet.

In to še ni vse – njihova cenovna politika je prav tako revolucionarna. DeepSeek ponuja API storitve za zgolj 10 centov na milijon tokenov, medtem ko OpenAI za podobne storitve zaračunava kar 4,40 USD. Razvijalci poročajo, da lahko za 50 centov obdelajo več sto tisoč API zahtevkov, kar je nepredstavljivo pri konkurenci.

Globok vpliv na celotno industrijo

DeepSeek je s svojim uspehom postavil pod vprašaj visoke stroške in neučinkovitost tradicionalnih pristopov v industriji umetne inteligence. Njihova tehnologija ne le odpira vrata manjšim igralcem, temveč tudi prisili velike korporacije, da ponovno premislijo svoje strategije.

Vpliv je že opazen. OpenAI je moral po odzivih na družbenih omrežjih celo začasno omiliti svoj agresivni cenovni model, saj uporabniki z DeepSeek dosežejo podobne rezultate – povsem brezplačno ali za bistveno nižje cene.

Ali je kitajski AI fenomen DeepSeek varnostno tveganje?

Kitajski AI fenomen DeepSeek, ki je z inovativnimi tehnologijami in nizkimi stroški obnorel svet, je zdaj pod drobnogledom zaradi varnostnih in etičnih vprašanj. Podjetje, ki je v lasti hedge sklada High-Flyer in ima sedež v mestu Hangzhou, Kitajska, se sooča z obtožbami glede pomanjkanja transparentnosti in morebitnega vpliva kitajske vlade. Njegov meteorski vzpon na globalnem trgu umetne inteligence je sicer navdušil številne, a sprožil tudi številne pomisleke.

DeepSeek in politična cenzura

DeepSeek je deležen kritik zaradi domnevne politične cenzure. Njegov AI model zavrača odgovore na vprašanja, ki so povezana z občutljivimi kitajskimi temami, kot so:

Ali predsednik Xi Jinping spominja na Medvedka Pu? 😂
Fotografija moškega pred tanki na Trgu nebeškega miru.

Na takšna vprašanja chatbot odgovarja:"Oprostite, to je zunaj mojega trenutnega obsega. Pogovorimo se o čem drugem."

Tovrstna reakcija je vzbudila vprašanja o vplivu kitajske vlade na razvoj modela in njegovo neodvisnost.

Kdo stoji za DeepSeek?

Podjetje High-Flyer, ki upravlja DeepSeek, je ustanovil Liang Wenfeng, raziskovalec umetne inteligence, ki je svojo kariero začel z uporabo AI za analizo kapitalskih trgov. Njegova pretekla raziskovalna dela, kot je magistrska naloga "Raziskava algoritma za sledenje ciljem na osnovi nizkocenovnih PTZ kamer", pa razkrivajo njegovo zanimanje za napredno video-nadzorno tehnologijo.

Ta preteklost je dodatno vzbudila skrb, da bi tehnologije DeepSeek lahko imele potencial za sledenje uporabnikom ali širše nadzorovanje.

Je DeepSeek res varen?

Podjetje trdi, da spoštuje zasebnost svojih uporabnikov. Njihov AI model naj bi odgovarjal:"Zavezani smo k zaščiti varnosti in zasebnosti uporabniških podatkov. Ne izvajamo nobenega nepooblaščenega nadzora."

Kljub temu pa strokovnjaki za varnost opozarjajo na pomanjkljivo transparentnost. J. Stephen Kowski, CTO pri SlashNext Email Security+, pravi:"Politika zasebnosti DeepSeek je nejasna. Pomembno je vedeti, kako se podatki obdelujejo, kje se shranjujejo in kako dolgo se hranijo. Trenutno teh informacij ni jasno predstavljenih."

Varnostne ranljivosti v DeepSeek

Eden večjih izzivov, s katerimi se sooča DeepSeek, so potrjene varnostne ranljivosti v njihovi infrastrukturi, kot so:

Cross-site scripting (XSS) – omogoča prevzem nadzora nad uporabniškimi sejami.
Prompt injection napadi, kjer lahko napadalci izvedejo nepooblaščene ukaze.

Te ranljivosti povečujejo možnosti za kibernetske napade, kar je skrb zlasti za uporabnike, ki aplikacijo uporabljajo za poslovne namene.

Kibernetski napad na DeepSeek

DeepSeek je bil nedavno tarča obsežnega kibernetskega napada, ki je povzročil motnje v registraciji novih uporabnikov. Podjetje je na svoji statusni strani zapisalo:"Zaradi obsežnih zlonamernih napadov trenutno omejujemo registracije, da zagotovimo nemoteno delovanje storitve. Obstoječi uporabniki se lahko prijavijo kot običajno."

Kljub temu DeepSeek ponuja možnost lokalne namestitve aplikacije, ki uporabnikom omogoča uporabo modela brez povezave z internetom. Do zdaj ni bilo poročil, da bi bila koda zlonamerna.

Zaključek

DeepSeek ni zgolj kitajski startup – je simbol inovacij in dokaza, da omejeni viri lahko vodijo do izjemnih rezultatov. Njihov uspeh spreminja industrijo umetne inteligence in odpira vrata novim priložnostim, hkrati pa postavlja pod vprašaj prevlado velikih tehnoloških podjetij.

Če se bo trend, ki ga je začel DeepSeek, nadaljeval, lahko pričakujemo bolj dostopno, učinkovito in vključujočo prihodnost umetne inteligence.

SKRITA ZNANOST