Tekoäly
DeepSeek: Epävakaa ja varhainen kaupallistuneen tekoälyn saapuminen?

DeepSeek tuhoaa AI-maiseman
Jos et ollut perillä, tarkastellessasi rahoitusmarkkinoita maanantaina 27th tammikuuta 2025, kysymys oli luultavasti: “Mitä tapahtui?” Näyttäen pysäyttämättömältä vaikuttanut Nvidia‑osakkeen hinnannousu – tähän asti – katkesi äkilliseen 18 %:n pudotukseen yhdessä päivässä.
Markkina-arvon menetyksen ollessa 560 miljardia dollaria, ei yksikään yritys ole koskaan menettänyt näin paljon arvoa yhdessä päivässä. Tästä syystä Nvidia‑sijoittajat todennäköisesti tottuvat osakkeen äärimmäiseen volatiliteettiin, sillä se on aiheuttanut 8 kymmenestä suurimmasta yksittäispäivän laskusta.

Lähde: Visual Capitalist
Liipaisuna oli DeepSeekin julkaisu, Kiinassa kehitetty LLM (Large Language Model), joka kilpailee OpenAI:n ja muiden johtavien AI‑yritysten parhaiden tuotteiden kanssa suorituskyvyltään. Ainoa ero on, että se on avoin lähdekoodi ja tarjoaa pääsyn erittäin alhaisella hinnalla. Lisäksi väitetään, että se on kehitetty vain 6 miljoonan dollarin “sivuprojektina” kvantitatiiviselle hedge‑fundille.
Jos tämä pitää paikkansa, se voisi kumota narratiivin, jonka mukaan AI:n kehittäminen on äärimmäisen laskennallisesti intensiivistä ja vaatii miljardeja, ellei jopa biljoonia dollareita AI‑datakeskuksiin. AI‑laitteistojen johtajana on odotettavissa, että Nvidia kärsi eniten sijoittajien paniikista.
Kun pöly on hieman laskeutunut, tarkastellaan, mitä DeepSeek todella pystyy tekemään ja mitä Kiinan AI‑teollisuus saattaa tehdä seuraavaksi.
DeepSeek‑tausta
High-Flyer
DeepSeek kehitettiin Kiinan rahoituskauppa‑/kvantitatiivisen hedge‑fundin High-Flyer toimesta, jonka perusti Liang Wenfeng.
Liang on 40‑vuotias ja aloitti uransa konevision parissa. Hän perusti High‑Flyerin vuonna 2015, kolmekymppisenä, ja oli edelläkävijä AI:n hyödyntämisessä kaupankäyntistrategioissa koneoppimisen avulla. Fundi hallinnoi nyt 8 miljardia dollaria omaisuutta.
Yleensä hyvin varovainen, Liang nähtiin istumassa Kiinan pääministeri Li Qiangin (Kiinan kommunistisen puolueen poliittisen komitean toinen jäsen) vieressä AI‑teknologiaa käsittelevässä kokouksessa Pekingissä 20 tammikuuta 2025.

Lähde: Nigel D’Souza
On syytä huomauttaa, että alkuperäisen sekaannuksen ja Liang’n harvojen julkisten esiintymisten vuoksi monet tiedotusvälineet käyttivät kuvaa henkilöstä, jolla on sama nimi, mutta joka ei liity DeepSeekiin, ja toimii sisustussuunnittelijana.

“Ei Liang Wenfeng” – Lähde: Business Day
DeepSeek
Vuonna 2021 Liang Wenfeng osti noin 10 000 H800‑Nvidia‑piirisarjaa ennen Yhdysvaltain pakotteita, käynnistääkseen sen, mitä myöhemmin kutsuttiin DeepSeekiksi, ja toi High‑Flyer‑AI:n huippututkijat projektiin.
H800‑piirit ovat verrattain matalan suorituskyvyn siruja edistyneempiin H100‑ ja B200‑malleihin nähden, ja niiden virrankulutus on kolminkertainen.

Lähde: Technical City
DeepSeek väittää kouluttaneensa DeepSeek V3 -mallin alle kahdessa kuukaudessa, kustannuksella 5,58 miljoonaa dollaria. Vaikka tämä ei sisällä 10 000 H800‑piirin hintaa, se on silti useita kertaluokkia halvempaa kuin muut LLM:t tähän mennessä.
Itse asiassa tämä tekisi DeepSeek V3:n koulutuksesta halvempaa kuin pelkästään OpenAI:n, Metan, Microsoftin, Googlen ym. AI‑tiimien johtajien palkat.
DeepSeek‑suoritukset
Alhaisen kehityskustannuksen lisäksi analyyttejä ja sijoittajia järkytti se, että DeepSeekin suorituskyky on samankaltainen tai jopa parempi kuin OpenAI:n ja muiden huippuyritysten uusimmat mallit, mukaan lukien juuri julkaistu ja mahdollisena AGI:nä pidetty o3.

Lähde: GitHub
Ensimmäinen reaktio oli epäillä vilpillistä toimintaa ja että aika‑ ja kehityskustannukset olivat väärennettyjä (lisätietoa alla).
Joka tapauksessa on todennäköistä, että DeepSeekin menetelmä on 10‑100‑kertainen tehokkaampi kuin mitä AI‑teollisuus tähän mennessä on tehnyt.
Amerikkalaisen AI‑teollisuuden ylimääräinen potku tuli DeepSeekin hinnoittelusta. Token‑hinnat ovat paljon alle 1 USD, mikä on noin 3 %‑5 % kilpailijoiden hinnoista.

Lähde: Jason Clarck
“Alennamme hintoja, koska ensinnäkin seuraavan sukupolven mallirakenteita tutkiessamme kustannuksemme vähenivät; toiseksi uskomme, että sekä AI‑ että API‑palveluiden tulisi olla edullisia ja kaikkien saatavilla.”
Oikea ajoitus
DeepSeek V3:n vaikuttava lanseeraus oli, ilmiselvästi, yrityksen huolellisesti ajoittama maksimaalisen vaikutuksen saavuttamiseksi.
Se tapahtui vain muutamaa päivää sen jälkeen, kun presidentti Trump ilmoitti “Project Stargate” -hankkeesta, 500 miljardia dollaria maksavasta aloitteesta, jonka tavoitteena on rakentaa 20 AI‑megadatakeskusta, joihin osallistuvat SoftBank (SFTBY ), OpenAI ja Oracle (ORCL ).
Kun markkinat paniikoivat, Yhdysvaltain presidentti vaikutti enimmäkseen rauhalliselta.
“Jos voit tehdä sen halvemmalla, jos voit tehdä sen [vähemmän] ja saavuttaa saman lopputuloksen, se on meille hyvä asia.”
Hän myös totesi, ettei ole huolissaan läpimurrosta, ja lisäsi, että Yhdysvallat pysyy alalla hallitsevana toimijana.
Lähde: BBC
LLM:n jälkeen, kuvagenerointi
LLM‑saavutuksensa jälkeen DeepSeek pyrkii toistamaan menestyksensä AI‑kuvageneroinnissa ja julkaisee Janus‑Pro‑7B:n.

Lähde: Hugging Face
Vaikka käydään keskustelua siitä, onko se todella yhtä hyvä kuin Midjourney, DALL‑E ja muut kuvageneraattorit, se on silti vaikuttava.
Ja jos se noudattaa DeepSeek V3:n LLM‑mallin kaavaa, sen odotetaan olevan poikkeuksellisen tehokas.
Välittömät vaikutukset
Vaikutus AI‑teollisuuteen
Kun DeepSeek iski AI‑teollisuuteen myrskyn tavoin, sillä oli muutamia välittömiä seurauksia:
- Markkinaturbulenssi: Nvidia‑osakkeen hinta ja koko Nasdaq romahtivat, kun markkinat tajusivat mahdollisuuden tuhlata satoja miljardeja dollareita AI‑laitteistoon (katso alla tarkempi keskustelu aiheesta).
- AI‑kilpailun kiihtyminen: Kiina on siirtynyt pois aiemmin Yhdysvaltain teknologiavaikuttajien hylkäämästä ja “merkityksettömästä” asemasta, ja uusi AI‑kilpailu on nyt käynnissä Tyynenmeren yli.
- Yöaikainen menestys: DeepSeek on lähes välittömästi noussut ladatuimpaan sovellukseen App Storessa.
- Offline‑testaus: Monet testaavat, miten se voidaan ajaa paikallisesti heidän huippuluokan kotitietokoneillaan, sillä laskentavaatimukset vaikuttavat merkittävästi alhaisemmilta kuin aiemmilla LLM:eillä.
Sivuvaikutukset
DeepSeekin aiheuttamat vahingot eivät rajoitu ainoastaan amerikkalaisten AI‑ ja teknologiayritysten kuviin ja mahdollisiin tuleviin voittoihin.
Esimerkiksi innovaatiokeskeiset ydinvoimayritykset, joiden odotettiin muodostavan megawatti‑mittakaavan AI‑datakeskusten energian ytimen, kärsivät entistä kovemmin: 27th tammikuuta 2025 SMR‑kehittäjä Nuscale (SMR ) laski 27,5 % ja uraani‑kaivosyhtiö Cameco laski 15 %.
Toinen sivuvaikutus on Yhdysvaltojen ulkopuoliset teknologiastokit. Japanilaiset teknologiastokit, kuten Advantest, Nvidia‑toimittaja, laskivat 8,6 % ja Softbankin osake laski 8,3 %. Samaan aikaan hollantilainen piirisovellusten valmistaja ASML laski 6,5 %.
Miten DeepSeek sen hallitsi?
Ei vielä lopullista vastausta
Tämä on selvästi edelleen kiivasti kiistanalainen aihe niin pian julkaisun jälkeen. Voimme tarkastella muutamia eri näkökulmia, kun otamme huomioon tunnetut tosiasiat.
Ensimmäinen tosiasia on, että riippumatta siitä, miten se tapahtui, DeepSeek V3 on yhtä voimakas kuin tähän mennessä julkaistu paras AI.
Ehkä tärkeämpää on, että avoimen lähdekoodin ansiosta monet testaavat ja vahvistavat, että se vaatii paljon vähemmän laskentatehoa.
DeepSeek R1 on yksi uskomattomimmista ja vaikuttavimmista läpimurroista, joita olen koskaan nähnyt – ja avoimen lähdekoodin ansiosta se on syvä lahja maailmalle.
Siksi sitä ei pidä hylätä pelkkänä “hype‑ilmiönä” tai Kiinan hallituksen salaisena juonena. Tämä on myös mielipide, jonka jakavat arvostetut Piilaakson vaikuttajat kuten Marc Andreessen ja Chamath Palihapitiya.
AI‑mallien rakentaminen on rahansyötti (…) Avoin lähdekoodi on selvä voittaja.
Suljetun lähdekoodin AI:t pakotetaan pitämään parhaat mallinsa salassa ja myymään niitä yrityksille TAI yrittämään luoda niistä uskomattoman kuluttajasovelluksen.
Haastattelu Liang Wenfengin kanssa heinäkuulta 2024, annettu juuri DeepSeek V2:n julkaisun jälkeen, antaa myös lisävaloa.
Eri lähestymistapa
Ensimmäinen mahdollinen selitys on, että DeepSeek valitsi erilaisen strategian AI‑kehitykseen.
Keskeinen tekijä on, että kyseessä on Liang Wenfengin yrityksen sisäinen projekti, ei riskipääomalla rahoitettu liiketoiminta. Tässä mielessä se muistuttaa hieman Teslan ja SpaceX:n alkuvuosia, jotka perustuivat Elon Muskin omiin varoihin.
Tämä ero toi DeepSeekille fokuksen oman mallirakenteen kehittämiseen sen sijaan, että kopioitaisiin Llamaa nopeiden sovellusten tuottamiseksi.
“Tavoitteemme on AGI (Artificial General Intelligence), mikä vaatii meidän tutkia uusia mallirakenteita saavuttaaksemme ylivoimaisia kykyjä rajoitetuilla resursseilla. Tämä on perustutkimusta skaalaamisen mahdollistamiseksi. Rakenteen lisäksi olemme tutkineet datan kuratointia ja ihmismäistä päättelyä – kaikki heijastuu malleissamme.”
Tämä heijastuu myös yrityskulttuuriin, jossa painotus ei ole voitossa, sillä se on High‑Flyer‑hedge‑fundin “työ”. Sen sijaan innovaation itse on julistettu tavoitteeksi.
“Kolmen vuosikymmenen ajan olemme painottaneet voittoa innovaation kustannuksella. Innovaatio ei ole pelkästään liiketoiminnallinen, se vaatii uteliaisuutta ja luovaa kunnianhimoa. Olemme sidottuja vanhoihin tapoihin, mutta tämä on vaihe.
Amerikkalaiset, eniten voittoa tuottavat yritykset ovat teknologialohikäärmeitä, jotka on rakennettu pitkän aikavälin T&K:n varaan.”
Tästä näkökulmasta DeepSeekin kulttuuri saattaa olla kestävä etu, ja se toimii kritiikkinä useimmille AI‑ajatusjohtajille.
“Uskomme, että Kiinan AI ei voi pysyä seuraajana ikuisesti. Usein sanomme, että Kiinan ja Amerikan AI:n välillä on yksi‑ tai kaksi‑vuoden kuilu, mutta todellinen ero on alkuperäisyyden ja jäljittelyn välillä. Jos tätä ei muuteta, Kiina on aina seuraaja. Jotkut tutkimuspolut ovat väistämättömiä.”
AI‑teknologian luonnollinen evoluutio
Toinen vaihtoehto on, että kun yhä useammat tutkijat kehittävät taitoja AI:n luomisessa, innovaatiot työntävät alaa eteenpäin. Mitä DeepSeek saavutti, jokin resurssirikas AI‑startup oli väistämättä tekemässä, kun teknologia kypsyy. Ja pakotteiden rajoittaessa pääsyä edistyneisiin siruihin, Kiinan AI‑yritykset ovat ensimmäisiä, jotka keskittyvät tekemään enemmän vähemmällä.
Sitä voidaan myös pitää avoimen lähdekoodin pitkän aikavälin ylivertaisuutena suljettuihin, voittoa tavoitteleviin järjestelmiin nähden, jotka pyrkivät maksimoimaan voiton monopolien avulla.
Tämä näkemys heijastaa myös satojen miljardien dollareiden suurten teknologiayritysten suunnitelmia, jotka olivat varanneet kulutusta pelkästään vuodelle 2025.
Joten kyse ei ole niin paljon DeepSeekin ylivertaisuudesta, vaan enemmänkin entisten innovatiivisten suurten teknologiayritysten byrokraattisesta muuttumisesta, sekä Kiinan että Amerikan puolella.
Salaliitto
Luultavasti väistämätöntä lännen ja Euraasian (Venäjä / Kiina / Iran) välisten suurvaltasuhteiden intensiivisessä kilpailussa, monet näkivät DeepSeekissä ulkomaista vihamielistä operaatioita Yhdysvaltojen kilpailukykyisintä talousaluetta vastaan.
Yksi selvästi hylättävä salaliittoteoria on, että se on yksinkertaisesti kopio länsimaisista AI:ista tai sen suorituskyky on väärennetty, vaikka se on jo itsenäisesti vahvistettu. Koska DeepSeek on avoimen lähdekoodin ohjelmisto, on myös melko loogista olla hyökkäämättä sitä vakoiluohjelmana tai Kiinan kommunistisen puolueen sensuroimana työkaluna, sillä kuka tahansa voi ottaa sen käyttöön ja muokata sitä vapaasti.
Kuitenkin yksi pätevä pointti on, että DeepSeek on voinut saada pääsyn edistyneempiin siruihin, jotka on virallisesti säännelty ja kielletty vientiä Kiinaan. Jos näin on, olisi järkevää, että yritys ei myöntäisi sitä julkisesti ja valehtelisi asiasta.
Mahdollisuus on piilotettu tuki hallitukselta, suoraan rahoituksesta aina laajoihin klustereihin salakuljetetuista H100‑Nvidia‑siruilta AI‑koulutukseen. Tiedämme esimerkiksi, että paljon siruja myydään Singaporessa, ja todennäköisesti jälleenmyydään Kiinaan.
“Kiinalaisilla laboratorioilla on enemmän H100‑siruita kuin ihmiset uskovat. Ymmärrykseni mukaan DeepSeekillä on noin 50 000 H100‑sirua, mistä he eivät voi puhua, ilmeisesti, koska se on Yhdysvaltain vientirajoitusten vastaista.”
Toinen kiista on koulutuskustannus, jota ei ole itsenäisesti vahvistettu.
Viimeinen mahdollisuus on, että DeepSeek, riippumatta geopoliittisesta salaliitosta, olisi voinut lyödä massiivisesti Nvidia‑osaketta vastaan ennen kuin se julkaisi vaikuttavat väitteensä. High‑Flyer on kuitenkin hedge‑fund, ja tämä voitaisiin nähdä markkinamanipulaationa, mikä on riskialtista.
Ensimmäiset havainnot
AI on ala, joka kehittyy uskomattoman nopeasti, ja DeepSeek on jo muuttanut peliä muutamalla tärkeällä tavalla:
- Meillä on nyt uusi menetelmä ultra‑tehokkaiden LLM‑mallien ja todennäköisesti AI‑mallien yleisesti tuottamiseen.
- Avoimen lähdekoodin AI:lla on todellinen mahdollisuus kilpailla suljetun mallin kanssa, jota (ironisesti nimetty) OpenAI edistää.
- Yhdysvaltojen ja Kiinan välinen AI‑kilpailu kiristyy entisestään.
- Edistyneiden AI‑sirujen vientirajoitukset Kiinaan ovat epäonnistuneet, joko koska DeepSeek pääsi niihin silti tai koska ne eivät olleet lainkaan tarpeen.
- Taustalla Huawei todennäköisesti toimii myös vakavana kilpailijana, joka toimittaa DeepSeekille lisää siruja.
- Tämä ei ehkä pysäytä joitakin, jotka edelleen yrittävät.
“Se, että DeepSeek onnistui rakentamaan R1:n, osoittaa lokakuun 2022 vientirajoitusten epäonnistuneen vaikutuksen viivästymisen. Mutta hyvin pian elämme lokakuun 2023 vientirajoitusten menestyksen läpi.”
Mr Greg Allen, Wadhwani AI -keskuksen johtaja Strategic and International Studies -keskuksessa.
Unohda DeepSeek, entä TikTok‑kosto?
Tärkeä uutinen on jäänyt huomiotta paniikissa analysoitaessa ja salaliittoteorioita DeepSeekin ympärillä.
Toinen kiinalainen yritys, TikTok‑luoja ByteDance, julkaisi Doubao‑1.5‑pro:n 24 tammikuuta – oma vastauksensa ChatGPT‑4o:lle.
Se on myös hinnoiteltu paljon halvemmalla kuin amerikkalaiset vastineet, 5‑kertaisesti halvemmalla kuin DeepSeekin malli ja yli 200‑kertaisesti halvemmalla kuin OpenAI:n GPT‑4o.
Uusi Doubao 1.5 Pro käyttää tehokkaampaa lähestymistapaa AI‑mallinsa kouluttamiseen, minkä ByteDance väittää tasapainottavan järjestelmän suorituskykyä alhaisemmilla kustannuksilla.
Tämä saavutetaan suunnittelulla, joka yhdistää sekä mallin koulutuksen että reaaliaikaisen käytön, optimoiden sen parempiin tuloksiin pitäen infrastruktuurikustannukset alhaisina.
Lähde: Financial Express
Tämä malli myös päihittää OpenAI:n, Anthropicin ja Alibaban johtavat mallit.

Lähde: AI Entrepreneur
Jos tämä on itsenäisen ponnistuksen tulos, se osoittaisi, että sirupula on pakottanut kiinalaiset yritykset kilpailemaan tehokkuudessa, paljastaen tietynlaista itsekeskeisyyttä amerikkalaisissa AI‑yrityksissä, jotka ovat hukassa näennäisesti rajoittamattoman rahan ja laskentatehon kanssa.
On myös epätodennäköistä, että ByteDance, kuukausien taistelun jälkeen välttääkseen TikTok‑kieltoa tai pakotettua myyntiä Yhdysvalloissa, olisi etsinyt keinoja kilpailla ja kostaa.
Muut kiinalaiset mallit
Kun kaksi yritystä nyt näennäisesti murskaa AI‑markkinat hinnalla samankaltaisesta suorituskyvystä, huomio kääntyy todennäköisesti myös muihin kiinalaisiin AI‑malleihin. Näihin voi kuulua:
Kun tarkastelee tätä lintuperspektiivistä sen sijaan, että keskittyisi pelkästään DeepSeekiin, vaikuttaa siltä, että Kiinasta on tulossa tulva uusia, parannettuja AI‑malleja, eikä kyse ole pelkästään DeepSeekin yllätyslähteestä, kuten usein kuvataan.
Päätelmä
Kun AI‑sota kiristyy, ei ole enää niin selvää, että rahoituksen saatavuus ja laskentatehon nopea skaalaus olisivat ainoita määrääviä tekijöitä.
Myös on epäselvää, kuinka kannattavaa sektori lopulta on, jos LLM‑tokenien hinnat voivat romahtaa 50‑200‑kertaisesti yön yli saman suorituskyvyn säilyessä. Kuitenkin tämän ei pitäisi aiheuttaa liian voimakasta reaktiota. Lopulta halvempi ja tehokkaampi AI tarkoittaa myös AI:ta, joka omaksutaan massiivisesti ja on kaikkialla läsnä.
Tämä myös tarkoittaa, että AI‑sirujen lopullinen kysyntä todennäköisesti pysyy korkeana, vaikka aluksi ennustettua hieman vähemmän.
Yhtä tärkeää on, että laajasti saatavilla olevat ja ultra‑halvat LLM‑mallit avoimen lähdekoodin kautta merkitsevät varhaista saapumispäivää kaikille AI:n vaikutuksille työmarkkinoihin, tuottavuuteen, valmistukseen, koulutukseen, kansainväliseen kauppaan jne.











