Künstliche Intelligenz

DeepSeek: Eine volatile und frühe Ankunft von kommerzialisierter KI?

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

DeepSeek verwüstet die KI-Landschaft

Für alle, die am Montag, dem 27.ten Januar 2025, die Finanzmärkte beobachteten, war die Frage wahrscheinlich: „Was ist passiert?“ Der scheinbar unaufhaltsame Anstieg des Nvidia-Aktienkurses – bis jetzt – wurde durch einen brutalen Rückgang von 18 % an nur einem Tag unterbrochen.

Mit einem Börsenwertverlust von 560 Mrd. $, hat noch nie ein einzelnes Unternehmen an einem Tag so viel Wert verloren. Außerdem gewöhnen sich Nvidia‑Investoren wahrscheinlich an die extreme Volatilität der Aktie, die 8 der 10 größten Tagesverluste verursacht hat.

Der Auslöser war die Veröffentlichung von DeepSeek, einem in China entwickelten LLM (Large Language Model), das in der Leistung mit den besten Produkten von OpenAI und anderen führenden KI‑Firmen konkurriert. Es ist jedoch Open‑Source und zu einem sehr niedrigen Preis zugänglich. Außerdem wird behauptet, dass es mit nur 6 Mio. $ als „Nebenprojekt“ eines quantitativen Hedgefonds entwickelt wurde.

Falls das zutrifft, könnte es das Narrativ umkrempeln, dass die Entwicklung von KI extrem rechenintensiv sei und Milliarden, wenn nicht Billionen, an KI‑Rechenzentren erfordere. Als Marktführer für KI‑Hardware ist es nicht überraschend, dass Nvidia von den panischen Investoren am stärksten getroffen wurde.

Während sich der Staub ein wenig legt, wollen wir untersuchen, was DeepSeek tatsächlich leisten kann und was die chinesische KI‑Industrie bald noch tun könnte.

DeepSeek‑Hintergrund

High-Flyer

DeepSeek wurde von einem chinesischen Finanz‑Handels‑/ quantitativen Hedgefonds, High-Flyer, entwickelt, der von Liang Wenfeng gegründet wurde.

Liang ist 40 Jahre alt und arbeitete zunächst im Bereich der maschinellen Bildverarbeitung. Er gründete High‑Flyer im Jahr 2015, in seinen 30ern, und war Vorreiter beim Einsatz von KI in Handelsstrategien, wobei er maschinelles Lernen nutzte. Der Fonds verwaltet heute 8 Mrd. $ an Vermögen.

Normalerweise sehr zurückhaltend, wurde Liang neben dem chinesischen Premier Li Qiang (dem ranghöchsten Mitglied des Ständigen Ausschusses des Politbüros der Kommunistischen Partei Chinas) bei einem Treffen über KI‑Technologie in Peking am 20. Januar 2025 gesehen.

Es sollte darauf hingewiesen werden, dass in der anfänglichen Verwirrung und aufgrund von Liangs seltenen öffentlichen Auftritten viele Medien das Bild einer Person mit demselben Namen verwendet haben, die jedoch völlig nichts mit DeepSeek zu tun hat und als Innenarchitekt arbeitet.

„Not Liang Wenfeng“ – Quelle: Business Day

DeepSeek

Im Jahr 2021 kaufte Liang Wenfeng etwa 10.000 H800‑Nvidia‑Chips, bevor die US‑Sanktionen trafen, um das zu starten, was später DeepSeek werden sollte, und brachte die Top‑Forscher von High‑Flyer AI in das Projekt ein.

Die H800‑Chips sind im Vergleich zu den fortschrittlicheren H100‑ und B200‑Chips relativ leistungsschwach und verbrauchen das Dreifache an Energie.

DeepSeek behauptet, sein DeepSeek‑V3‑Modell in weniger als 2 Monaten für 5,58 Mio. $ trainiert zu haben. Zwar beinhaltet das nicht die Kosten der 10.000 H800‑Chips, ist aber dennoch um mehrere Größenordnungen günstiger als alle anderen LLMs bisher.

Tatsächlich würde das Training von DeepSeek V3 günstiger sein als allein das Gehalt der Leiter von KI‑Teams bei OpenAI, Meta, Microsoft, Google usw.

DeepSeek‑Leistungen

Zusammen mit dem niedrigen Entwicklungspreis war es für Analysten und Investoren schockierend, dass die Leistung von DeepSeek ähnlich oder vielleicht sogar überlegen gegenüber dem neuesten und besten Modell von OpenAI und anderen Top‑KI‑Unternehmen ist, einschließlich des gerade veröffentlichten und als potenzielle AGI o3 gefeierten Modells.

Quelle: GitHub

Die unmittelbare Reaktion war, unlauteres Spiel zu vermuten und dass die Zeit- und Entwicklungskosten gefälscht seien (mehr dazu weiter unten).

Aber in jedem Fall ist es wahrscheinlich, dass DeepSeek‑Methode 10‑100 mal effizienter ist als das, was die KI‑Industrie bisher getan hat.

Der zusätzliche Tritt in die Schienbeine der amerikanischen KI‑Industrie war der Preis von DeepSeek. Mit Tokens weit unter 1 $ liegt er bei etwa 3 %‑5 % des Preises aller Wettbewerber.

Quelle: Jason Clarck

„Wir haben die Preise gesenkt, weil erstens, während wir nächste‑Generation‑Modellstrukturen erforschten, unsere Kosten gesunken sind; zweitens glauben wir, dass sowohl KI‑ als auch API‑Dienste für alle erschwinglich und zugänglich sein sollten.“
Liang Wenfeng

Perfektes Timing

Der wirkungsvolle Start von DeepSeek V3 war offensichtlich vom Unternehmen gut koordiniert, um maximale Wirkung zu erzielen.

Er kam nur wenige Tage nach der Ankündigung von Präsident Trump über „Project Stargate“, einer 500 Mrd. $‑Initiative zum Bau von 20 KI‑Mega‑Rechenzentren, geleitet von SoftBank (SFTBY ), OpenAI und Oracle (ORCL ).

Während die Märkte in Panik gerieten, schien der US‑Präsident weitgehend unbeeindruckt.

„Wenn man es günstiger machen könnte, wenn man es für weniger machen könnte und zum gleichen Endergebnis kommt, denke ich, das ist gut für uns.“

Er sagte außerdem, er sei nicht besorgt über den Durchbruch und fügte hinzu, dass die USA weiterhin ein dominierender Akteur in diesem Bereich bleiben werden.

Quelle: BBC

Nach LLM, Bildgenerierung

Der Erfolg, den DeepSeek im Bereich LLM erzielt hat, soll nun mit der KI‑Bildgenerierung und der Veröffentlichung von Janus‑Pro‑7B wiederholt werden.

Quelle: Hugging Face

Obwohl darüber diskutiert wird, ob es tatsächlich so gut ist wie Midjourney, DALL‑E und andere Bildgeneratoren, ist es dennoch beeindruckend.

Und wenn es dem Muster von DeepSeek v3 LLM folgt, wird es wahrscheinlich bemerkenswert effizient sein.

Die unmittelbaren Auswirkungen

Auswirkungen auf die KI‑Industrie

Da es die KI‑Industrie im Sturm eroberte, hatte DeepSeek einige unmittelbare Konsequenzen:

  • Marktturbulenzen: Der Nvidia-Aktienkurs und der gesamte Nasdaq brachen ein, als die Märkte die Implikation erkannten, dass potenziell Hunderte Milliarden Dollar an KI‑Hardware verschwendet werden könnten (siehe unten für weitere Diskussion zu diesem Thema).
  • Beschleunigung des KI‑Rennens: Da China sich von einem vor einigen Monaten von US‑Technik-Mogulen als „unbedeutend“ abgewiesenen Land zu einem ernsthaften Akteur entwickelt, findet nun ein neues KI‑Rennen über den Pazifik hinweg statt.
  • Überraschender Erfolg über Nacht: DeepSeek ist fast sofort zur meist heruntergeladenen App im App Store geworden.
  • Offline‑Tests: Viele testen, wie es lokal auf ihrem High‑End‑Heimcomputer laufen kann, da die Rechenanforderungen im Vergleich zu früheren LLMs deutlich geringer zu sein scheinen.

Kollateralschäden

Die durch DeepSeek verursachten Schäden beschränkten sich nicht nur auf das Image und die potenziellen zukünftigen Gewinne amerikanischer KI‑ und Technologieunternehmen.

Beispielsweise wurden innovative Kernenergieunternehmen, die als Kern der Stromversorgung für Megawatt‑große KI‑Rechenzentren gelten sollten, noch stärker getroffen: Am 27.ten Januar 2025 war der SMR‑Entwickler Nuscale (SMR ) um 27,5 % gefallen und der Uranbergbauunternehmen Cameco um 15 %.

Ein weiteres Kollateralopfer sind nicht‑US‑Technologieaktien. Japanische Technologiewerte wie Advantest, ein Lieferant von Nvidia, fielen ebenfalls um 8,6 % und die Softbank-Aktie sank um 8,3 %. Gleichzeitig fiel der niederländische Chip‑Hersteller ASML um 6,5 %.

Wie hat DeepSeek das geschafft?

Noch keine eindeutige Antwort

Dies ist offensichtlich ein nach wie vor heiß diskutiertes Thema kurz nach der Veröffentlichung. Wir können einige verschiedene Standpunkte diskutieren, sobald wir einige bekannte Fakten berücksichtigen.

Die erste Tatsache ist, dass DeepSeek V3, egal wie es entstanden ist, so leistungsstark ist wie die bisher beste veröffentlichte KI.

Vielleicht noch wichtiger ist, dass es Open‑Source ist und viele bereits testen und bestätigen, dass es viel weniger Rechenleistung benötigt.

„DeepSeek R1 ist einer der erstaunlichsten und beeindruckendsten Durchbrüche, die ich je gesehen habe – und als Open‑Source ein tiefgreifendes Geschenk an die Welt.“ – Marc Andreessen

Daher sollte es nicht einfach als „Hype“ oder das Ergebnis einer Verschwörung der chinesischen Regierung abgetan werden. Diese Ansicht teilen auch angesehene Schwergewichte aus dem Silicon Valley wie Marc Andreessen und Chamath Palihapitiya.

„Der Bau von KI‑Modellen ist eine Geldfalle (…) Open‑Source ist der klare Gewinner.
Geschlossene KI‑Modelle werden gezwungen sein, ihre besten Modelle geheim zu halten und an Unternehmen zu verkaufen ODER zu versuchen, daraus eine unglaubliche Verbraucher‑App zu machen.“ – Chamath Palihapitiya

Ein Interview mit Liang Wenfeng aus dem Juli 2024, das kurz nach der Veröffentlichung von DeepSeek V2 stattfand, kann uns ebenfalls einige Einblicke geben.

Ein anderer Ansatz

Die erste mögliche Erklärung ist, dass DeepSeek einfach eine andere Strategie für die KI‑Entwicklung verfolgt hat.

Ein entscheidender Faktor ist, dass dies ein internes Projekt von Liang Wenfengs Unternehmen ist und nicht von Risikokapital finanziert wird. In dieser Hinsicht erinnert es ein wenig an die frühen Tage von Tesla und SpaceX, die auf Elon Musks eigenes Geld setzten.

Dieser Unterschied führte bei DeepSeek zu einem Fokus auf die Entwicklung einer eigenen Modellstruktur, anstatt Llamas zu kopieren, um schnell Anwendungen zu erstellen.

„Unser Ziel ist AGI (Artificial General Intelligence), was erfordert, dass wir neue Modellstrukturen erforschen, um über begrenzte Ressourcen hinweg überlegene Fähigkeiten zu erreichen. Das ist Grundlagenforschung für Skalierung. Neben der Architektur haben wir Datenaufbereitung und menschenähnliches Denken untersucht – alles spiegelt sich in unseren Modellen wider.“ – Liang Wenfeng

Dies spiegelt sich auch in der Unternehmenskultur wider, die weniger auf Gewinn ausgerichtet ist, da dies die „Aufgabe“ des High‑Flyer‑Hedgefonds ist. Stattdessen ist Innovation selbst das erklärte Ziel.

„Seit drei Jahrzehnten haben wir Gewinn über Innovation gestellt. Innovation ist nicht rein geschäftsgetrieben; sie erfordert Neugier und kreativen Ehrgeiz. Wir sind durch alte Gewohnheiten gefesselt, aber das ist eine Phase.
Die dauerhaft profitabelsten US‑Unternehmen sind Technologieriesen, die auf langfristige F&E setzen.“ – Liang Wenfeng

Aus dieser Perspektive könnte die DeepSeek‑Kultur ein nachhaltiger Vorteil sein und stellt eine scharfe Kritik an den meisten KI‑Vordenkern dar.

„Wir glauben, dass Chinas KI nicht für immer ein Nachahmer bleiben kann. Oft sagen wir, es gäbe eine ein‑ bis zweijährige Lücke zwischen chinesischer und amerikanischer KI, aber die eigentliche Lücke liegt zwischen Originalität und Imitation. Wenn sich das nicht ändert, wird China immer ein Nachahmer bleiben. Einige Erkundungen sind unvermeidlich.“ – Liang Wenfeng

Die natürliche Evolution der KI‑Technologie

Eine weitere Möglichkeit ist, dass mit zunehmender Kompetenz von Forschern im KI‑Bau Innovationen das Feld vorantreiben. Was DeepSeek erreicht hat, würde irgendwann auch ein wagemutiges KI‑Startup tun, wenn die Technologie reift. Und aufgrund von Sanktionen, die den Zugang zu fortschrittlichen Chips einschränken, sind chinesische KI‑Unternehmen die ersten, die sich darauf konzentrieren, mehr mit weniger zu erreichen.

Es könnte auch als langfristige Überlegenheit von Open‑Source‑Software gegenüber geschlossenen, profitorientierten Systemen betrachtet werden, die versuchen, durch Monopolbildung maximalen Gewinn zu erzielen.

Diese Sichtweise wirft ebenfalls kein gutes Licht auf die Hunderte Milliarden Dollar, die Big‑Tech‑Unternehmen allein für 2025 ausgeben wollten.

Daher wäre es weniger ein Anklagepunkt gegen die Überlegenheit von DeepSeek, sondern eher ein Hinweis auf die Bürokratisierung ehemals innovativer Big‑Tech‑Unternehmen, sowohl chinesischer als auch amerikanischer.

Eine Verschwörung

Wahrscheinlich unvermeidlich im Kontext des intensiven Wettbewerbs der Großmächte zwischen dem Westen und Eurasien (Russland / China / Iran) sahen viele schnell in DeepSeek eine feindliche ausländische Operation gegen den wettbewerbsfähigsten Teil der US‑Wirtschaft.

Eine eindeutig abzuweisende Verschwörungstheorie ist, dass es einfach eine Kopie westlicher KIs sei oder seine Leistungen fälsche, obwohl dies bereits unabhängig bestätigt wurde. Da DeepSeek Open‑Source‑Software ist, ist es zudem unlogisch, es als Spyware oder als vom KPCh zensiertes Werkzeug zu bezeichnen, da buchstäblich jeder es einsetzen und frei modifizieren kann.

Ein gültiger Punkt ist jedoch, dass DeepSeek Zugang zu fortschrittlicheren Chips erhalten haben könnte, die offiziell genehmigt und gleichzeitig für den Export nach China verboten sind. In diesem Fall wäre es für das Unternehmen sinnvoll, dies nicht öffentlich zuzugeben und darüber zu lügen.

Eine Möglichkeit ist verdeckte Unterstützung durch die Regierung, von direkter Finanzierung bis hin zum Zugang zu großen Clustern geschmuggelter H100‑Nvidia‑Chips für das Training der KI. Wir wissen zum Beispiel, dass viele Chips nach Singapur verkauft werden und wahrscheinlich weiter nach China.

„Die chinesischen Labore haben mehr H100s, als die Leute denken. Meinem Verständnis nach hat DeepSeek etwa 50.000 H100s, über die sie natürlich nicht sprechen können, weil das gegen die Exportkontrollen der USA verstößt.“ – Alexandr Wang, CEO des Trainingsdaten‑Anbieters Scale AI

Ein weiterer Streitpunkt ist die Trainingskosten, die nicht unabhängig verifiziert wurden.

Eine letzte Möglichkeit ist, dass DeepSeek, unabhängig von jeglicher geopolitischen Verschwörung, massiv gegen die Nvidia‑Aktie gewettet hat, bevor es seine herausragenden Behauptungen veröffentlichte. High‑Flyer ist schließlich ein Hedgefonds, obwohl dies als Marktmanipulation angesehen werden könnte und daher ein riskantes Vorgehen ist.

Erste Erkenntnisse

KI ist ein Feld, das sich unglaublich schnell entwickelt, und DeepSeek hat das Spiel bereits in einigen wichtigen Aspekten verändert:

  • Wir haben jetzt eine neue Methode, ultra‑effiziente LLMs und wahrscheinlich KI‑Modelle im Allgemeinen zu erzeugen.
  • Open‑Source‑KI hat eine solide Chance gegen das geschlossene Modell, das von (ironischerweise benanntem) OpenAI gefördert wird.
  • Der Wettbewerb zwischen den USA und China im Bereich KI wird noch intensiver.
  • Die Sanktionen beim Export fortschrittlicher KI‑Chips nach China sind ein Scheitern, entweder weil DeepSeek sie trotzdem erhalten hat oder weil sie überhaupt nicht benötigt wurden.
    • Im Hintergrund wird Huawei wahrscheinlich ebenfalls ein ernstzunehmender Konkurrent sein, um DeepSeek mit mehr Chips zu versorgen.
    • Dies könnte einige nicht davon abhalten, es weiterhin zu versuchen.

„Die Tatsache, dass DeepSeek R1 bauen konnte, verdeutlicht die nachhinkende Wirkung des Scheiterns der Exportkontrollen von Oktober 2022. Aber sehr bald werden wir den Erfolg der Exportkontrollen von Oktober 2023 erleben.“ – Herr Greg Allen, Direktor des Wadhwani‑AI‑Zentrums am Centre for Strategic and International Studies.

Vergessen Sie DeepSeek, was ist mit TikTok‑Rache?

Ein wichtiges Detail wurde in den panischen Analysen und Verschwörungstheorien rund um DeepSeek übersehen.

Ein weiteres chinesisches Unternehmen, der TikTok‑Ersteller ByteDance, veröffentlichte am 24.ten Januar Doubao‑1.5‑pro – seine eigene Antwort auf ChatGPT‑4o.

Es ist ebenfalls deutlich günstiger als seine amerikanischen Gegenstücke, 5‑mal günstiger als das Modell von DeepSeek und über 200‑mal günstiger als OpenAIs GPT‑4o.

„Das neue Doubao 1.5 Pro verwendet einen effizienteren Ansatz zum Training seines KI‑Modells, was ByteDance zufolge hilft, die Systemleistung mit geringeren Kosten auszubalancieren.
Dies wird durch ein Design erreicht, das sowohl das Training als auch die Echtzeit‑Nutzung des Modells kombiniert und es für bessere Ergebnisse optimiert, während die Infrastrukturkosten niedrig gehalten werden.“ – Financial Express

Dieses Modell schlägt auch die führenden Modelle von OpenAI, Anthropic und Alibaba.

Wenn dies das Ergebnis unabhängiger Anstrengungen ist, würde es beweisen, dass der Chipmangel chinesische Unternehmen dazu gezwungen hat, auf Effizienz zu setzen, und damit ein gewisses Maß an Selbstgefälligkeit bei amerikanischen KI‑Unternehmen offenbart, die mit scheinbar unbegrenztem Geld und Rechenleistung überflutet sind.

Es ist ebenfalls nicht unwahrscheinlich, dass ByteDance nach monatelangem Kampf, um ein Verbot oder einen erzwungenen Verkauf von TikTok in den USA zu vermeiden, nach Wegen suchte, zu konkurrieren und zurückzuschlagen.

Andere chinesische Modelle

Da nun zwei Unternehmen den KI‑Markt scheinbar mit Preis und ähnlicher Leistung dominieren, wird die Aufmerksamkeit wahrscheinlich auch auf andere chinesische KI‑Modelle gerichtet sein. Dies könnte umfassen:

Betrachtet man es aus der Vogelperspektive und nicht nur fokussiert auf DeepSeek, scheint dies eher eine Flut neuer, verbesserter KI‑Modelle aus China zu sein, als ein überraschender Angriff allein von DeepSeek, wie es bislang häufig beschrieben wurde.

Fazit

Da der KI‑Krieg intensiver wird, ist nicht mehr so klar, dass der Zugang zu Finanzierung und das schnelle Hochskalieren von Rechenleistung der alleinige bestimmende Faktor sein wird.

Es ist ebenfalls unklar, wie profitabel der Sektor letztlich sein wird, wenn die Preise für LLM‑Tokens über Nacht um das 50‑ bis 200‑fache sinken können bei gleicher Leistung. Dies sollte jedoch keine übermäßige Reaktion auslösen. Am Ende bedeutet billigere und effizientere KI auch, dass KI massiv angenommen und allgegenwärtig sein wird.

Das wird auch bedeuten, dass die letztendliche Nachfrage nach KI‑Chips wahrscheinlich hoch bleiben wird, selbst wenn sie etwas geringer ausfällt als zunächst prognostiziert.

Ebenso wichtig bedeutet die Verfügbarkeit weit verbreiteter und ultra‑günstiger LLMs über Open‑Source, dass die Auswirkungen, die KI auf Arbeitsmärkte, Produktivität, Fertigung, Bildung, internationalen Handel usw. haben wird, früher eintreten werden.

Jonathan ist ein ehemaliger Biochemiker-Forscher, der in der genetischen Analyse und klinischen Studien tätig war. Er ist jetzt ein Börsenanalyst und Finanzautor mit Fokus auf Innovation, Marktzyklen und Geopolitik in seiner Publikation The Eurasian Century.