Das erst ein Jahr alte chinesische KI-Startup DeepSeek hat im Sillicon Valley für Aufsehen und Aufregung gesorgt. Seine KI-Modelle zeigen Leistungen, die mit den besten Chatbots der Welt vergleichbar sind - dabei aber nur einen Bruchteil der Kosten verursachen. DeepSeek könnte eine Gegenthese zu der weit verbreiteten Annahme liefern, dass die Weiterentwicklung künstlicher Intelligenz immer mehr Rechenleistung und Strom erfordern wird.

Der Hype um DeepSeek liess weltweit Technologieaktien absacken. Anleger fürchten sowohl einen sich verschärfenden Preiswettbewerb unter den Modellen als auch Druck auf das Geschäft der Hardwarelieferanten.

Was genau ist DeepSeek?

DeepSeek wurde 2023 ins Leben gerufen von Liang Wenfeng, dem Gründer des KI-gesteuerten quantitativen Hedgefonds High-Flyer. Das Unternehmen entwickelt seine Modelle auf Open-Source-Basis. Der Programmcode ist somit von der Entwicklergemeinschaft überprüfbar und kann von ihr weiterentwickelt werden. Die mobile App des Unternehmens schoss nach ihrer Veröffentlichung Anfang Januar an die Spitze der iPhone-Download-Charts in den USA.

Von Chatbots wie ChatGPT von OpenAI unterscheidet sich die App dadurch, dass sie ihre Argumentation für den Nutzer sichtbar artikuliert, bevor sie eine Antwort auf die Eingabe liefert. Das Modell R1 ist nach Angaben von DeepSeek in der Leistung vergleichbar mit der neuesten Version von OpenAI. Das Startup bietet Lizenzen für Einzelpersonen an, die an der Entwicklung von Chatbots interessiert sind. Sie können die Technologie zu einem Preis nutzen, der deutlich unter dem liegt, was OpenAI für Vergleichbares verlangt.

Wie schneidet DeepSeek R1 im Vergleich zu OpenAI oder Meta AI ab?

Laut DeepSeek ist R1 in mehreren führenden Benchmarks - wie dem Mathematiktest AIME 2024, dem Allgemeinwissenstest MMLU und im Frage-Antwort-Test von AlpacaEval 2.0 - fast genauso gut oder besser als Konkurrenzmodelle. Zudem gehört das Modell zu den Top-Performern auf einer Rangliste der Website Chatbot Arena, die in Zusammenarbeit mit der University of California in Berkeley zur Nutzung von KI-Modellen einlädt.

Obwohl das Unternehmen keine genauen Angaben macht, scheinen die Kosten für das Training und die Entwicklung der DeepSeek-Modelle nur einen Bruchteil dessen betragen zu haben, was für die besten Produkte von OpenAI oder Meta Platforms erforderlich war.

Die deutlich bessere Effizienz stellt die Notwendigkeit hoher Kapitalausgaben für den Erwerb der neuesten und leistungsstärksten KI-Beschleuniger von Unternehmen wie Nvidia in Frage. Fragezeichen ergeben sich auch mit Blick auf die US-Beschränkungen für den Export modernster Chips nach China, die einen Durchbruch wie den von DeepSeek verhindern sollten.

Was löst in den USA Alarm aus?

Washington hat den Export von High-End-Technologien wie GPU-Chips nach China verboten, um die Fortschritte des Landes im Bereich der KI - dem wichtigsten Bereich im Kampf um die technologische Vorherrschaft zwischen den USA und China - zu bremsen.

Die Fortschritte von DeepSeek deuten jedoch darauf hin, dass es den chinesischen KI-Ingenieuren gelungen ist, die Beschränkungen zu umgehen, indem sie sich auf die Steigerung der Effizienz mit begrenzten Ressourcen konzentrierten. Zwar ist nach wie vor unklar, inwieweit DeepSeek Zugang zu fortschrittlicher KI-Trainingshardware hatte. Das Unternehmen hat jedoch genug demonstriert, um zu zeigen, dass die Handelsbeschränkungen den Fortschritt Chinas nicht gänzlich aufhalten konnten.

Wann hat DeepSeek das weltweite Interesse geweckt?

Der KI-Entwickler wird seit der Veröffentlichung seines ersten Modells im Jahr 2023 genau beobachtet. Im November gab das Unternehmen dann der Welt einen Einblick in sein DeepSeek R1-Argumentationsmodell, das menschliches Denken nachahmen soll. Dieses Modell bildet die Grundlage für seine mobile Chatbot-App, die zusammen mit dem Webinterface im Januar als viel günstigere OpenAI-Alternative weltweite Bekanntheit erlangte. Der Tech-Investor Marc Andreessen bezeichnete DeepSeek R1 als den «Sputnik-Moment der KI».

Die mobile App DeepSeek wurde bis zum 25. Januar rund 1,6 Millionen Mal heruntergeladen und belegte laut Daten des Marktbeobachters App Figures Platz eins in den iPhone-App-Stores in Australien, Kanada, China, Singapur, Grossbritannien und den USA.

Wer ist der Gründer von DeepSeek?

Der 1985 in Guangdong geborene Liang erwarb einen Bachelor- und einen Master-Abschluss in Elektro- und Informationstechnik an der Universität Zhejiang. Wie aus der Unternehmensdatenbank Tianyancha hervorgeht, gründete er DeepSeek mit einem Stammkapital von 10 Millionen Yuan (1,3 Millionen Euro).

Der Engpass für weitere Fortschritte liege nicht in der Beschaffung weiterer Mittel, sagte Liang in einem Interview mit der chinesischem Plattform 36kr. Das Problem seien hingegen die Beschränkungen der USA beim Zugang zu den besten Chips.

Die meisten seiner Top-Forscher seien frischgebackene Absolventen chinesischer Spitzen-Universitäten, so Liang. Seiner Ansicht nach muss China ein eigenes heimisches Ökosystem entwickeln, das dem um Nvidia und dessen KI-Chips aufgebauten ähnelt.

«Mehr Investitionen führen nicht unbedingt zu mehr Innovation. Andernfalls würden grosse Unternehmen alle Innovationen übernehmen», sagte Liang.

Wo steht DeepSeek in der KI-Landschaft Chinas?

Chinas Tech-Riesen - von Alibaba und Baidu zu Tencent - haben viel Geld und Ressourcen in den Wettlauf um den Erwerb von Hardware und Kunden für ihre KI-Projekte gesteckt. Neben dem Startup 01.AI («Yi») von Kai-Fu Lee zeichnet sich DeepSeek durch seinen Open-Source-Ansatz aus, der darauf ausgelegt ist, schnell die grösste Benutzerzahl zu gewinnen, bevor auf der Grundlage dieses grossen Publikums Monetarisierungsstrategien entwickelt werden.

In China gibt es unter den grössten KI-Akteuren bereits einen Preiskampf. In den letzten anderthalb Jahren wurden mehrfach die Preise gesenkt.

Welche Auswirkungen hat dies auf den globalen KI-Markt?

Der Erfolg von DeepSeek könnte OpenAI und andere amerikanische Anbieter zwingen, ihre Preise zu senken, um ihren etablierten Vorsprung zu halten. Er stellt aber auch die enormen Ausgaben von Unternehmen wie Meta und Microsoft in Frage, wenn effizientere Modelle mit einem viel geringeren Aufwand konkurrieren können. Beide Unternehmen haben sich in diesem Jahr zu Investitionen in Höhe von mindestens 65 Milliarden Dollar verpflichtet - hauptsächlich für KI-Infrastruktur.

Dieser Umstand brachte die globalen Aktienmärkte ins Wanken, da Investoren Unternehmen wie Nvidia und ASML abstiessen, die von der boomenden Nachfrage nach KI-Dienstleistungen profitiert haben. Aktien chinesischer Unternehmen, die mit DeepSeek in Verbindung stehen - wie etwa Iflytek - stiegen hingegen.

Weltweit haben Entwickler bereits mit der Software von DeepSeek experimentiert und versuchen, damit Tools zu entwickeln. Dies könnte die Einführung fortschrittlicher KI-Argumentationsmodelle beschleunigen - und gleichzeitig zusätzliche Bedenken hinsichtlich der Notwendigkeit von Leitplanken für deren Verwendung aufkommen lassen. Die Fortschritte von DeepSeek könnten die Regulierung beschleunigen, um die Entwicklung von KI zu kontrollieren.

Was sind die Schwachstellen von DeepSeek?

Wie alle anderen chinesischen KI-Modelle zensiert sich DeepSeek selbst bei Themen, die in China als sensibel gelten. Es weicht beispielsweise Anfragen zu den Protesten von 1989 auf dem Tiananmen-Platz oder geopolitisch brisanten Fragen wie der Wahrscheinlichkeit einer Invasion Taiwans durch China aus. In Tests ist der DeepSeek-Bot in der Lage, detaillierte Antworten zu politischen Persönlichkeiten wie dem indischen Premierminister Narendra Modi zu geben, weigert sich jedoch, dies über den chinesischen Präsidenten Xi Jinping zu tun.

Die Cloud-Infrastruktur von DeepSeek wird wahrscheinlich wegen seiner plötzlichen Beliebtheit auf die Probe gestellt. Das Unternehmen erlebte am 27. Januar kurzzeitig einen grösseren Ausfall und wird noch mehr Datenverkehr bewältigen müssen, da neue und wiederkehrende Benutzer mehr Anfragen an seinen Chatbot senden.

(Bloomberg)