Künstliche Intelligenz

Chinas KI-Modelle: Benchmarks lügen, die Kosten nicht

DeepSeek R1 trainierte für 5,6 Mio. Dollar – ein Zehntel der westlichen Konkurrenz. Doch die Benchmarks verschweigen, was wirklich zählt: Effizienz, Chip-Abhängigkeit und regulatorische Fesseln.

Von Prof. Max Müller

•28. Mai 2026•5 Min. Lesezeit•~982 Wörter•

5,6 Millionen Dollar. Das ist die Zahl, die alles verändert. Für diesen Betrag trainierte das chinesische KI-Modell DeepSeek R1 im Januar 2025 – mit einer Performance, die laut Benchmarks mit OpenAIs GPT-o1 vergleichbar ist. Zum Vergleich: Die Trainingskosten für GPT-4 werden auf über 100 Millionen Dollar geschätzt. Der Unterschied ist kein Zufall, sondern das Ergebnis einer strategischen Neuausrichtung: China baut KI-Modelle, die mit weniger Ressourcen mehr erreichen. Doch die Benchmarks erzählen nur die halbe Wahrheit.

Benchmarks: Die Illusion der Überlegenheit

DeepSeek R1, Qwen2.5-72B von Alibaba oder Baidus Ernie Bot 4.0 – auf dem Papier schneiden Chinas KI-Modelle in vielen Tests ähnlich gut ab wie ihre westlichen Pendants. Doch Benchmarks wie MMLU oder HumanEval messen vor allem akademische Fähigkeiten: Logik, Sprachverständnis, mathematische Problemlösung. Was sie nicht abbilden, sind die realen Kosten, die Skalierbarkeit und die regulatorischen Hürden, die chinesische Entwickler überwinden müssen.

Ein Beispiel: DeepSeek R1 wurde mit 2.048 Nvidia H800-GPUs trainiert – Chips, die seit Oktober 2023 eigentlich einem US-Exportverbot unterliegen. Dass das Modell trotzdem entstand, zeigt zweierlei: Erstens, China hat Wege gefunden, die Sanktionen zu umgehen, etwa durch graue Märkte oder eigene Alternativen wie Huaweis Ascend 910B. Zweitens, die Effizienz der Modelle ist kein technologischer Durchbruch, sondern eine Notwendigkeit. „Die US-Exportbeschränkungen zwingen uns, mit weniger mehr zu erreichen“, sagt Liang Wenfeng, Gründer von DeepSeek, in einem Interview mit 36Kr. „Das ist kein Wettbewerbsvorteil, sondern ein Überlebensmechanismus.“

Die Chip-Lüge: Huaweis Ascend 910B als Notlösung

Huaweis Ascend 910B ist der meistgenannte Ausweg aus der Chip-Krise. Mit etwa 60% der Trainingsperformance eines Nvidia H100 ist der Chip theoretisch eine Alternative – doch die Praxis sieht anders aus. „Das Problem ist nicht die Hardware, sondern das Ökosystem“, erklärt ein namentlich nicht genannter Ingenieur eines Pekinger KI-Startups. „Nvidias CUDA ist der De-facto-Standard für KI-Entwicklung. Huaweis MindSpore kommt nicht annähernd an die Toolchain, die Bibliotheken und die Community-Unterstützung heran.“

Die Folgen sind messbar: Während westliche Modelle wie GPT-4 oder Googles Gemini auf einer ausgereiften Infrastruktur aufbauen, kämpfen chinesische Entwickler mit Workarounds. Das verlängert die Entwicklungszeit und erhöht die Fehleranfälligkeit. Ein Blick auf die Zahlen zeigt das Dilemma: Der chinesische KI-Markt wuchs 2023 auf 15 Milliarden Dollar – doch nur ein Bruchteil davon fließt in die Entwicklung von Modellen, die mit westlichen Standards mithalten können. Der Rest landet in Anwendungen, die auf bestehende Modelle aufsetzen, etwa in der Automatisierung von Fabriken oder der Optimierung von Lieferketten.

Regulierung: Die unsichtbare Bremse

Chinas KI-Regulierung, die im August 2023 in Kraft trat, verlangt von allen generativen Modellen eine staatliche Zulassung. Sie müssen „sozialistische Kernwerte“ widerspiegeln und dürfen keine Inhalte generieren, die als „subversiv“ eingestuft werden. Für Consumer-Produkte wie Chatbots oder Bildgeneratoren ist das ein massives Hindernis. „Die Regulierung bremst vor allem die Innovation im B2C-Bereich aus“, sagt Robin Li, CEO von Baidu, in einer Analystenkonferenz. „Im Enterprise-Segment, etwa bei der Integration in Suchmaschinen oder Cloud-Dienste, sind wir flexibler.“

Doch selbst im B2B-Bereich gibt es Grenzen. Chinesische KI-Modelle dürfen keine sensiblen Daten verarbeiten, ohne dass diese zuvor von staatlichen Stellen geprüft wurden. Das macht sie für internationale Unternehmen unattraktiv – und erklärt, warum Modelle wie Qwen oder Ernie Bot außerhalb Chinas kaum Fuß fassen. „Für europäische oder US-amerikanische Kunden ist die Compliance ein Albtraum“, sagt Prasun Shah, Global CTO für KI bei PwC UK. „Sie wissen nie, ob ihre Daten in einem chinesischen Modell landen – und was dann damit passiert.“

Die Kostenwahrheit: Warum 5,6 Mio. Dollar nicht gleich 5,6 Mio. Dollar sind

DeepSeeks Trainingskosten von 5,6 Millionen Dollar sind beeindruckend – doch sie verschleiern die wahren Kosten. In China sind Strom, Rechenzentren und Fachkräfte deutlich günstiger als im Westen. Ein KI-Ingenieur in Peking verdient im Schnitt 30.000 Dollar pro Jahr, in San Francisco sind es 200.000 Dollar. Die niedrigeren Lohnkosten fließen direkt in die Trainingsbudgets ein.

Hinzu kommt der staatliche Subventionsdruck. Die chinesische Regierung fördert KI-Entwicklung mit Milliarden – doch die Mittel fließen vor allem in strategische Projekte. „Wenn ein Modell wie DeepSeek R1 entsteht, dann nicht, weil es wirtschaftlich sinnvoll ist, sondern weil es politisch gewollt ist“, sagt ein Analyst der South China Morning Post. „Die Frage ist nicht, ob China KI-Modelle bauen kann, sondern ob sie jemals profitabel sein werden.“

Enterprise-KI: Wo China wirklich führt

Während der Westen über Chatbots und Jobverluste diskutiert, setzt China KI dort ein, wo sie messbaren Nutzen bringt: in der Industrie. Tencents Hunyuan-Modell steuert bereits autonome Lagerroboter in Fabriken von BYD. Alibabas Qwen optimiert Lieferketten für JD.com. Und Baidus Ernie Bot wird in Smart-City-Projekten eingesetzt, etwa zur Verkehrssteuerung in Shenzhen.

Die Zahlen sprechen für sich: Laut IDC wird der chinesische KI-Markt bis 2027 auf 38 Milliarden Dollar wachsen – ein jährliches Wachstum von 26%. Doch der Großteil dieses Wachstums kommt nicht von generativen Modellen, sondern von „Agentic AI“, also KI-Systemen, die eigenständig Aufgaben erledigen. „Der Westen redet über KI als Assistenzsystem. China baut KI als Ersatz für menschliche Arbeitskraft“, sagt Surojit Chatterjee, CEO des KI-Startups Ema. „Das ist der entscheidende Unterschied.“

Ein Beispiel ist Tencents Hy-Memory, ein „zweites Gehirn“ für KI-Agenten, das langfristige Aufgaben wie Projektmanagement oder Content-Erstellung übernimmt. „Hy-Memory reduziert den Token-Verbrauch um 35% und erhöht die Erfolgsquote bei Langzeitaufgaben um 30%“, heißt es in einer Pressemitteilung des Unternehmens. Solche Systeme sind keine Spielerei, sondern die Grundlage für eine neue Art von Unternehmenssoftware – und sie entstehen fast ausschließlich in China.

Die unbequeme Wahrheit

Chinas KI-Modelle sind nicht besser als die des Westens. Sie sind effizienter, weil sie müssen. Sie sind günstiger, weil der Staat sie subventioniert. Und sie sind fokussierter, weil die Regulierung sie in Nischen drängt, in denen sie keine Konkurrenz fürchten müssen. Die Benchmarks lügen nicht – aber sie erzählen nur die halbe Geschichte. Die andere Hälfte handelt von Chip-Mangel, Compliance-Risiken und einem Markt, der sich nicht an akademischen Tests, sondern an industrieller Nutzenmaximierung orientiert. Für Europa und die USA bedeutet das: Der Wettlauf ist nicht verloren, aber er wird auf einem anderen Spielfeld ausgetragen. Und dort hat China bereits die ersten Tore geschossen.