Hangzhou, 3 Uhr: Warum Chinas KI jetzt schneller denkt als die USA zahlen können
Künstliche Intelligenz

Hangzhou, 3 Uhr: Warum Chinas KI jetzt schneller denkt als die USA zahlen können

DeepSeek, Qwen und Airwallex zeigen: Chinas KI-Ökosystem gewinnt nicht durch Größe, sondern durch System – und zwingt den Westen zum Umdenken.

10 Min. Lesezeit~1.930 Wörter

Die unsichtbare Front: Wie China die KI-Schlacht ohne Chips gewinnt

Drei Uhr morgens in Hangzhou: Während die Serverfarmen von DeepSeek die Nacht zum Tag machen, sitzt in San Francisco ein Anthropic-Ingenieur vor einem leeren Bildschirm. Sein Problem ist nicht technischer Natur, sondern geopolitisch. Die neueste Version von Claude, offiziell für den chinesischen Markt gesperrt, wird dort trotzdem genutzt – nicht trotz, sondern gerade wegen der US-Exportkontrollen. Chinesische Entwickler haben längst erkannt, was der Westen noch nicht verstanden hat: Der KI-Wettlauf entscheidet sich nicht in den Rechenzentren, sondern in den Algorithmen, der Finanzinfrastruktur und der Fähigkeit, Systeme statt Modelle zu optimieren.

Die Zahlen zeichnen ein klares Bild: DeepSeeks DSpark-Framework beschleunigt die Inferenz um 60–85 Prozent bei gleichem Durchsatz, wie das Unternehmen in einem technischen Bericht darlegt. Airwallex, der Finanzdienstleister hinter KI-Unternehmen wie Kimi, Zhipu und MiniMax, verwaltet ein Transaktionsvolumen von schätzungsweise 47 Milliarden US-Dollar – ein Indikator für die wirtschaftliche Bedeutung der chinesischen KI-Ökonomie. Während US-Datenzentren 2025 etwa 224 Terawattstunden Strom verbrauchten – rund fünf Prozent des gesamten US-Verbrauchs –, entwickeln chinesische Anbieter Modelle, die mit einem Bruchteil der Kosten vergleichbare Leistungen erbringen. Der Westen diskutiert über Chip-Exporte. China baut eine vollständige KI-Wertschöpfungskette auf.

Kernzahlen:

  • 60–85 % schnellere Inferenz durch DSpark (DeepSeek)
  • Geschätztes Transaktionsvolumen von Airwallex: 47 Mrd. USD (Finanzinfrastruktur für KI)
  • 88 % Marktanteil chinesischer Open-Weight-Modelle bei Entwicklern (laut Analysten)
  • 224 TWh Stromverbrauch US-Datenzentren 2025 (ca. 5 % des US-Stroms)

Der Algorithmus als Waffe: Warum DSpark die Spielregeln ändert

Laut dem DeepSeek-Forschungsteam kombiniert DSpark die Vorteile paralleler und sequentieller Architekturen, um die Generierungsgeschwindigkeit deutlich zu steigern. Die Technik basiert auf Speculative Decoding, bei dem ein kleines „Draft-Modell“ Tokens vorhersagt, die das Hauptmodell anschließend verifiziert. Während frühere Ansätze entweder an langsamer Generierung oder sinkenden Akzeptanzraten scheiterten, vereint DSpark beide Welten: Ein paralleles Backbone generiert Basislogits, ein sequentieller Kopf passt sie kontextabhängig an. Das Ergebnis ist eine halbautoregressive Architektur, die die Vorteile beider Methoden nutzt.

In der Praxis führt dies zu einer Beschleunigung der Generierungsgeschwindigkeit um 60–85 Prozent, ohne den Gesamtdurchsatz zu beeinträchtigen. Noch entscheidender ist die Fähigkeit von DSpark, die Überprüfungslänge dynamisch an die GPU-Auslastung anzupassen. Ein Mechanismus, der als „Confidence Head“ bezeichnet wird, schätzt die Überlebenswahrscheinlichkeit jedes Tokens und verhindert so, dass Rechenleistung für unwahrscheinliche Vorhersagen verschwendet wird.

Doch die eigentliche Innovation liegt in der strategischen Ausrichtung. DeepSeek hat nicht nur das Framework veröffentlicht, sondern mit DeepSpec auch ein Open-Source-Toolkit für das Training von Draft-Modellen bereitgestellt. Damit können Entwickler weltweit Modelle wie Qwen oder Gemma beschleunigen – ohne auf proprietäre Lösungen angewiesen zu sein. Es ist ein gezielter Schachzug: Indem DeepSeek die Hürden für Inferenzoptimierung senkt, bindet es die globale Entwickler-Community an sein Ökosystem und macht gleichzeitig US-Anbieter wie NVIDIA oder Anthropic angreifbar.

ModellAkzeptanzlängen-Gewinn vs. Eagle3Akzeptanzlängen-Gewinn vs. DFlash
Qwen3-4B+30,9 %+16,3 %
Qwen3-8B+26,7 %+18,4 %
Qwen3-14B+30,0 %+18,3 %

Akzeptanzlängen-Gewinn in %Akzeptanzlängen-Gewinn in %

*Quelle: DSpark-Paper (DeepSeek)

Das Geld fließt im Kreis: Wie Airwallex die KI-Ökonomie neu erfindet

Wu Kai, Chief Revenue Officer von Airwallex, beschreibt die Herausforderungen, vor denen KI-Unternehmen stehen: Die Abrechnung nach Token-Verbrauch sei grundlegend anders als die klassische Sitzplatz-Abrechnung im SaaS-Zeitalter. Während traditionelle Softwareunternehmen pro Nutzer oder Monat abrechnen, erfordert KI eine Echtzeit-Verfolgung des Token-Verbrauchs mit gestaffelten Preisen, Budgetlimits und automatischen Modellwechseln.

Airwallex hat darauf mit einer Finanzinfrastruktur reagiert, die Zahlungen, Abrechnung, Budgetkontrolle und Compliance integriert. Das Produkt „Billing“ kombiniert Abonnement-Verwaltung mit nutzungsbasierter Abrechnung und ermöglicht es Unternehmen, gleichzeitig nach Token-Verbrauch, API-Aufrufen oder abgeschlossenen Aufgaben abzurechnen. Für B2B-Kunden bietet Airwallex virtuelle Karten mit individuellen Limits, etwa für Teams, die nur auf bestimmten Plattformen ausgeben dürfen. Dank lokaler Clearing-Netzwerke in über 120 Ländern sind grenzüberschreitende Zahlungen so schnell wie Inlandsüberweisungen.

Der entscheidende Vorteil liegt in der KI-spezifischen Abrechnungslogik. Das System verfolgt den Verbrauch jedes Nutzers in Echtzeit und schaltet bei Erreichen eines Budgets automatisch auf ein günstigeres Modell um. Es ist eine Symbiose aus Finanztechnologie und KI-Operations – und genau das macht Airwallex zum unsichtbaren Rückgrat des chinesischen KI-Booms.

Die Bewertung des Unternehmens stieg innerhalb weniger Monate von 80 auf schätzungsweise 110 Milliarden US-Dollar – getrieben nicht durch Spekulation, sondern durch die Erkenntnis, dass KI eine eigene Finanzinfrastruktur benötigt. Während US-Anbieter wie Stripe oder Adyen noch über Token-Abrechnung diskutieren, hat Airwallex bereits eine Lösung: Es ist nicht nur ein Zahlungsdienstleister, sondern die Bank der KI-Ära.

Der einseitige Technologietransfer: Warum US-Exportkontrollen ins Leere laufen

Matt Sheehan vom Carnegie Endowment for International Peace stellt fest, dass chinesische KI-Entwickler und Politiker weniger Berührungsängste mit US-Technologie haben als umgekehrt. Während Anthropic den Zugang zu Claude in China rigoros blockiert, nutzen chinesische Unternehmen wie Alibaba die Ausgaben von US-Modellen für „Distillation“ – das Training eigener Modelle mit den Ausgaben der US-Konkurrenten.

Dies führt zu einem einseitigen Technologietransfer. Chinesische Entwickler greifen über VPNs, ausländische Telefonnummern oder den Schwarzmarkt auf Claude zu, während US-Unternehmen keinen Zugang zu chinesischen Modellen haben. Die Ironie: Anthropics Exportkontrollen beschleunigen nur die Entwicklung chinesischer Alternativen. Innerhalb von zwei Wochen nach dem Exportstopp für bestimmte US-Modelle brachten chinesische Unternehmen wie 360 mit Tulongfeng und Sakana AI mit Fugu eigene Modelle auf den Markt.

David Ha, CEO von Sakana AI, betont, dass der Zugang zu Top-Modellen plötzlich verschwinden könne. Kollektive Intelligenz und offene Ökosysteme seien der praktische Schutz gegen diese Machtkonzentration. Während Sakana AI betont, dass Fugu keine vollständige Abkehr von US-Modellen bedeute, geht 360 einen Schritt weiter. Gründer Zhou Hongyi warnt vor einer „einseitigen Transparenz“, bei der nur einige Akteure Zugang zu fortschrittlichen KI-Tools hätten, und positioniert Tulongfeng als strategische Ressource.

Die Folgen sind bereits sichtbar. Während Anthropics geschätzter Jahresumsatz 2026 bei rund 47 Milliarden US-Dollar liegt, verliert das Unternehmen nicht nur Kunden, sondern auch die Kontrolle über die Technologie. Chinesische Modelle wie DeepSeek V4 oder Qwen 3 holen in Benchmarks auf – bei einem Zehntel der Kosten. Der Markt hat längst entschieden: Die Zukunft gehört denen, die Systeme bauen, nicht denen, die Modelle horten.

Die Illusion der Kontrolle: Warum US-Exportkontrollen nach hinten losgehen

Die US-Regierung steht vor einem Dilemma: Ihre Exportkontrollen für Chips sollen Chinas KI-Entwicklung bremsen, doch sie erreichen das Gegenteil. Statt die Innovation zu verlangsamen, zwingen sie chinesische Unternehmen, effizienter zu werden – und schaffen gleichzeitig Anreize für die Entwicklung eigener Alternativen.

Huaweis Ascend 910C ist das beste Beispiel. Der Chip, der aus zwei 910B-Chips in einem Package besteht, nutzt TSMC-7nm-Wafer und Samsungs HBM2e-Speicher – beides offiziell verboten, aber über Umwege verfügbar. Die Leistung liegt bei etwa 60 Prozent eines NVIDIA H100, doch die Strategie zielt nicht auf Benchmark-Parität, sondern auf Masse. Huaweis Atlas 950 SuperCluster verbindet bis zu 500.000 Ascend-Chips über das eigene UnifiedBus-2.0-Protokoll – und verbraucht dabei deutlich mehr Strom als vergleichbare NVIDIA-Systeme.

Doch in China ist Strom kein limitierender Faktor. Während US-Datenzentren um Energie kämpfen, baut China seine Infrastruktur mit staatlicher Unterstützung aus. Die eigentliche Schwäche des Ascend-Chips ist nicht die Leistung, sondern das Software-Ökosystem. Während NVIDIA auf CUDA setzt, muss Huawei sein eigenes Framework aufbauen – ein langwieriger Prozess, der jedoch durch die Notwendigkeit beschleunigt wird.

Die US-Strategie geht von einer falschen Prämisse aus: Dass Chinas KI-Entwicklung linear von der Chip-Leistung abhängt. Doch wie DeepSeek mit DSpark zeigt, ist die Effizienz der Algorithmen genauso wichtig wie die Hardware. Während die USA über Exportkontrollen streiten, baut China eine vollständige KI-Wertschöpfungskette auf – von den Chips über die Modelle bis zur Finanzinfrastruktur.

Der Preis der Innovation: Warum Chinas KI-Modelle den Westen unterbieten

Die Preisliste chinesischer KI-Modelle wirkt wie eine Kampfansage an US-Anbieter. DeepSeek V4 Flash kostet 0,06 US-Dollar pro Million Token – etwa ein Zehntel des Preises von Claude Opus. Qwen 3 liegt bei 0,18 US-Dollar, während GPT-5.4 mit 2,50 US-Dollar zu Buche schlägt. Doch der Preisunterschied ist kein Zufall, sondern das Ergebnis struktureller Vorteile.

Blended Preis in USD pro 1 Mio. TokenBlended Preis in USD pro 1 Mio. Token

Chinesische Modelle sind für nicht-englische Märkte optimiert. Während US-Modelle auf riesigen, aber teuren englischen Datensätzen trainiert werden, setzen chinesische Anbieter auf mehrsprachige Trainingsdaten, was die Token-Kosten pro Sprache senkt. Zudem nutzen sie effizientere Architekturen wie Mixture-of-Experts (MoE), bei denen nur ein Bruchteil der Parameter pro Token aktiviert wird. DeepSeek V4 Flash aktiviert beispielsweise nur 13 Milliarden von 284 Milliarden Parametern und erreicht damit eine Inferenzgeschwindigkeit, die selbst NVIDIA herausfordert.

Der größte Vorteil ist jedoch die Open-Source-Strategie. Während US-Anbieter wie OpenAI oder Anthropic ihre Modelle hinter APIs verstecken, stellen chinesische Unternehmen wie DeepSeek oder Qwen die Gewichte frei zur Verfügung. Das senkt nicht nur die Kosten für Entwickler, sondern schafft auch eine Abhängigkeit vom chinesischen Ökosystem. Wer einmal mit Qwen oder DeepSeek gearbeitet hat, wird nicht so schnell zu einem US-Anbieter wechseln – selbst wenn dieser technisch überlegen ist.

ModellBlended Preis (USD/1M Tokens)Intelligenz-Index (Artificial Analysis)
DeepSeek V4 Flash0,0648
GPT-OSS-20B0,0735
DeepSeek V4 Pro0,1852
Claude Opus 4.62,5055

Intelligenz-Index (Artificial Analysis)Intelligenz-Index (Artificial Analysis)

Quelle: Artificial Analysis, OfficeChai

Die europäische Perspektive: Warum der Kontinent zwischen den Fronten steht

Europa hat in diesem Wettlauf ein strukturelles Problem: Es besitzt weder die Chip-Expertise der USA noch die Skaleneffekte Chinas. Während die EU über Regulierung und Zölle diskutiert, nutzen chinesische Unternehmen die Lücken im System und bauen ihre Präsenz in Europa aus.

Airwallex ist hierfür ein prägnantes Beispiel. Das ursprünglich australische Unternehmen hat seinen Hauptsitz nach Singapur und San Francisco verlegt und expandiert aggressiv in Europa. Rund 35 Prozent seines Umsatzes stammen bereits aus der Region, mit einem Wachstum von 170 Prozent in den USA. Die Investorenliste liest sich wie ein Who’s Who der globalen Finanzwelt: Addition, Baillie Gifford, American Express, Mastercard, Visa.

Der eigentliche Hebel ist jedoch die KI-Infrastruktur. Während europäische Banken noch über PSD2 und Open Banking diskutieren, bietet Airwallex bereits eine vollständige Lösung für KI-spezifische Abrechnung, Compliance und Zahlungsabwicklung. Und während die EU über Datenschutzrichtlinien streitet, nutzen chinesische KI-Modelle wie Qwen oder Ernie bereits lokale Rechenzentren in Europa – mit voller Compliance, aber ohne die politischen Auflagen, die US-Anbieter bremsen.

Die Frage ist nicht, ob Europa eine eigene KI-Strategie braucht, sondern ob es noch die Zeit hat, eine zu entwickeln. Chinas Ansatz – Open Source, niedrige Kosten, globale Finanzinfrastruktur – ist schwer zu kopieren, aber leicht zu nutzen. Während europäische Unternehmen noch über Ethik und Regulierung diskutieren, entscheiden sich immer mehr Entwickler für chinesische Modelle – einfach weil sie funktionieren.

Das Paradox: Warum Chinas KI gleichzeitig führend und abhängig ist

Chinas KI-Ökosystem ist ein Widerspruch in sich. Einerseits dominieren Unternehmen wie DeepSeek, Qwen oder Baidu mit innovativen Modellen und globalen Strategien. Andererseits sind sie abhängig von US-Technologie – sei es durch TSMC-Chips, NVIDIA-GPUs (die trotz Exportkontrollen über Umwege verfügbar sind) oder die Trainingsdaten, die sie von US-Modellen „distillieren“.

Doch diese Abhängigkeit ist kein Zeichen von Schwäche, sondern von strategischer Flexibilität. Während der Westen versucht, China durch Exportkontrollen zu isolieren, nutzt China die verfügbaren Ressourcen und baut gleichzeitig eigene Alternativen auf. Der Ascend-Chip ist nicht so gut wie ein NVIDIA H100, aber er ist gut genug. Und während US-Unternehmen wie Anthropic den Zugang zu ihren Modellen blockieren, schaffen chinesische Anbieter mit Open Source und niedrigen Preisen Fakten.

Or Lenchner, CEO von Bright Data, bringt es auf den Punkt: Eine mächtige Intelligenzschicht, die auf einer unzureichenden Wissensbasis aufbaut, sei wie ein Genie ohne Wissen – nutzlos in der Praxis. Intelligenz und Wissen müssten zusammenkommen. Chinas KI-Modelle haben diesen Zusammenhang verstanden. Sie kombinieren effiziente Algorithmen mit globaler Finanzinfrastruktur und einer Open-Source-Strategie, die Entwickler weltweit anzieht.

Der Westen hat noch die besseren Modelle. Aber China hat das bessere System. Und in einem Wettlauf, der sich nicht mehr um einzelne Benchmarks, sondern um Ökosysteme dreht, ist das der entscheidende Unterschied.