500.000 Chips gegen ein Gesetz – wie China Moores Regel neu definiert
Chips & Halbleiter

500.000 Chips gegen ein Gesetz – wie China Moores Regel neu definiert

Huawei stapelt 7-Nanometer-Chips zu Superclustern, die Nvidias Effizienz ignorieren. Die Strategie: Masse statt Klasse – und ein neuer Benchmark für KI-Hardware.

7 Min. Lesezeit~1.375 Wörter

Chinas Chip-Strategie: Wenn Masse zur Waffe wird

Es ist ein technologischer Wettlauf, der nicht in Nanometern, sondern in Hunderttausenden Prozessoren gemessen wird. Während die USA Chinas Zugang zu modernster Halbleitertechnologie blockieren, setzt Huawei auf eine radikale Alternative: Statt die Transistoren zu verkleinern, stapelt das Unternehmen bestehende Chips in die dritte Dimension – und plant für 2026 einen Supercluster aus 500.000 Ascend-Prozessoren. Die Botschaft ist unmissverständlich: Wo die Fertigungstechnologie an Grenzen stößt, wird schlicht skaliert. Doch dieser scheinbare Notbehelf könnte sich als strategischer Schachzug erweisen – oder als teure Sackgasse, die Chinas Energienetz an den Rand des Kollapses bringt.

Die Physik der Masse

Huaweis Ankündigung des Atlas 950 SuperClusters auf der Huawei Connect 2026 kam nicht von ungefähr. Sie fiel in eine Phase, in der US-Exportbeschränkungen für KI-Chips ihre volle Wirkung entfalteten. Eric Xu, Rotating Chairman von Huawei, formulierte es so: Die Rechenleistung sei und bleibe der entscheidende Faktor für KI – besonders für China. Hinter dieser Aussage verbirgt sich ein Paradigmenwechsel: Während Nvidia und TSMC seit Jahrzehnten das Mooresche Gesetz verfolgen, setzt Huawei auf eine andere Gleichung: Leistung = Chips × Stacking × Skalierung.

Das Prinzip des 3D-Chip-Stackings ist nicht neu, doch Huawei treibt es auf die Spitze. Die Ascend-950PR-Chips, das Rückgrat des SuperClusters, bestehen aus zwei 7-Nanometer-Dies, die per Hybrid Bonding verbunden sind. Jeder Chip verfügt über acht LPDDR5X-Speichermodule – ein Kompromiss, da China noch keine eigene HBM-Produktion (High Bandwidth Memory) in großem Maßstab beherrscht. Während Nvidias H100 mit HBM3e-Speicher eine Bandbreite von 3,35 Terabyte pro Sekunde erreicht, muss Huawei mit deutlich weniger auskommen. Doch das Unternehmen gleicht dies durch schiere Masse aus.

Die Technik dahinter ist beeindruckend: Huaweis UnifiedBus 2.0 soll die Kommunikation zwischen den Chips über große Distanzen mit minimaler Latenz ermöglichen. Doch die Herausforderungen sind gewaltig. Ein Cluster mit 500.000 Chips verbraucht nicht nur enorme Mengen an Energie – Schätzungen zufolge könnte der Strombedarf im dreistelligen Megawattbereich liegen –, sondern stellt auch die Software vor bisher unbekannte Probleme. Wie koordiniert man Hunderttausende Prozessoren, die nicht auf Nvidias CUDA-Ökosystem setzen, sondern auf Huaweis eigenes CANN-Framework? Und wie vermeidet man, dass die Latenz bei der Kommunikation zwischen den Chips die Vorteile der Skalierung zunichtemacht?

Der Benchmark, der fehlt

Hier liegt der größte blinde Fleck der chinesischen Strategie. Während Nvidias Chips seit Jahren in unabhängigen Benchmarks getestet werden, fehlen vergleichbare Daten für Huaweis SuperCluster. Die einzigen verfügbaren Leistungsangaben stammen von Huawei selbst. Analysten schätzen, dass der Ascend 910C etwa 60 % der Inference-Leistung eines Nvidia H100 erreicht, dabei jedoch deutlich mehr Strom verbraucht. Doch diese Zahlen beziehen sich auf einzelne Chips. Bei einem Cluster mit 500.000 Einheiten könnte die Rechenleistung theoretisch die eines Nvidia-Systems übertreffen – allerdings zu einem Preis, der sich nicht in Dollar, sondern in Kilowattstunden und CO₂-Emissionen bemisst.

Leistungsvergleich (Ascend 910C = 60 % der H100-Leistung)Leistungsvergleich (Ascend 910C = 60 % der H100-Leistung)

Ein Beispiel aus der Praxis zeigt die Grenzen dieser Strategie: Z.ai trainierte sein GLM-5.2-Modell mit 744 Milliarden Parametern ausschließlich auf 100.000 Huawei Ascend 910B-Chips. Das Ergebnis war ein Modell, das in einigen Benchmarks mit Anthropics Fable 5 vergleichbar war. Doch der Aufwand war enorm. Während Nvidias H100-Chips für solche Trainingsläufe optimiert sind, musste Z.ai mit weniger effizienter Hardware arbeiten. Experten kommentierten, die US-Exportkontrollen hätten ihr Ziel verfehlt, solche Ergebnisse zu verhindern. Doch der Erfolg hat einen Haken: Er belegt zwar, dass China in der Lage ist, große Modelle zu trainieren – nicht jedoch, dass dies effizient oder kostengünstig gelingt.

Die Software-Lücke

Die eigentliche Achillesferse der chinesischen Chip-Strategie ist nicht die Hardware, sondern das Ökosystem. Nvidias CUDA ist seit über 20 Jahren der De-facto-Standard für KI-Entwicklung. Fast alle großen Frameworks – von PyTorch bis TensorFlow – sind darauf optimiert. Huaweis CANN (Compute Architecture for Neural Networks) und andere chinesische Alternativen wie MindSpore stecken dagegen noch in den Kinderschuhen. Xiang Ligang, Direktor der Zhongguancun Modern Information Consumer Application Industry Technology Alliance, erklärte, chinesische Chips wie Huaweis Ascend-Serie könnten technisch durchaus mit bestimmten Nvidia-Chips mithalten, doch es fehle ihnen an der universellen Anpassungsfähigkeit von CUDA für große Sprachmodelle.

Diese Lücke zeigt sich besonders bei der Kompatibilität mit bestehenden Modellen. Während Nvidias Chips nahtlos in globale KI-Infrastrukturen integriert werden können, müssen chinesische Entwickler oft aufwendige Anpassungen vornehmen. Die China Academy of Information and Communications Technology (CAICT) hat zwar mit dem AISHPerf-Benchmark einen ersten Standard für die Bewertung von KI-Software und -Hardware geschaffen, doch dieser deckt bisher nur fünf einheimische Chips ab und konzentriert sich auf Betriebsintelligenz, nicht auf die Entwicklung neuer Modelle.

Der Staat als Kunde

Doch China hat einen Trumpf, den der Westen nicht besitzt: einen Staat, der bereit ist, als Abnehmer einzuspringen. Der Plan für ein nationales KI-Rechennetzwerk mit einem Volumen von 2 Billionen Yuan (rund 275 Milliarden US-Dollar) sieht vor, dass mindestens 80 % der verwendeten Chips aus heimischer Produktion stammen müssen. Das schafft einen geschützten Markt, in dem Huawei, Cambricon und andere chinesische Hersteller unabhängig von globalen Benchmarks wachsen können. Nvidias CEO Jensen Huang kommentierte dies mit einer Mischung aus Resignation und Sarkasmus: Die Aufgabe eines gesamten Marktes von der Größe Chinas sei strategisch kaum sinnvoll – und habe sich bereits als kontraproduktiv erwiesen.

Doch die Strategie hat ihren Preis. Der Aufbau einer parallelen Chip-Industrie erfordert massive Subventionen. SMIC, Chinas größte Foundry, testet zwar lokale DUV-Lithografie-Maschinen des Startups Yuliangsheng, um die Abhängigkeit von ASML zu verringern, doch Experten zweifeln an der Skalierbarkeit. Während TSMC und Samsung bereits 3-Nanometer-Chips in Massenproduktion fertigen, bleibt SMIC bei 7 Nanometern stecken. Die Folge: Chinas Chips sind nicht nur ineffizienter, sondern auch teurer in der Herstellung. Ohne staatliche Unterstützung wäre die Wirtschaftlichkeit vieler Projekte fraglich.

Das HBM-Dilemma

Ein weiterer Engpass ist der Speicher. High Bandwidth Memory (HBM) ist entscheidend für das Training großer KI-Modelle, doch China kann ihn bisher nicht in ausreichender Menge produzieren. Huawei und andere Hersteller sind auf Importe angewiesen, die durch US-Sanktionen eingeschränkt werden. Die chinesischen Speicherhersteller CXMT und YMTC arbeiten zwar an eigenen HBM-Lösungen, doch die Entwicklung verzögert sich. CXMTs HBM3-Chips überhitzen bei hohen Taktraten, und YMTC plant erst den Einstieg in die HBM-Produktion.

Für Huaweis Ascend 950DT, der Ende 2026 mit chinesischem HBM auf den Markt kommen soll, könnte dies zum Problem werden. Ohne zuverlässigen HBM-Speicher bleibt die Bandbreite ein Flaschenhals – und damit auch die Effizienz der gesamten KI-Infrastruktur.

Die Energie-Frage

Doch selbst wenn China die technischen Hürden überwindet, bleibt ein weiteres Problem: der Strom. Chinas Datenzentren verbrauchen bereits heute enorme Mengen an Energie, und der Ausbau der KI-Infrastruktur wird die Nachfrage weiter steigern. Schätzungen zufolge könnte der Strombedarf chinesischer Rechenzentren bis 2030 um 300 bis 500 Milliarden Kilowattstunden steigen – etwa ein Fünftel des gesamten prognostizierten Zuwachses in China. Die Regierung steht vor einem Dilemma: Einerseits will sie die KI-Entwicklung vorantreiben, andererseits muss sie die Klimaziele einhalten.

Huaweis SuperCluster verschärft dieses Problem. Ein System mit 500.000 Chips könnte leicht 100 Megawatt oder mehr verbrauchen – genug, um eine Kleinstadt zu versorgen. Die Frage ist nicht nur, woher der Strom kommt, sondern auch, wie er zu den Rechenzentren transportiert wird. Chinas Stromnetz ist bereits heute an vielen Stellen überlastet, und der Ausbau der Infrastruktur hinkt hinterher.

Ein historischer Vergleich

Die aktuelle Entwicklung erinnert an die Halbleiterindustrie Japans in den 1980er-Jahren. Damals setzte das Land auf eine ähnliche Strategie: Statt die technologische Führung zu übernehmen, skalierte es die Produktion bestehender Chips und setzte auf staatliche Unterstützung. Das Ergebnis war ein kurzfristiger Boom – gefolgt von einem langen Niedergang, als die USA und Südkorea mit innovativeren Lösungen nachzogen.

Doch China hat einen entscheidenden Vorteil: Es ist nicht nur ein Markt, sondern auch ein Staat, der bereit ist, Milliarden zu investieren, um seine Ziele zu erreichen. Der 2-Billionen-Yuan-Plan ist keine kurzfristige Maßnahme, sondern eine langfristige Wette auf die Zukunft. Ob sie aufgeht, hängt davon ab, ob China die Software-Lücke schließen und die Energieprobleme lösen kann. Gelingt dies, könnte das Land nicht nur Nvidia herausfordern, sondern ein eigenes Ökosystem schaffen – eines, das unabhängig vom Westen funktioniert.

Doch selbst wenn der Plan scheitert, hat China bereits eines erreicht: Es hat gezeigt, dass Sanktionen allein nicht ausreichen, um technologische Entwicklung zu stoppen. Stattdessen zwingen sie die betroffenen Länder, kreative Lösungen zu finden – und manchmal führen diese Lösungen zu Ergebnissen, die niemand erwartet hätte.

„Rechenleistung ist – und wird auch künftig – der Schlüssel für KI sein. Das gilt besonders für China.“ — Eric Xu, Rotating Chairman von Huawei