Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 in Aktion: Optimierung von Low-Latency-Verbindungen für RDMA/HPC/AI-Cluster

April 14, 2026

Im Zeitalter des Trainings von KI-Modellen im großen Maßstab und von Exascale-HPC hat sich die Netzwerklatenz als die kritischste Engstelle herausgestellt, die die lineare Skalierbarkeit von Clustern einschränkt. Um diese Herausforderung direkt anzugehen, transformiert der Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 InfiniBand-Switch die Art und Weise, wie Forschungseinrichtungen und unternehmensinterne KI-Labore ihre Hochleistungs-Netzwerke entwerfen. Dieser Artikel untersucht ein typisches Bereitstellungsszenario, in dem der 920-9B110-00FH-0D0 deterministische, extrem niedrige Latenzzeiten für RDMA-intensive Workloads liefert.

Hintergrund & Herausforderung: Die Kommunikationsmauer des KI-Clusters

Eine mittelgroße KI-Forschungseinrichtung kämpfte mit GPU-Leerlaufzeiten während des verteilten Trainings über 64 Knoten hinweg. Ihr bestehendes 100-Gb-Ethernet-Netzwerk litt unter Incast-Überlastung, was dazu führte, dass kollektive Kommunikationsoperationen (all-reduce, all-gather) bis zu 40 % der gesamten Trainingszeit in Anspruch nahmen. Netzwerkarchitekten benötigten eine verlustfreie Lösung mit hohem Durchsatz, die in der Lage ist, auf 200 Gbit/s pro Port zu skalieren und gleichzeitig Latenzzeiten unter einer Mikrosekunde beizubehalten. Nach der Bewertung verfügbarer Optionen wählte das Team den 920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR als Kernbaustein für ihre neue Spine-Leaf-Topologie aus.

Lösung & Bereitstellung: Implementierung des InfiniBand-Netzwerks

Die Bereitstellung konzentrierte sich auf NVIDIA Mellanox 920-9B110-00FH-0D0 Switches, die in einer zweistufigen Fat-Tree-Architektur konfiguriert waren. Jeder Compute-Knoten war mit HDR ConnectX-6-Adaptern ausgestattet, die über passive Kupferkabel mit Leaf-Switches verbunden waren. Zu den wichtigsten Implementierungsschritten gehörten:

RDMA über Converged Ethernet (RoCE) Alternative: Natives InfiniBand mit hardwarebasierter Flusskontrolle eliminierte Paketverluste vollständig.
Adaptive Routing: Die 920-9B110-00FH-0D0 InfiniBand-Switch OPN-Lösung ermöglichte eine dynamische Lastverteilung über mehrere Pfade, wodurch die Bildung von Hotspots verhindert wurde.
Netzwerkmanagement: Verwendung von Subnet Manager (OpenSM) mit 920-9B110-00FH-0D0 Spezifikationen zur Bestätigung der Unterstützung von bis zu 2.000 Knoten in einem einzigen Netzwerk.

Vor der Beschaffung überprüften die Ingenieure das 920-9B110-00FH-0D0 Datenblatt, um die Kompatibilität mit vorhandenen Optiken zu validieren. Das 920-9B110-00FH-0D0 kompatiblen Ökosystem umfasste alle wichtigen HDR-Kabelbaugruppen, was die Stückliste vereinfachte. In Bezug auf das Budget erwies sich der 920-9B110-00FH-0D0 Preises als wettbewerbsfähig gegenüber alternativen HDR-Switches, und die Einheiten waren leicht verfügbar (920-9B110-00FH-0D0 zu verkaufen) über NVIDIA-Kanalpartner.

Ergebnisse & Vorteile: Messbare Leistungssteigerungen

Die Telemetrie nach der Bereitstellung zeigte dramatische Verbesserungen bei drei Schlüsselmetriken:

Metrik	Vorher (100GbE)	Nachher (920-9B110-00FH-0D0 HDR)	Verbesserung
Durchschn. All-Reduce-Latenz (64 Knoten)	340µs	78µs	77% Reduzierung
GPU-Leerlaufzeit (Kommunikations-Overhead)	38%	11%	27% absolute Steigerung
Effektive Netzwerkauslastung	62%	94%	+32%

Über die reinen Zahlen hinaus ermöglichte der 920-9B110-00FH-0D0 InfiniBand-Switch OPN dem Team die Skalierung von 64 auf 256 Knoten, ohne das Netzwerk neu gestalten zu müssen. Die deterministische Latenz, die durch die Credit-basierte Flusskontrolle von InfiniBand bereitgestellt wird, erwies sich als wesentlich für die Aufrechterhaltung der Trainingskonsistenz über Hunderte von GPUs hinweg. Ingenieure nutzten auch die hardwarebasierte Störungsmeldung des 920-9B110-00FH-0D0, um Mikro-Bursts in Echtzeit zu identifizieren und zu beheben.

Zusammenfassung & Ausblick: Die Zukunft von KI-Interconnects

Die Bereitstellung bestätigt, dass NVIDIA Mellanox 920-9B110-00FH-0D0 als grundlegendes Element für KI- und HPC-Cluster der nächsten Generation dient. Durch den Ersatz von verlustbehafteten Ethernet-Netzwerken durch verlustfreie InfiniBand können Organisationen bis zu 30 % der GPU-Rechenleistung zurückgewinnen, die zuvor für Kommunikationsunterbrechungen verschwendet wurde. Für Architekten, die neue KI-Infrastrukturen planen, bietet das 920-9B110-00FH-0D0 Datenblatt detaillierte Anleitungen für Topologien, die von kleinen DGX-Clustern bis hin zu Supercomputing-Maßstäben reichen.

Da sich Workloads hin zu größerer Modellparallelität und höherer GPU-Dichte entwickeln, bietet der 920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR einen klaren Upgrade-Pfad zu zukünftigen 400-Gbit/s-Netzwerken durch sein abwärtskompatibles Design. Ob beim Vergleich des 920-9B110-00FH-0D0 Preises mit den operativen Effizienzgewinnen oder bei der Überprüfung von 920-9B110-00FH-0D0 kompatiblen Verkabelungsoptionen, dieser InfiniBand-Switch liefert messbare ROI für datengesteuerte Organisationen.