NVIDIA Mellanox MCX556A-ECAT in Aktion: RDMA/RoCE ermöglicht Ultra-Low-Latency- und Serverdurchsatz-Durchbrüche

April 23, 2026

Neueste Unternehmensnachrichten über NVIDIA Mellanox MCX556A-ECAT in Aktion: RDMA/RoCE ermöglicht Ultra-Low-Latency- und Serverdurchsatz-Durchbrüche

In verteilten Speichern, High-Performance Computing (HPC) und KI-Training-Clustern haben Netzwerklatenz und CPU-Overhead seit langem die gesamte Servereffizienz eingeschränkt.Eine jüngste Einführung bei einem großen Cloud-Dienstleister zeigt, wie dieNVIDIA Mellanox MCX556A-ECATDiese Herausforderungen werden durch RDMA- und RoCE-Technologien angegangen, wodurch sowohl der Durchsatz als auch die Latenzreduzierung messbar verbessert werden.

Hintergrund und Herausforderungen

Der Kunde betreibt einen mehrpetabyten großen Ceph-Speichercluster, der Tausende von virtuellen Maschinen unterstützt.Ihre 25GbE-Infrastruktur mit Standard-TCP/IP litt unter hoher CPU-Auslastung (mehr als 60% bei Speicherknoten) und inkonsistenter Latenzzeit bei SpitzenlastDas Team brauchte eine Lösung, die CPU-Interventionen reduzieren, die Latenzzeit senken, die Datenverarbeitung verbessern und die Datenverarbeitung verbessern konnte.und ohne vollständige InfrastrukturüberholungNach Überprüfung derDatenblatt MCX556A-ECATund vergleichenSpezifikationen MCX556A-ECAT, wählten sie dieDie in Absatz 1 genannte Angabe ist nicht anwendbar.als Kern-Upgrade-Komponente.

Lösung und Bereitstellung

Die Architektur konzentrierte sich auf dieMCX556A-ECAT Ethernet-Adapterkarte, ein doppelter 100GbE-Adapter, der PCIe 3.0/4.0 x16 unterstützt.MCX556A-ECAT ConnectX Adapter PCIe-Netzwerkkarte, ermöglichte es RoCE v2 über die bestehende Leaf-Spin-Topologie mit minimalen Schaltwechseländerungen.

  • Ersetzen Sie alte 25GbE-Adapter durch dieDie in Absatz 1 genannte Angabe ist nicht anwendbar.auf 40 Speicherknoten und 150 Rechenknoten.
  • Ermöglichen von Hardware-Offloads: NVMe über Fabrics (NVMe-oF), GPUDirect RDMA und T10-DIF für die Datenintegrität.
  • Konfiguration der Priority Flow Control (PFC) und der Enhanced Transmission Selection (ETS) für einen verlustfreien RoCE-Transport.
  • ÜberprüfungKompatibel mit MCX556A-ECATStand mit bestehenden Mellanox-Spektrum-Switches und QSFP28-Optiken.

Die gesamte Bereitstellung dauerte zwei Wochenenden, mit null Ausfallzeiten mit Live-Migration für Rechenarbeitslasten.

Ergebnisse und Vorteile

Die Messungen nach dem Einsatz zeigten dramatische Verbesserungen in allen wichtigen Kennzahlen.

Metrische Vor (25GbE TCP/IP) Nach (MCX556A-ECAT mit RoCE) Verbesserungen
CPU-Auslastung von Speichernoden 62% 18% ↓ 71%
Durchschnittliche Latenzzeit (4K-Zufallslesung) 450 μs 42 μs ↓ 90,7%
Gesamtleistung der Cluster 38 Gb/s 172 Gb/s ↑ 353%
Dauer des Sicherungsfensters 8.5 Stunden 1.8 Stunden ↓ 79%

Über die Zahlen hinaus berichtete das Ingenieurteam, dass RDMA die Nervosität signifikant reduzierte und die Spitzen der "Tail Latence" beseitigte, die zuvor KI-Trainings-Checkpoints plagen.MCX556A-ECAT Ethernet-AdapterkartenlösungDie Karte vereinfachte auch die Fehlerbehebung durch eingebaute Telemetrie und Überlastungsbenachrichtigung.MCX556A-ECAT-PreisDer Anbieter hat die Leistungssteigerung nur durch Einsparungen an CPU-Kern und schnelleren Batch-Aufbau innerhalb von neun Monaten erreicht.MCX556A-ECAT zum VerkaufDurch mehrere Kanalpartner wird dieses Leistungsniveau auch mittelständischen Unternehmen zugänglich gemacht.

Zusammenfassung und Ausblick

Der Einsatz beweist, daß dieDie in Absatz 1 genannte Angabe ist nicht anwendbar.Das System bietet eine hohe Leistungsfähigkeit und bietet eine hohe Leistungsfähigkeit.NVIDIA Mellanox MCX556A-ECATDa 100GbE der neue Standard für Rechenzentrums-Spines wird, werden Lösungen, die auf diesem Adapter basieren, weiterhin die alten TCP/IP-Stacks übertreffen.Für die detaillierte Planung, beziehen sich auf den BeamtenDatenblatt MCX556A-ECAToder mit Lösungsarchitekten konsultieren, um zu validierenKompatibel mit MCX556A-ECATKonfigurationen für Ihre spezifische Umgebung.