Technische Lösung von NVIDIA Mellanox MCX653106A-HDAT: RDMA/RoCE-basierter Transport und Server mit geringer Latenz

June 16, 2026

Technische Lösung von NVIDIA Mellanox MCX653106A-HDAT: RDMA/RoCE-basierter Transport und Server mit geringer Latenz

Dieses technische Whitepaper richtet sich an Netzwerkarchitekten, Pre-Sales-Ingenieure und Betriebsleiter. Es konzentriert sich auf dieNVIDIA Mellanox MCX653106A-HDATServer-Adapter und beschreibt, wie man eine Rechenzentrumsnetzwerkinfrastruktur aufbaut, die RDMA/RoCE-Transport im Mikrosekundenbereich und eine extrem hohe Durchsatzleistung ermöglicht.

1. Hintergrund- und Anforderungsanalyse

Moderne Rechenzentren stehen vor drei zentralen Herausforderungen: unvorhersehbare Latenz bei verteiltem Speicher, Bandbreitenmangel in KI-Trainingsclustern und übermäßiger CPU-Verbrauch durch herkömmliche Netzwerkprotokoll-Stacks. Herkömmliche TCP/IP-Lösungen können die Latenzanforderungen im Mikrosekundenbereich von NVMe-oF, Hochfrequenzhandel und Echtzeitanalysen nicht mehr erfüllen. Die Branche benötigt dringend eineMCX653106A-HDAT Ethernet-AdapterkartenlösungDies ermöglicht hardwareentlasteten RDMA-Transport über eine Standard-Ethernet-Infrastruktur und skaliert gleichzeitig den Serverdurchsatz auf 200 Gbit/s.

2. Gesamtentwurf der Netzwerk-/Systemarchitektur

Diese Lösung verwendet eine zweischichtige Leaf-Spine-CLOS-Architektur. Alle Rechen- und Speicherknoten sind über das verbundenNVIDIA Mellanox MCX653106A-HDATzu 25G/100G ToR-Switches. Zu den wichtigsten Designprinzipien gehören:

  • Durchgängiges verlustfreies Netzwerk, ermöglicht durch PFC (Priority Flow Control) und ECN (Explicit Congestion Notification)
  • Dedizierte RDMA-Transportwege für Speicher- und HPC-Workloads
  • Trennung von Kontrollebene (Standard TCP/IP) und Datenebene (RoCEv2)
  • Hardwarebasierte Virtualisierungs-Offloads (SR-IOV, VXLAN/NVGRE/Geneve)

Basierend auf derMCX653106A-HDAT DatenblattDer Adapter liefert eine Port-zu-Port-Latenz von unter 600 ns und unterstützt bis zu 215 Millionen Pakete pro Sekunde, was ihn ideal für Ost-West-Speicherverkehr und Nord-Süd-Anwendungsströme macht.

3. Rolle und Hauptmerkmale des NVIDIA Mellanox MCX653106A-HDAT in dieser Lösung

DerMCX653106A-HDAT ConnectX-Adapter PCIe-Netzwerkkartedient als grundlegende Datenebenen-Engine. Zu seinen Hauptaufgaben gehören:

  • RDMA/RoCE-Beschleunigung:Vollständige Hardware-Auslagerung von RoCEv2, einschließlich Überlastungsmanagement, Verarbeitung von Paketen außerhalb der Reihenfolge und sofortiger Datenplatzierung in Anwendungspuffern.
  • Speicherprotokoll-Offload:Native Unterstützung für NVMe-oF (sowohl TCP- als auch RoCE-Varianten), iSER und SRP, wodurch die softwarebasierte Zielverarbeitung entfällt.
  • Virtualisierung und Mandantenfähigkeit:Bis zu 1.000 virtuelle Funktionen (VFs) pro Port, wobei Overlay-Tunnel-Offload die Kapselung/Entkapselung mit Leitungsgeschwindigkeit gewährleistet.
  • Sicherheit und Telemetrie:Inline-IPsec/TLS-Verschlüsselung mit 200 Gbit/s sowie hardwarebasiertes Fluss-Tracking (z. B. Verbindungs-Tracking, Histogramme).

EntsprechendMCX653106A-HDAT-SpezifikationenDer Adapter unterstützt PCIe 4.0/5.0 x16-Schnittstellen und stellt so selbst bei voller 200-GbE-Leitungsrate keinen hostseitigen Engpass sicher.

4. Bereitstellungs- und Skalierungsempfehlungen (mit typischer Topologie)

Eine validierte Referenztopologie besteht aus:

  • Rechenschicht:48 Dual-Socket-Server, jeweils mit einem ausgestattetMCX653106A-HDAT(Dual-Port-100-GbE-Konfiguration). Ports werden als Aktiv-Aktiv-LAG verbunden.
  • Speicherschicht:12 All-Flash-NVMe-oF-Zielserver mit jeweils zweiMCX653106A-HDAT Ethernet-AdapterkarteEinheiten – eine für den Front-End-Rechenzugriff, eine für die Back-End-Replikation.
  • Netzwerkschicht:Vier 100-GbE-Spine-Switches und acht Leaf-Switches, konfiguriert mit DCBX-, PFC- (Klasse 3 für RoCE) und ECN-Schwellenwerten.

Für eine Skalierung über 200 Knoten hinaus unterstützt die Architektur Multi-Pod-Designs mit EVPN-VXLAN mit Hardware-Offload (vollständig).MCX653106A-HDAT-kompatibelmit den Switches großer Anbieter). Bei der Bewertung der KapazitätMCX653106A-HDAT-Preispro nutzbarem 100-GbE-Port ist etwa 40 % niedriger als bei vergleichbaren Fibre Channel- oder InfiniBand-Lösungen.

5. Betrieb, Überwachung, Fehlerbehebung und Optimierung

Für den effektiven Betrieb von RDMA/RoCE-Bereitstellungen sind spezielle Tools erforderlich. Die folgenden Vorgehensweisen werden empfohlen:

Aspekt Empfohlene Aktionen und Tools
Telemetrie und Sichtbarkeit Aktivieren Sie Hardware-Zähler übermlx5cmdund Prometheus-Exporteur; Überwachen Sie PFC-Pausen, ECN-markierte Pakete und RoCE-Neuübertragungen.
Stauerkennung Verwendenethtool -Sfür Statistiken pro Warteschlange; Bereitstellung des Docker-basierten Überlastungstelemetrie-Kits von NVIDIA.
Firmware- und Treiberverwaltung PflegenMCX653106A-HDAT-kompatibelFirmware-Versionen (≥ 26.35.x) neben DOCA 2.5+ Treiber-Stack.
Optimierungsrichtlinien Stellen Sie MTU=9000 für Jumbo-Frames ein; roce_rx_qos_policy anpassen; Aktivieren Sie die dynamische Interrupt-Moderation für gemischte Arbeitslasten.

Erfassen Sie zur Fehlerbehebung RoCEv2-spezifische Metadaten mitrdmatoolUndibv_devinfo. Zu den häufigsten Fallstricken gehören falsch konfigurierte PFC-Prioritäten (Gewährleistung der Konsistenz über alle Netzwerkgeräte hinweg) und nicht übereinstimmende PCIe-Verbindungsgeschwindigkeiten (Validierung mitlspci -vvv).

6. Zusammenfassung und Wertbewertung

DerNVIDIA Mellanox MCX653106A-HDATbietet eine bewährte, produktionsbereite Plattform zur Umwandlung von Standard-Ethernet-Fabrics in leistungsstarke, verlustfreie Netzwerke. Zu den wichtigsten Wertbeurteilungen gehören:

  • Latenz:Deterministische NVMe-oF-Leselatenz von unter 10 µs (P99) ermöglicht Echtzeitanalysen und HPC-Konvergenz.
  • Durchsatz:200 GbE mit Nearline-Rate ohne Paketverlust, validiert gegenMCX653106A-HDAT-Spezifikationen.
  • CPU-Effizienz:Gibt bis zu 30 % der CPU-Kerne frei, die zuvor von Netzwerk- und Speicherstapeln verbraucht wurden.
  • Gesamtbetriebskosten:Im Vergleich zu proprietären VerbindungenMCX653106A-HDAT zu verkaufenDurch die Preisgestaltung in Kombination mit Standard-Ethernet-Switching werden die Betriebskosten über drei Jahre um schätzungsweise 35–50 % gesenkt.

Architekten und Betriebsleiter können diese Lösung bedenkenlos für KI-Fabrics, disaggregierte Speicher und Finanzsysteme mit extrem geringer Latenz einsetzen. Detaillierte Implementierungsschritte finden Sie im offiziellenMCX653106A-HDAT Datenblattund die DOCA-Dokumentationsbibliothek von NVIDIA.