NVIDIA Mellanox MCX653105A-HDAT Server Adapter in Aktion: RDMA/RoCE Low-Latency Transport und Server

June 15, 2026

Neueste Unternehmensnachrichten über NVIDIA Mellanox MCX653105A-HDAT Server Adapter in Aktion: RDMA/RoCE Low-Latency Transport und Server

In modernen Rechenzentren stehen verteilte Speicherung, Hochleistungsrechner (HPC) und KI-Trainingscluster vor einem gemeinsamen Engpass: dem Netzwerk.Traditionelle TCP/IP-Stacks bringen erhebliche Latenz und CPU-Overhead einDiese Fallstudie untersucht, wie ein mittelständischer Cloud-Anbieter genau diese Herausforderungen angegangen ist, indem er dieNVIDIA Mellanox MCX653105A-HDATDer Server-Adapter ermöglicht einen RDMA/RoCE-basierten Transport mit geringer Latenz und steigert den Server-Durchsatz drastisch.

Hintergrund und Herausforderungen: Wenn jede Mikrosekunde zählt

Die bestehende 25GbE-Infrastruktur des Anbieters, die Standard-TCP/IP betrieb, hatte Schwierigkeiten, ihr neues NVMe-over-Fabrics-Speicher-Backend zu unterstützen.Die CPU-Auslastung bei Speicherknoten überstieg regelmäßig 70% allein durch die Netzwerkverarbeitung, und die Verzögerung zwischen den Knoten schwebte um 50μs unakzeptabel für ihre latenzempfindlichen Datenbank-Workloads. Außerdem, als sie auf Hunderte von Knoten skalierten,Netzwerküberlastung verursachte Spikes der Latenzzeit, die sich auf die Anwendungs-SLAs auswirktenSie benötigten eine Lösung, die den Netzwerk-Overhead entlasten, eine Unter-Mikrosekunden-Latenzzeit bieten und eine gleichbleibende Leistung unter Last aufrechterhalten konnte.

Lösung und Bereitstellung: Einführung der MCX653105A-HDAT ConnectX Adapter PCIe Netzwerkkarte

Nach der Auswertung mehrerer Optionen wählte das Team dieMCX653105A-HDAT Ethernet-AdapterkarteDie Datenverarbeitung wird von den Herstellern in den USA und in Europa unterstützt, um die Datenverarbeitung zu verbessern.NVIDIA Mellanox MCX653105A-HDATwurde über 120 Speicher- und Rechenknoten mit folgender Konfiguration bereitgestellt:

  • RoCE aktiviertmit ECN (Explicit Congestion Notification) und DCQCN für die Überlastungskontrolle
  • NVMe-oF-Zielentlastungzur Hardware, wobei die Host-CPU für Speicher-E/A umgangen wird
  • Partitionierungin verlustfreie Prioritätsströme für den Speicherverkehr
  • Telemetrieüberwachungmit den eingebauten Leistungszählern des Adapters

Nach Angaben derDatenblatt MCX653105A-HDAT, unterstützt die Karte sowohl InfiniBand- als auch Ethernet-Protokolle, aber das Team wählte RoCEv2, um sich nahtlos mit ihren vorhandenen Ethernet-Switches zu integrieren.Alle wichtigen Servermodelle warenMCX653105A-HDAT kompatibelDie Implementierung erfolgte über zwei Wochenenden mit null Ausfallzeiten unter Verwendung der Live-Migration-Funktionen des Adapters.

Ergebnisse und Vorteile: Messbare Leistungssteigerungen

Die Auswirkungen waren unmittelbar und substanziell.Die folgende Tabelle fasst die wichtigsten Kennzahlen vor und nach der Einführung derMCX653105A-HDAT Ethernet-Adapterkartenlösung:

Metrische Vor (TCP/IP) Nach (RoCE + MCX653105A-HDAT) Verbesserungen
Durchschnittliche Latenzzeit (knotenübergreifend) 52 μs 10,8 μs 960,5% Ermäßigung
CPU-Nutzung (Speicherknoten, Netzwerkstapel) 72% 8% Verringerung um 89%
Effektiver Durchsatz pro Knoten (NVMe-oF) 18 Gbps 96 Gbps 5.3-fache Zunahme
Schwanzlatenz (99,9 Prozent) 380 μs 12 μs 960,8 Prozent weniger

Neben diesen Zahlen stellte das Team zusätzliche operative Vorteile fest.MCX653105A-HDAT-SpezifikationenDie Anwendungen, die in den meisten Fällen in den meisten Mitgliedstaaten verwendet werden, um die Daten zu erfassen, sind die Hardware-basierte Verbindungsverfolgung und die ASAP2-Flow-Offload, die den Ost-West-Traffic-Jitter reduziert und eine reibungslose Skalierung ermöglicht.MCX653105A-HDAT PreisDer Adapter ist mittlerweile weit verbreitet und wird in den meisten Ländern verwendet.MCX653105A-HDAT zum VerkaufDurch Standardkanäle wird diese Leistung für Organisationen aller Größenordnungen zugänglich gemacht.

Zusammenfassung und Aussichten: Eine Grundlage für die Infrastruktur der nächsten Generation

Dieser Fall zeigt, daß dieMCX653105A-HDAT ConnectX Adapter PCIe-NetzwerkkarteDas System ist nicht nur ein schnelleres NIC, es ist eine Plattform für echte datenzentrierte Rechentechnik.NVIDIA Mellanox MCX653105A-HDATTransformiert die Art und Weise, wie Server kommunizieren, beseitigt die übermäßigen Kosten für ältere Protokolle und erschließt das volle Potenzial von NVMe-Speicher und verteilten Speicherstrukturen.

In Zukunft plant der Anbieter, seine Bereitstellung auf GPUDirect RDMA für KI-Trainings-Workloads auszuweiten.sowie die Programmierbarkeitsmerkmale des Adapters für die kundenspezifische Paketverarbeitung zu erforschenFür IT-Architekten und Netzwerkingenieure, die mit ähnlichen Skalierungsproblemen konfrontiert sind, ist dieMCX653105A-HDAT Ethernet-Adapterkartebietet einen bewährten, zukunftsfähigen Weg zu niedriger Latenz und hoher Durchsatzleistung für Rechenzentrumsnetzwerke.