NVIDIA Mellanox MCX653105A-HDAT Server Adapter in Aktion: RDMA/RoCE Low-Latency Transport und Server
June 15, 2026
In modernen Rechenzentren stehen verteilte Speicherung, Hochleistungsrechner (HPC) und KI-Trainingscluster vor einem gemeinsamen Engpass: dem Netzwerk.Traditionelle TCP/IP-Stacks bringen erhebliche Latenz und CPU-Overhead einDiese Fallstudie untersucht, wie ein mittelständischer Cloud-Anbieter genau diese Herausforderungen angegangen ist, indem er dieNVIDIA Mellanox MCX653105A-HDATDer Server-Adapter ermöglicht einen RDMA/RoCE-basierten Transport mit geringer Latenz und steigert den Server-Durchsatz drastisch.
Hintergrund und Herausforderungen: Wenn jede Mikrosekunde zählt
Die bestehende 25GbE-Infrastruktur des Anbieters, die Standard-TCP/IP betrieb, hatte Schwierigkeiten, ihr neues NVMe-over-Fabrics-Speicher-Backend zu unterstützen.Die CPU-Auslastung bei Speicherknoten überstieg regelmäßig 70% allein durch die Netzwerkverarbeitung, und die Verzögerung zwischen den Knoten schwebte um 50μs unakzeptabel für ihre latenzempfindlichen Datenbank-Workloads. Außerdem, als sie auf Hunderte von Knoten skalierten,Netzwerküberlastung verursachte Spikes der Latenzzeit, die sich auf die Anwendungs-SLAs auswirktenSie benötigten eine Lösung, die den Netzwerk-Overhead entlasten, eine Unter-Mikrosekunden-Latenzzeit bieten und eine gleichbleibende Leistung unter Last aufrechterhalten konnte.
Lösung und Bereitstellung: Einführung der MCX653105A-HDAT ConnectX Adapter PCIe Netzwerkkarte
Nach der Auswertung mehrerer Optionen wählte das Team dieMCX653105A-HDAT Ethernet-AdapterkarteDie Datenverarbeitung wird von den Herstellern in den USA und in Europa unterstützt, um die Datenverarbeitung zu verbessern.NVIDIA Mellanox MCX653105A-HDATwurde über 120 Speicher- und Rechenknoten mit folgender Konfiguration bereitgestellt:
- RoCE aktiviertmit ECN (Explicit Congestion Notification) und DCQCN für die Überlastungskontrolle
- NVMe-oF-Zielentlastungzur Hardware, wobei die Host-CPU für Speicher-E/A umgangen wird
- Partitionierungin verlustfreie Prioritätsströme für den Speicherverkehr
- Telemetrieüberwachungmit den eingebauten Leistungszählern des Adapters
Nach Angaben derDatenblatt MCX653105A-HDAT, unterstützt die Karte sowohl InfiniBand- als auch Ethernet-Protokolle, aber das Team wählte RoCEv2, um sich nahtlos mit ihren vorhandenen Ethernet-Switches zu integrieren.Alle wichtigen Servermodelle warenMCX653105A-HDAT kompatibelDie Implementierung erfolgte über zwei Wochenenden mit null Ausfallzeiten unter Verwendung der Live-Migration-Funktionen des Adapters.
Ergebnisse und Vorteile: Messbare Leistungssteigerungen
Die Auswirkungen waren unmittelbar und substanziell.Die folgende Tabelle fasst die wichtigsten Kennzahlen vor und nach der Einführung derMCX653105A-HDAT Ethernet-Adapterkartenlösung:
| Metrische | Vor (TCP/IP) | Nach (RoCE + MCX653105A-HDAT) | Verbesserungen |
|---|---|---|---|
| Durchschnittliche Latenzzeit (knotenübergreifend) | 52 μs | 10,8 μs | 960,5% Ermäßigung |
| CPU-Nutzung (Speicherknoten, Netzwerkstapel) | 72% | 8% | Verringerung um 89% |
| Effektiver Durchsatz pro Knoten (NVMe-oF) | 18 Gbps | 96 Gbps | 5.3-fache Zunahme |
| Schwanzlatenz (99,9 Prozent) | 380 μs | 12 μs | 960,8 Prozent weniger |
Neben diesen Zahlen stellte das Team zusätzliche operative Vorteile fest.MCX653105A-HDAT-SpezifikationenDie Anwendungen, die in den meisten Fällen in den meisten Mitgliedstaaten verwendet werden, um die Daten zu erfassen, sind die Hardware-basierte Verbindungsverfolgung und die ASAP2-Flow-Offload, die den Ost-West-Traffic-Jitter reduziert und eine reibungslose Skalierung ermöglicht.MCX653105A-HDAT PreisDer Adapter ist mittlerweile weit verbreitet und wird in den meisten Ländern verwendet.MCX653105A-HDAT zum VerkaufDurch Standardkanäle wird diese Leistung für Organisationen aller Größenordnungen zugänglich gemacht.
Zusammenfassung und Aussichten: Eine Grundlage für die Infrastruktur der nächsten Generation
Dieser Fall zeigt, daß dieMCX653105A-HDAT ConnectX Adapter PCIe-NetzwerkkarteDas System ist nicht nur ein schnelleres NIC, es ist eine Plattform für echte datenzentrierte Rechentechnik.NVIDIA Mellanox MCX653105A-HDATTransformiert die Art und Weise, wie Server kommunizieren, beseitigt die übermäßigen Kosten für ältere Protokolle und erschließt das volle Potenzial von NVMe-Speicher und verteilten Speicherstrukturen.
In Zukunft plant der Anbieter, seine Bereitstellung auf GPUDirect RDMA für KI-Trainings-Workloads auszuweiten.sowie die Programmierbarkeitsmerkmale des Adapters für die kundenspezifische Paketverarbeitung zu erforschenFür IT-Architekten und Netzwerkingenieure, die mit ähnlichen Skalierungsproblemen konfrontiert sind, ist dieMCX653105A-HDAT Ethernet-Adapterkartebietet einen bewährten, zukunftsfähigen Weg zu niedriger Latenz und hoher Durchsatzleistung für Rechenzentrumsnetzwerke.

