Neuigkeiten – Leistung von Disk-Array-Speichersystemen in Einzel-Host-Verbindung

Im Allgemeinen weisen Festplatten oder Festplatten-Arrays die beste Leistung in einem Einzelhost-Verbindungsszenario auf. Die meisten Betriebssysteme basieren auf exklusiven Dateisystemen, was bedeutet, dass ein Dateisystem nur einem einzigen Betriebssystem gehören kann. Dadurch optimieren sowohl das Betriebssystem als auch die Anwendungssoftware das Lesen und Schreiben von Daten für das Plattenspeichersystem basierend auf dessen Eigenschaften. Diese Optimierung zielt darauf ab, die physischen Suchzeiten zu verkürzen und die mechanischen Reaktionszeiten der Festplatte zu verkürzen. Die Datenanforderungen jedes Programmprozesses werden vom Betriebssystem verarbeitet, was zu optimierten und geordneten Datenlese- und -schreibanforderungen für die Festplatte oder das Festplatten-Array führt. Dies führt zur besten Leistung des Speichersystems in diesem Setup.

Bei Festplatten-Arrays wird zwar ein zusätzlicher RAID-Controller zwischen dem Betriebssystem und den einzelnen Festplattenlaufwerken hinzugefügt, aktuelle RAID-Controller verwalten und überprüfen jedoch hauptsächlich Festplattenfehlertoleranzvorgänge. Sie führen keine Zusammenführung, Neuordnung oder Optimierung von Datenanfragen durch. RAID-Controller basieren auf der Annahme, dass Datenanforderungen von einem einzelnen Host kommen, der bereits vom Betriebssystem optimiert und sortiert ist. Der Cache des Controllers bietet nur direkte und rechnerische Pufferfunktionen, ohne Daten zur Optimierung in die Warteschlange zu stellen. Wenn der Cache schnell gefüllt ist, sinkt die Geschwindigkeit sofort auf die tatsächliche Geschwindigkeit der Festplattenvorgänge.

Die Hauptfunktion des RAID-Controllers besteht darin, aus mehreren Festplatten eine oder mehrere große fehlertolerante Festplatten zu erstellen und die Gesamtlese- und Schreibgeschwindigkeit von Daten mithilfe der Caching-Funktion auf jeder Festplatte zu verbessern. Der Lese-Cache von RAID-Controllern steigert die Leseleistung des Disk-Arrays erheblich, wenn die gleichen Daten innerhalb kurzer Zeit gelesen werden. Die tatsächliche maximale Lese- und Schreibgeschwindigkeit des gesamten Festplatten-Arrays wird durch den niedrigsten Wert aus Host-Kanalbandbreite, Überprüfungsberechnung und Systemsteuerungsfunktionen der Controller-CPU (RAID-Engine), Festplattenkanalbandbreite und Festplattenleistung (die kombinierte tatsächliche Leistung von) begrenzt alle Festplatten). Darüber hinaus kann eine Nichtübereinstimmung zwischen der Optimierungsbasis der Datenanforderungen des Betriebssystems und dem RAID-Format, z. B. wenn die Blockgröße von E/A-Anforderungen nicht mit der RAID-Segmentgröße übereinstimmt, die Leistung des Festplatten-Arrays erheblich beeinträchtigen.

Leistungsschwankungen herkömmlicher Disk-Array-Speichersysteme beim Zugriff auf mehrere Hosts

In Szenarien mit mehreren Hostzugriffen nimmt die Leistung von Festplattenarrays im Vergleich zu Einzelhostverbindungen ab. In kleinen Disk-Array-Speichersystemen, die typischerweise über ein einzelnes oder redundantes Paar Disk-Array-Controller und eine begrenzte Anzahl angeschlossener Festplatten verfügen, wird die Leistung durch die ungeordneten Datenflüsse von verschiedenen Hosts beeinträchtigt. Dies führt zu längeren Suchzeiten auf der Festplatte, zu längeren Datensegment-Header- und -Tail-Informationen sowie zu einer Datenfragmentierung bei Lese-, Zusammenführungs-, Verifizierungsberechnungen und Neuschreibprozessen. Folglich nimmt die Speicherleistung ab, je mehr Hosts angeschlossen sind.

Bei großen Disk-Array-Speichersystemen ist der Leistungsabfall anders als bei kleinen Disk-Arrays. Diese Großsysteme verwenden eine Busstruktur oder Cross-Point-Switching-Struktur, um mehrere Speichersubsysteme (Disk-Arrays) zu verbinden, und umfassen Caches mit großer Kapazität und Host-Verbindungsmodule (ähnlich Kanal-Hubs oder Switches) für mehr Hosts innerhalb des Busses oder Switches Struktur. Die Leistung hängt in Transaktionsverarbeitungsanwendungen weitgehend vom Cache ab, ist jedoch in Multimediadatenszenarien nur begrenzt wirksam. Während die internen Disk-Array-Subsysteme in diesen Großsystemen relativ unabhängig arbeiten, wird eine einzelne logische Einheit nur innerhalb eines einzelnen Disk-Subsystems aufgebaut. Somit bleibt die Leistung einer einzelnen logischen Einheit gering.

Zusammenfassend lässt sich sagen, dass bei kleinen Festplatten-Arrays aufgrund ungeordneter Datenströme ein Leistungsabfall auftritt, während bei großen Festplatten-Arrays mit mehreren unabhängigen Festplatten-Array-Subsystemen mehr Hosts unterstützt werden können, bei Multimedia-Datenanwendungen jedoch immer noch Einschränkungen bestehen. Andererseits kommt es bei NAS-Speichersystemen, die auf herkömmlicher RAID-Technologie basieren und NFS- und CIFS-Protokolle verwenden, um Speicher über Ethernet-Verbindungen mit externen Benutzern zu teilen, in Umgebungen mit mehreren Hostzugriffen zu weniger Leistungseinbußen. NAS-Speichersysteme optimieren die Datenübertragung durch mehrere parallele TCP/IP-Übertragungen und ermöglichen eine maximale gemeinsame Geschwindigkeit von etwa 60 MB/s in einem einzigen NAS-Speichersystem. Durch den Einsatz von Ethernet-Verbindungen können die Daten nach der Verwaltung und Neuordnung durch das Betriebssystem oder die Datenverwaltungssoftware im Thin Server optimal auf das Plattensystem geschrieben werden. Daher erfährt das Festplattensystem selbst keine nennenswerten Leistungseinbußen, sodass NAS-Speicher für Anwendungen geeignet sind, die eine gemeinsame Nutzung von Daten erfordern.

Zeitpunkt der Veröffentlichung: 17. Juli 2023