01 März 2016

IBM FlashSystem 900 im Realtest: Latenz, IOPS und Kosten – was wirklich drinliegt

Flash ist nicht gleich Flash. In den Messungen zeigt sich: Entscheidend für spürbar schnellere Applikationen ist die Latenz – also die Servicezeit eines I/O. Die Tests belegen Latenzen um 0,2 ms (vom Server gemessen) für kleine Blöcke. Das ist rund 2× schneller als typische Tiered-Storage-Arrays mit SSD-Tier (ca. 0,4–0,5 ms) und bis zu 25× schneller als rein festplattenbasierte Systeme.

Was wurde getestet – und warum das relevant ist

Vermessen wurde das IBM FlashSystem 840 (FS840), der direkte Vorgänger des FlashSystem 900 (FS900). Das FS900 war zum Messzeitpunkt noch nicht verfügbar; die offiziellen FS900-Spezifikationen werden im Papier gegenübergestellt. Gemessen wurde mit IOgen direkt am Server – entscheidend, weil Applikationen diese Ende-zu-Ende-Zeit spüren, nicht die reine Array-Latenz.

Kurz gesagt: Latenz schlägt alles

Für kleine Blockgrössen lagen die minimalen Servicezeiten am Server bei ~200 µs (Lesen) und ~140 µs (Schreiben). Bis etwa 200’000 IOPS blieben die Antwortzeiten konstant schnell (~0,2 ms); erst nahe der Sättigung steigen sie an. Diese kurzen Zeiten sind der Grund, weshalb storagelastige Anwendungen mit All-Flash spürbar schneller reagieren.

Messergebnisse aus der Praxis

4 KB Random: Bis knapp 1’000’000 IOPS mit durchschnittlich ~0,55 ms am Server; das Array zeigte kurzzeitig sogar ~1,15 Mio. IOPS. Random-Writes lagen im Bereich ~480’000 IOPS.

256 KB Sequential: Lesedurchsatz bis ~13 GB/s, Schreibdurchsatz bis ~3,6 GB/s. Die höheren Latenzen bei grossen Blöcken sind primär Übertragungszeit (z. B. FC-Link) geschuldet.

Stabilität: Über den gesamten Test wurden ~100 Milliarden I/Os ohne Fehler gefahren. Um die höchste Last zu erzeugen, kamen Power-Server mit insgesamt 64 Cores zum Einsatz.

Was bedeutet das für Applikationen?

Sinkt die Storage-Latenz von ~5 ms (klassisches Disk-/Hybrid-Array) auf ~0,2–0,5 ms (All-Flash), verkürzt sich die Gesamtverarbeitungszeit drastisch; die CPU-Nutzlast steigt von wenigen Prozent auf deutlich höhere Werte – die Anwendung arbeitet schlicht mehr Zeit produktiv statt zu warten.

Kundenbeispiele: In einer Migration von DS8700 (Tiered) auf FS840 sanken die durchschnittlichen Servicezeiten von ~5 ms auf <0,5 ms. In einem SAP-Szenario (von DS5100 auf FS840) fielen Reads von >10 ms auf <0,5 ms; Batch-Jobs beschleunigten sich um ~50–70 % (applikatorisch Faktor ~2–4).

FS900 im Kontext: Spezifikationen und Funktionen

Das FlashSystem 900 liefert laut Spezifikation bis 1,1 Mio. IOPS (Read), ~600’000 IOPS (Write, Burst) und bis ~10 GB/s sequentielles Lesen – in 2U bei typ. ~625 W. Es ist ein auf minimalste Latenz optimiertes All-Flash-Array ohne Tiering/Thin/Dedupe im Array-Pfad. Wer erweiterte Funktionen braucht (z. B. Spiegelung, Thin, FlashCopy, Real-time Compression), setzt IBM Spectrum Virtualize (SVC) bzw. FlashSystem V9000 davor. Hinweis: Zusatzfunktionen fügen je nach Last typ. ~0,1–0,7 ms Latenz hinzu.

Wirtschaftlichkeit: Kosten pro TB und pro IOPS

2016 lag All-Flash pro TB noch über klassischem Midrange-Storage. Mit vorgeschalteter Kompression (z. B. 1:3 via SVC) näherten sich die Kosten pro TB deutlich an. Pro 1’000 IOPS ist All-Flash hingegen bereits deutlich günstiger – genau dort, wo Performance zählt.

Footprint & Energie: Mehr Leistung, weniger Platz

Platzbedarf: FS900 bringt ~57 TB usable in 2U. Ein vergleichbares Midrange-Array mit ~200 TB braucht oft ein ganzes Rack (42U). Pro 42U-Rack bedeutet das bei All-Flash bis zu ~140× mehr IOPS.

Strom: Pro 1’000 IOPS benötigt All-Flash grob ~1,3 W, Midrange Tiered ca. ~33 W. Pro TB sind die Werte vergleichbar – der Effizienzgewinn entsteht über die IOPS-Dichte.

SPC-1-Einordnung

Im SPC-1-Vergleich punktet das FS900 mit tieferen Latenzen bei praxisrelevanter Last (z. B. ~0,49 ms bei ~440’000 IOPS). Highend-Systeme mit Millionen-IOPS erreichen zwar höhere Maximalwerte, benötigen dafür aber mehr Platz und zeigen höhere Antwortzeiten. In der Realität laufen Systeme meist bei ~10–50 % der Maximallast – dort zählt jede Zehntel-Millisekunde.

Wann lohnt sich FS900 – und wann V9000?

Höchste Performance und geringste Latenz ohne Zusatzlogik: FS900 nativ. Erweiterte Funktionen (Snapshots, Spiegel, Thin, Virtualisierung, Kompression) oder Heterogenität: V9000/SVC vorschalten – dabei die zusätzliche Latenz berücksichtigen.

Fazit

Wer storagelastige Kernapplikationen betreibt, gewinnt mit All-Flash vor allem über konstant tiefe Latenzen. Die Realtests zeigen: ~0,2 ms für kleine Blöcke, ~1 Mio. IOPS im Random-Profil und zweistellige GB/s im Sequentiell-Lesen – stabil und reproduzierbar. Wirtschaftlich rechnet es sich über IOPS-Dichte, Energieeffizienz und (mit Kompression) sinkende TB-Kosten. Benötigte Zusatzfeatures lassen sich via SVC ergänzen – mit bewusstem Blick auf die Latenz.