Swordlord, dat de queue depth niet verder dan 3 komt is maar een beperkte conclusie van het hele verhaal.
Het betreft hier de average queue depth, vaak gemeten in de traces van Anandtech. Dat is zeer realistisch voor desktopomgevingen, maar betekent niet dat je niets aan multiqueue random I/O performance hebt.
1) desktops leunen sterk op single queue random reads, die in CrystalDiskMark en AS SSD vrijwel altijd op 20MB/s gemeten worden. Dat is de 4K random read performance van één NAND kanaal. Dit is de meest belangrijke specificatie van een SSD en neemt niet toe bij meer kanalen of SSDs in RAID0; er kan geen parallelle I/O plaatsvinden. Single channel performance dus die 100% bottlenecked is door latency.
Echter, deze single queue random reads trekken de queue depth sterk naar beneden; andere I/O kan uit 32 I/O's of 8I/O's bestaan en dan kan een SSD met 10 kanalen deze parallel verwerken hetgeen wel degelijk tot snelheidswinst leid. Dit kun je in CDM zien waarbij de QD32 random reads ongeveer 8 tot 10 keer de performance van de normale QD=1 random reads is, dit komt omdat de meeste SSDs 8 tot 10 kanalen hebben. QD32 verzadigd deze, bij QD8 of QD10 komt het nog steeds voor dat de I/O's niet evenredig over de beschikbare kanalen verdeeld kunnen worden, dus is iets langzamer dan QD32. Echter van QD1 tot QD8 zie je bijna lineaire performancestijging wat dus significante winsten boekt.
2) je hebt geen hoge queue depth nodig om meerdere kanalen bij random writes te gebruiken. Zelfs bij qd=1 haal je al veel performance die je over meerdere kanalen kunt uitsmeren. Daarom is de random write qd=1 meestal hoger dan random read qd=1. Bij laatstgenoemde kan er geen buffering plaatsvinden, bij writes wel. Bij qd=3 random write zit je meestal al aan de max; maar bij een oneindig snelle interface zou zelfs dit niet nodig zijn.
3) I/O performance zoals bij SSDs komt uiteindelijk neer op latency. Een oneindig snelle SSD zal een 0msec latency voor alle I/O hebben. Als je winst boekt met het parallal verwerken van I/O zul je dus een deel van de I/O requests versnellen, en de single queue random reads niet. Het is dus een kwestie van een deel van de I/O versnellen wat een meetbaar maar bescheiden winst geeft op het totaalresultaat.
In vrijwel alle gevallen kun je stellen dat de meest langzame (maar moderne) SSD op een SATA/150 controller al de belangrijkste voordelen biedt van Solid State memory; de lage access times en snelle random reads van rond de 20MB/s (versus ~0,2MB/s bij HDDs dus tot 100x sneller). Verder heeft sequential read nog wel een bepaalde invloed. Als je met 500MB/s kunt lezen ga je dat mogelijk nog merken t.o.v. 100MB/s maar dat effect is al veel kleiner dan het eerste. Voor de rest moet je geen hoge write latencies hebben, maar dat is het dan ook; veel merk je niet tussen een langzame SSD op SATA/150 en de snelste SSD op PCI-express 2.0 met 2GB/s reads en 100.000+ IOps. Voor desktops althans.
Maar dat betekent dus niet dat RAID0 onzin is of alleen voor servers handig is, en al helemaal niet dat het alleen sequential I/O versnelt dat laatste is helaas een ernstig misverstand.