Na enige tijd gewerkt te hebben met een legio uiteenlopende raid controllers, harde schijven en raid configuraties kan ik echter nog steeds geen antwoord geven op de vraag, wat is het effect van cache op een hardeschijf in een raid configuratie.
De bedoeling van cache op een harde schijf is natuurlijk het snel aanleveren van bestanden / fragmenten die vaak opgevraagd worden. Bij de meeste gangbare schijven is dit 8 of 16MB.
Stel je hebt nu een grote raid array van laten we zeggen 10 schijven van 400-750GB oid / stuk. Deze schijven zet je op een raid controller die zélf ook al een flinke hoeveelheid cache heeft (meestal is dit 128 of 256MB op hardware controllers) en in een RAID 5 of 6 configuratie.
Is het nu niet zo, dat aangezien de data dusdanig verspreid is over de schijven, dat data veel minder vaak 2x wordt opgevraagd, en wanneer er uberhaupt data wordt opgevraagd, dat deze in het 'voorste' cache van de raid controller wordt gezet?
Laten we zeggen voor het gemak dat we 128MB cache op onze controller hebben, en 8 schijven met 16MB cache. Stel nu dat alle data perfect verdeeld over de schijven is, en wanneer er dan een bestand van 128MB ingeladen wordt, staat die in de cache van de schijven én van de raid controller.
Op deze manier ben ik dus van mening dat een dubbele cache (controller en schijven zelf) eigenlijk bijna nul performance winst boekt. Aangezien heel vaak dezelfde data zich zal bevinden in beide caches.
Zit ik er nu compleet naast of is dit een correcte manier om er tegenaan te kijken en zou het dus niet verstandig zijn om extra te betalen voor cache op de disk zelf? (in een configuratie van 10-16 schijven telt iedere euro die je bespaard op schijven 10-16x
)
De bedoeling van cache op een harde schijf is natuurlijk het snel aanleveren van bestanden / fragmenten die vaak opgevraagd worden. Bij de meeste gangbare schijven is dit 8 of 16MB.
Stel je hebt nu een grote raid array van laten we zeggen 10 schijven van 400-750GB oid / stuk. Deze schijven zet je op een raid controller die zélf ook al een flinke hoeveelheid cache heeft (meestal is dit 128 of 256MB op hardware controllers) en in een RAID 5 of 6 configuratie.
Is het nu niet zo, dat aangezien de data dusdanig verspreid is over de schijven, dat data veel minder vaak 2x wordt opgevraagd, en wanneer er uberhaupt data wordt opgevraagd, dat deze in het 'voorste' cache van de raid controller wordt gezet?
Laten we zeggen voor het gemak dat we 128MB cache op onze controller hebben, en 8 schijven met 16MB cache. Stel nu dat alle data perfect verdeeld over de schijven is, en wanneer er dan een bestand van 128MB ingeladen wordt, staat die in de cache van de schijven én van de raid controller.
Op deze manier ben ik dus van mening dat een dubbele cache (controller en schijven zelf) eigenlijk bijna nul performance winst boekt. Aangezien heel vaak dezelfde data zich zal bevinden in beide caches.
Zit ik er nu compleet naast of is dit een correcte manier om er tegenaan te kijken en zou het dus niet verstandig zijn om extra te betalen voor cache op de disk zelf? (in een configuratie van 10-16 schijven telt iedere euro die je bespaard op schijven 10-16x