Mooi systeempje.

Ik vraag mij nu 2 dingen af;
- Waarom zou ik met VVM partities willen maken als ik gewoon ook alles op 1 schijf kan opslaan?
Voor de veiligheid hoef ik et niet te doen imho.
Wat bedoel je met VVM, die afkorting ken ik niet namelijk. Voor je systeemdisk (waar FreeBSD op komt) heb je natuurlijk wel partities nodig (ad0s1a krijg je bijvoorbeeld). Op de schijven die je enkel en alleen voor Software RAID gaat gebruiken, kun je gewoon de hele disk pakken, dus ad4 of ad6. Zijn je disks niet allemaal even groot, dan kun je met partities de resterende ruimte toch gebruiken.
Gebruik je een Silicon Image RAID-controller of soortgelijk, die niet in IDE mode kan werken maar altijd in RAID-mode werkt? Dan heb je écht partities nodig om te voorkomen dat de laatste sector beschreven wordt, dan gaat Silicon Image trippen tijdens het booten omdat deze zijn array-configuratie opslaat in de laatste sector van elke hardeschijf. Bovendien wordt de laatste sector overschreven die in gebruik is door je filesystem - niet veilig! Voor de chipset controller is dit niet van toepassing, aangezien je die gewoon op IDE mode kunt instellen.- Ik lees dat journaling ook een stukkie performance pakt omdat je schijven moeten seeken om constant in een journal log te schrijven. Ik wil sowieso journaling, het liefst de dikste variant. Is het handig om mijn schijven zo in te delen:
Je hebt 4 schijven, geen losse Flash disk ofzo he? Je wilt op alle vier de schijven RAID5 of enkel op 3 schijven? Dat is belangrijk voor de performance, je hebt namelijk drie opties:
Optie 1:
FreeBSD op 1e disk (4GB partitie)
Disks allemaal partitioneren, één 4GB partitie de andere partitie de rest
Software RAID5 op de 2e partitie van elke disk
Je houdt dan drie partities van 4GB over, kun je gebruiken voor ports of andere dingen
Voordeel: Je verliest zo min mogelijk ruimte
Nadeel: als je echt journaling wilt, dan zal dit wel een flink lagere performance betekenen
Optie 2:
Disk 1 helemaal dedicaten als systeemdisk
Disk 2, 3 en 4 voor Software RAID5
Disk 1 bevat de journal, onafhankelijk van de RAID5 array disk members
Voordeel: hogere performance omdat de journal op een andere fysieke schijf staat dan de RAID array
Voordeel: journal van hogere kwaliteit, doordat je nog maar met één HDD write cache last hebt (write caches zijn dodelijk als er wat mis gaat met het systeem zoals stroomstoring of crash).
Nadeel: je hebt minder opslagruimte op je RAID5 array (3 disks versus 4).
Optie 3:
Een vijfde HDD gebruiken als systeemdisk en journal
De overige 4 schijven in RAID5
Voordeel: journal gescheiden van RAID5, zelfde performance als Optie 2 (mits vijfde disk even snel als de overige 4)
Ligt het aan mij of zijn er nog steeds geen performance results beschikbaar van geom_raid5?
Ik heb afgelopen jaar al aardig wat benchmarks met geom_raid5 gedraaid. Dat begon eigenlijk al toen geom_raid5 nog in vroege ontwikkeling was en ik samen met de auteur Arne Woerner op een testsysteem vele benchmarks heb gedraaid. Echter, het systeem wat we hier voor gebruiken is niet modern genoeg om geom_raid5 in volle glorie te draaien, dus zijn deze resultaten niet te gebruiken voor publicatie.
Bij de benchmarks die ik op een moderner systeem draaide met dualcore en 8 schijven, haalde ik leuke sequentiële snelheden: ~400MiB/s raw write performance. Algemene conclusie is dat geom_raid5 TNG minimaal 70% efficient is, t.o.v. het theoretische maximum. Heb je 4 disks dan vertaalt dit zich in een sequentiële read performance van ~200MiB/s en ~150MB/s write performance. Maar dit zijn schattingen.
Officiële resultaten zijn er nog niet, hopelijk wel zodra mijn artikel is gepubliceerd. Arne zal mijn artikel natuurlijk eerst proofreaden, en daarna er zijn steun aan geven. In die zin zou je de resultaten dan officiëel kunnen noemen.
Ik kwam
http://www.fluffles.net tegen, waar iemand afgelopen augustus vroeg om harde cijfers. Die beloofde jij een maandje later, maar ik kon deze niet terug vinden op je site. Ik geloof graag dat geom_raid5 superieur is maar echte grafiekjes heb ik nog nooit gezien...
Daar heb je zeker een punt. De oorzaak is misschien mijn drang naar perfectionisme. Als ik een artikel release met benchmark-resultaten over geom_raid5 wil ik ook dat die kloppen en de benchmarks goed zijn uitgevoerd. Ik heb namelijk heel andere gedachten over benchmarking dan veel anderen en als ik zelf officiele resultaten publiceer wil ik dan ook dat de tests
goed zijn uitgevoerd.
Waarom het zo lang duurt: ik heb geen testserver meer die geschikt is voor benchmarking (dualcore proc bijv.). Nu had iemand mij aangeboden een heel wreed 8-core serversysteem met 24 SAS disks een weekje te mogen gebruiken voor testdoeleinden, maar dat is op niets uitgelopen (zijn opdrachtgever wilde het systeem al in gebruik). Erg jammer.
Nu wilde ik dus hardware kopen om een waardig testsysteem te vormen, en daarvoor had ik gedachte een AMD Phenom quadcore proc. Ik kan heel simpel 2 cores uitschakelen of zelfs op 1 processor werken - zo kun je dus zien hoeveel verschil single/dualcore/quadcore nu heeft op performance. Probleem hieraan is de verkrijgbaarheid, en ik wilde het liefst een 2,6GHz. Ik kijk ook naar de mogelijkheid om hardware te lenen of een persoonlijk systeempje te gebruiken als testsysteem, maar dat is door mijn ingewikkelde setup niet makkelijk.
Conclusie: het duurt helaas langer, maar ik ben zeker van plan het artikel dit jaar te releasen. Dat is, overigens, nog heel wat anders dan een belofte.