Heb een ram-disk aangemaakt met
http://www.cenatek.com/products.php
Hierbij de resultaten van tests zonder harde schijf (met RAM-disk) en met harde schijf:
________________________________Hard disk____Ram disk
test1: OCR-en met tesseract1_______1:59________1:59 (=1 minuten: 59 seconden)
test1: OCR-en met tesseract2_______2:56________2:53
test2: OCR-en met Adobe___________5:56________5:56
test3: Word converteren naar PDF, plaatjes (bmp's) converteren naar PDF, PDF-bestanden samenvoegen:
test3.1:_________________________6:28________6:20
test3.2:_________________________7:29________7:05
test3.3:_________________________0:55________1:17
test3.4:_________________________7:49________8:05
test3.5:_________________________6:54________7:59
Geheugen
De resultaten zijn opvallend: OCR-en met of zonder hard disk maakt bijna geen verschil. Het converteren van Office-documenten naar pdf & het converteren van images naar pdf & het samenvoegen van pdf-bestanden ging in de eerste tests sneller op een RAM-schijf dan op een harde schijf (in eerste 2 tests ongeveer 20 seconden sneller op de 6a7 minuten). De zelfde(!) tests daarna gingen de tests op de Hard-disk sneller dan de tests op de RAM-schijf. Geen flauw idee hoe het kan, maar het lijkt me in ieder geval duidelijk dat met een ram-schijf niet heel veel tijdwinst is te behalen (wel vet om een keer te hebben uitgeprobeerd, thanks remco_delft).
Bovendien weten we nu dat een snellere harde schijf niet veel zo uit maken voor de tijdswinst. Buggienuk, ik heb met een oor nog eens goed te luisteren gelegd bij m'n computer: ik hoor zoeven en geen ratelen. De schijf staat dus uit z'n neus te eten, dus een normale desktopschijf voldoet: WD 500GB, Cavair SE16 SATAII, 7200 rpm, 16 MB.
Processor
De opties: de Intel Core 2 Duo E8500 3,16GHz/1333/6M of de Intel Quad Core Q9300 2.5GHz/1333/6MB
Aangezien 2 cores aan het niksen zijn bij het OCR-en (Adobe & tesseract is niet multi-threated), is de Intel Core 2 Duo E8500 3,16GHz/1333/6M sneller. Deze denkt 3,16GHz (=3,16 miljard keer per seconde) na. De Quad Core denkt 2.5GHz (=2.5 miljoen keer per seconde) na. De Intel Core 2 Duo E8500 3,16GHz/1333/6M is voor de digitaliserings-software dus sneller.
Geheugen
De processor - de Intel Core 2 Duo E8500 3,16GHz/1333/6M - heeft 4 bussen van 333MHz (4x333MHz=1333 MHz).
Een computersysteem met 2 x 2GB met 1333MHz kan goed samenwerken met bovenstaande processor. De processor heeft 4 FSB's, dus kan over 4 bussen met 1333MHz met het geheugen praten. Het goed snel geheugen moet dus ook met 1333MHz praten. Mij lijkt 2x 2GB 1333MHz - geheugen van een goed merk wel wat, bijvoorbeeld de Corsair 2GB XMS3-1333, DDR3 1333 MHz, Lat 9-9-9-24, DHX, Twinx (prijs 100 EUR per stuk).
Voorlopige Configuratie nieuwe PC:
- Processor: Intel Core 2 Duo E8500 3,16GHz/1333/6M____________________________( 250 EUR )
- Geheugen: 2x Corsair 2GB XMS3-1333, DDR3 1333 MHz, Lat 9-9-9-24, DHX, Twinx___( 200 EUR )
- Harde schijf: 2x WD 500GB, Cavair SE16 SATAII, 7200 rpm, 16 MB (RAID 1 mirror)___( 140 EUR )
- Operating system: Windows XP Prof Edition____________________________________( 150 EUR )
- DVD-brander: LG DVR 20x DL SATA__________________________________________( 30 EUR )
- Moederboord: ASUS P5E3.s775 ATX, X38,DDR3,2xPCIe,1394_____________________( 160 EUR )
- Videokaart: ASUS EN8500GT Silent__________________________________________( 65 EUR )
- Voeding: Corsair ATX, 520W________________________________________________( 80 EUR )
- Cooler: Cooler Master 690 Tower Case________________________________________( 70 EUR )
- Virusscanner uitzetten & geen internetverbinding (goeie tip!)
- Later: parallel programmeren (goeie tip!)
______________________________________________________________Subtotaal: ( 1145 EUR )
__________________________________________________________________BTW: ( 218 EUR )
_________________________________________________________________Totaal: ( 1363 EUR )
Openstaande punten:
Geheugen: - 2x 2GB 1333MHz van een goed merk. Maar: Wat is het verschil tussen DDR2 of DDR3? DDR bleef bv op 400MHz steken, met DDR2 en DDR3 worden hogere snelheden gemaakt. Hoeveel sneller wordt de digitaliseringssoftware hiervan?
Harde schijf: dubbele harde schijf lijkt me handig, zodat automatisch een backup wordt gemaakt: gegevens mogen niet verloren gaan. RAID 1 mirror lijkt een goede oplossing. Hoe kan je harde schijf in een RAID 1 mirror opstelling instellen? Is hier software voor.
Dank weer voor alle adviezen. Sorry dat ik niet alle adviezen overneem. Aangezien ik niks begreep van hardware, probeer ik zo goed mogelijk te luisteren, maar er wel een soort van logica op los te laten. Wellicht klopt-ie niet en dan hoor ik het graag: Bij het OCR-en worden een bestand van de harde schijf gehaald, en de processor gaat met het bestand aan de slag. De testen met en zonder harde schijf (ram-disk) wijzen uit dat harde schijf I/O niet veel uit maakt. Het punt waar snelheidswinst valt te behalen is dus de processor. De OCR-software is echter niet multithreated, Quad Core heeft dus geen zin. Het aantal keer dat de processor nadenkt per seconden (het aantal GHz) is wel belangrijk. Verder moet het geheugen goed aansluiten op de processor: de processor praat met 4 bussen op een snelheid van 333MHz, het geheugen moet dit zo goed mogelijk (=geheugen van een goed merk) en zo snel mogelijk (=nadenken op zelfde frequentie: 4 GB van ook 333 MHZ) kunnen begrijpen.