De laatste week begon een schijf in een server problemen te veroorzaken op een server. Het bleek zelfs al dat 'ls' niet meer mogelijk was, maar dat de server nog wel up was. Ik zag veel sector-errors op de harde schijf. Na het verwijderen van de harde schijf was de raid-array degraded, maar zou alles weer goed moeten draaien, maar ls werkte nog niet en in dmesg waren nog erg veel sector-errors. De overgebleven schijf bleek ook niet goed. De mensen in Freenode zeiden dat waarschijnlijk toch allebei de schijven tegelijk kapot waren gegaan, dus het was nodig om 2 nieuwe schijven te kopen.
Nu was ik vandaag in het datacentrum, en toen ging 'ls' ineens wel weer goed en draaide hij nog eens SUPERSNEL op de overgebleven schijf. Het zou kunnen dat dit door de herstart kwam.
Ik had namelijk besloten om beide schijven te vervangen door nieuwe 320GB SATA schijven, zodat alles weer goed draait en het gezeur met de schijven is afgelopen. Maar de 1e boot duurde langzaam bij het scannen van schijven, in de bios zag ik ook maar één schijf. Heel vaak de hot-swaps omgedraaid e.d., en herboot om te testen, soms herkende hij ze allebei, soms maar één.
Op een gegeven moment kon ik de Ubuntu-installatie starten. Het ging echter weer mis bij het bouwen van de raid-array, dit duurde enkele minuten en er kwam een foutmelding. Opnieuw proberen werkte niet en bij een reboot, herkende de server weer maar één harde schijf. Soms op poort 1, soms poort 2, en soms herkende hij geen één harde schijf. Ik heb alle combinaties van hot-swap al geprobeerd, 1 hot-swap er maar in, andere hot-swap op dezelfde locatie erin. Variatie met schijf, hotswap-bay, e.d. had weinig zin.
SuperMicro SuperServer
INTEL E6750 CPU
2x80GB Software RAID1 - Schijven redelijk nieuw
Ubuntu 9.10
Software Raid(1)
Beide 80GB harde schijven zitten er nu weer in. Ik zal nog even wat informatie posten, wellicht zijn hier mensen die wel ervaring hebben met zulke situaties. Ik begin zelf namelijk al de twijfelen of het door de hostname komt.
Nu was ik vandaag in het datacentrum, en toen ging 'ls' ineens wel weer goed en draaide hij nog eens SUPERSNEL op de overgebleven schijf. Het zou kunnen dat dit door de herstart kwam.
Ik had namelijk besloten om beide schijven te vervangen door nieuwe 320GB SATA schijven, zodat alles weer goed draait en het gezeur met de schijven is afgelopen. Maar de 1e boot duurde langzaam bij het scannen van schijven, in de bios zag ik ook maar één schijf. Heel vaak de hot-swaps omgedraaid e.d., en herboot om te testen, soms herkende hij ze allebei, soms maar één.
Op een gegeven moment kon ik de Ubuntu-installatie starten. Het ging echter weer mis bij het bouwen van de raid-array, dit duurde enkele minuten en er kwam een foutmelding. Opnieuw proberen werkte niet en bij een reboot, herkende de server weer maar één harde schijf. Soms op poort 1, soms poort 2, en soms herkende hij geen één harde schijf. Ik heb alle combinaties van hot-swap al geprobeerd, 1 hot-swap er maar in, andere hot-swap op dezelfde locatie erin. Variatie met schijf, hotswap-bay, e.d. had weinig zin.
SuperMicro SuperServer
INTEL E6750 CPU
2x80GB Software RAID1 - Schijven redelijk nieuw
Ubuntu 9.10
Software Raid(1)
Beide 80GB harde schijven zitten er nu weer in. Ik zal nog even wat informatie posten, wellicht zijn hier mensen die wel ervaring hebben met zulke situaties. Ik begin zelf namelijk al de twijfelen of het door de hostname komt.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
| root@srv13:~# hdparm -tT /dev/sda2 /dev/sda2: Timing cached reads: 8576 MB in 2.00 seconds = 4291.46 MB/sec Timing buffered disk reads: 18 MB in 3.04 seconds = 5.91 MB/sec root@srv13:~# hdparm -tT /dev/sdb2 /dev/sdb2: Timing cached reads: 9122 MB in 2.00 seconds = 4565.27 MB/sec Timing buffered disk reads: 178 MB in 3.02 seconds = 59.01 MB/sec root@srv13:~# mdadm --detail /dev/md0 /dev/md0: Version : 00.90 Creation Time : Tue Nov 24 17:15:44 2009 Raid Level : raid1 Array Size : 74236224 (70.80 GiB 76.02 GB) Used Dev Size : 74236224 (70.80 GiB 76.02 GB) Raid Devices : 2 Total Devices : 1 Preferred Minor : 0 Persistence : Superblock is persistent Update Time : Sun Feb 7 01:39:19 2010 State : clean, degraded Active Devices : 1 Working Devices : 1 Failed Devices : 0 Spare Devices : 0 Number Major Minor RaidDevice State 0 8 18 0 active sync /dev/sdb2 1 0 0 1 removed root@srv13:~# |
[ Voor 26% gewijzigd door Verwijderd op 06-02-2010 23:31 ]