Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
De laatste week begon een schijf in een server problemen te veroorzaken op een server. Het bleek zelfs al dat 'ls' niet meer mogelijk was, maar dat de server nog wel up was. Ik zag veel sector-errors op de harde schijf. Na het verwijderen van de harde schijf was de raid-array degraded, maar zou alles weer goed moeten draaien, maar ls werkte nog niet en in dmesg waren nog erg veel sector-errors. De overgebleven schijf bleek ook niet goed. De mensen in Freenode zeiden dat waarschijnlijk toch allebei de schijven tegelijk kapot waren gegaan, dus het was nodig om 2 nieuwe schijven te kopen.

Nu was ik vandaag in het datacentrum, en toen ging 'ls' ineens wel weer goed en draaide hij nog eens SUPERSNEL op de overgebleven schijf. Het zou kunnen dat dit door de herstart kwam.

Ik had namelijk besloten om beide schijven te vervangen door nieuwe 320GB SATA schijven, zodat alles weer goed draait en het gezeur met de schijven is afgelopen. Maar de 1e boot duurde langzaam bij het scannen van schijven, in de bios zag ik ook maar één schijf. Heel vaak de hot-swaps omgedraaid e.d., en herboot om te testen, soms herkende hij ze allebei, soms maar één.

Op een gegeven moment kon ik de Ubuntu-installatie starten. Het ging echter weer mis bij het bouwen van de raid-array, dit duurde enkele minuten en er kwam een foutmelding. Opnieuw proberen werkte niet en bij een reboot, herkende de server weer maar één harde schijf. Soms op poort 1, soms poort 2, en soms herkende hij geen één harde schijf. Ik heb alle combinaties van hot-swap al geprobeerd, 1 hot-swap er maar in, andere hot-swap op dezelfde locatie erin. Variatie met schijf, hotswap-bay, e.d. had weinig zin.

SuperMicro SuperServer
INTEL E6750 CPU
2x80GB Software RAID1 - Schijven redelijk nieuw
Ubuntu 9.10
Software Raid(1)

Beide 80GB harde schijven zitten er nu weer in. Ik zal nog even wat informatie posten, wellicht zijn hier mensen die wel ervaring hebben met zulke situaties. Ik begin zelf namelijk al de twijfelen of het door de hostname komt.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
root@srv13:~# hdparm -tT /dev/sda2

/dev/sda2:
 Timing cached reads:   8576 MB in  2.00 seconds = 4291.46 MB/sec
 Timing buffered disk reads:   18 MB in  3.04 seconds =   5.91 MB/sec
root@srv13:~# hdparm -tT /dev/sdb2

/dev/sdb2:
 Timing cached reads:   9122 MB in  2.00 seconds = 4565.27 MB/sec
 Timing buffered disk reads:  178 MB in  3.02 seconds =  59.01 MB/sec
root@srv13:~#  mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90
  Creation Time : Tue Nov 24 17:15:44 2009
     Raid Level : raid1
     Array Size : 74236224 (70.80 GiB 76.02 GB)
  Used Dev Size : 74236224 (70.80 GiB 76.02 GB)
   Raid Devices : 2
  Total Devices : 1
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Sun Feb  7 01:39:19 2010
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

    Number   Major   Minor   RaidDevice State
       0       8       18        0      active sync   /dev/sdb2
       1       0        0        1      removed
root@srv13:~#

[ Voor 26% gewijzigd door Verwijderd op 06-02-2010 23:31 ]


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Ik hoop echt op jullie invoer. Ik wil de server namelijk in de loop van volgende week gewoon weer keurig draaiende hebben.

Acties:
  • 0 Henk 'm!

  • Q
  • Registratie: November 1999
  • Laatst online: 11:14

Q

Au Contraire Mon Capitan!

Mogelijke oorzaken los van defecte schijven:

1. Defecte voeding die brakke spanning levert
2. Rotte sata kabels

Lastig om te vinden, maar ook het mobo kan helaas stuk zijn, maar die kans is klein.

1. Test de schijven in een andere computer
2. Test met andere sata kabels
3. test met andere voeding.

Anders?

Post eens de ubuntu errors over de disks?

[ Voor 6% gewijzigd door Q op 07-02-2010 15:59 ]


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Hoe kom ik erachter of het aan de voeding ligt en/of aan de sata kabels? De sata kabels kan ik nog wel vervangen, maar het betreft hier een webserver en ik moet 90 minuten reizen, voordat ik eindelijk bij de server sta. Tevens is het niet gewenst om overdag werkzaamheden aan de server uit te voeren.

Ik ben momenteel helaas niet in staat om de errors de posten, aangezien de betreffende harde schijf ook niet meer aangekoppeld is, ik meende me te herinneren dat ik deze al in een link had gepost hier namelijk.

Acties:
  • 0 Henk 'm!

  • _Dune_
  • Registratie: September 2003
  • Nu online

_Dune_

Moderator Harde Waren

RAID is geen BACKUP

Op verzoek alsnog een verhuizing naar PNS.

Sinds 1999@Tweakers | Bij IT-ers gaat alles automatisch, maar niets vanzelf. | https://www.go-euc.com/


Acties:
  • 0 Henk 'm!

  • Renkie
  • Registratie: Januari 2000
  • Laatst online: 15:44
Verwijderd schreef op woensdag 24 februari 2010 @ 01:43:
Hoe kom ik erachter of het aan de voeding ligt en/of aan de sata kabels?
Simpel : Vervangen en kijken hoe het gaat.

Aangezien je met uptime en reistijd zit zou ik gewoon in 1x de SATA kabels en de voeding midden in de nacht vervangen.
Eventueel kun je er ook voor kiezen om een de complete server om te ruilen voor een identiek chassis en de schijven daar in aan te sluiten.

Kwestie van de juiste spareparts hebben liggen.
Pagina: 1