Black Friday = Pricewatch Bekijk onze selectie van de beste Black Friday-deals en voorkom een miskoop.

Server loopt 'vast' onder load

Pagina: 1
Acties:

  • sanderbroeze
  • Registratie: Mei 2011
  • Laatst online: 19:33
Beste,

Ik heb een HP DL160 G6, met een Areca ARC-1212 Raid controller, Kingston Geheugen, 2 x Quad Core Intel Xenon en 4 x Western Digital Velociraptor WD5000HHTZ, 500GB.

Als OS draai ik ProxMox (Debian)

Nu heeft deze maanden prima gedraaid zonder problemen, maar nu sinds enkele dagen begint deze problemen te vertonen. Wanneer hij het enig sinds aan het werk moet, en dan heb ik het nog niets eens over echter hoge load, lijkt deze ergens op vast te lopen, Ik krijg de melding in Proxmox dat hij in read-only terecht is gekomen en kan er vervolgens niets meer mee.

Na een herstart werkt hij echter, voor zolang het duurt, prima tot het zelfde weer gebeurd.

Ik weet echter niet waar ik het moet zoeken, wat ik heb gedaan is Debian (ProxMox) geupdate en ook de kernel naar de nieuwste versie gebracht, tevens de Raid Controller al in een ander PCI slot gestoken maar dit hielp ook niet..

Kent iemand dit probleem, of weet iemand waar ik het überhaupt moet zoeken?

Wanneer ik inlog op de ILO van HP krijg ik wel de foutcode: Gen ID 0x21 Bus Uncorrectable Error te zien dit is echter niet iedere keer wanneer hij problemen krijgt, ik heb tevens al gezocht wat dit betekend maar kan hier eigenlijk vrijwel niets over vinden...

Wie kan mij helpen?

Alvast bedankt.

Met vriendelijke groet,

Sander

  • CasGas
  • Registratie: November 1999
  • Laatst online: 12-11 13:51

CasGas

.

En wat bedoel je precies met load?

Wat is "aan het werk" moet. Veel cpu? Veel geheugen in gebruik? Veel hdd activiteit?
Is er iets verandert waardoor die nu wel "vast loopt"? Software updates oid?

Sony A7III | Sony a6300 | Sony ZV-E1 | 12 2.0 | 21 1.4 | 24 1.4 | 35 2.8 | 50 1.4 | 135 1.8 | 16-28 2.8 | 16-70 4 | 28-75 2.8 | 70-200 2.8 II |


  • Midas.e
  • Registratie: Juni 2008
  • Laatst online: 08-11 13:27

Midas.e

Is handig met dinges

Read only filesystem? Brakke HD, ff je smart waardes hier neergooien.

Hacktheplanet / PVOutput


  • Equator
  • Registratie: April 2001
  • Laatst online: 10-11 17:48

Equator

Crew Council

#whisky #barista

Gebaseerd op de error die via iLO krijgt te zien gecombineerd met een read only FS zou ik zeggen dat er iets mis is met de controller.
Heb je nog garantie op die server?

  • sanderbroeze
  • Registratie: Mei 2011
  • Laatst online: 19:33
Met veel werk bedoel ik bijvoorbeeld bij het maken van een backup op 1 van de VM's vanuit DirectAdmin naar een externe server, zodra hij langdurig veel data moet verwerken stop deze.

Nee, er is helaas niets veranderd.. Anders wist ik het waar ik het moest zoeken


Smart Waardes ga ik zo even bekijken!


Controller is niet samen met de server besteld maar ik dacht dat ik nog garantie had op de Controller..

  • Equator
  • Registratie: April 2001
  • Laatst online: 10-11 17:48

Equator

Crew Council

#whisky #barista

Stem het e.e.a. gewoon af met HP. Zij kunnen je natuurlijk ook helpen met vaststellen waar de fout ligt.

  • Rolfie
  • Registratie: Oktober 2003
  • Laatst online: 15:13
Equator schreef op vrijdag 11 oktober 2013 @ 10:38:
Stem het e.e.a. gewoon af met HP. Zij kunnen je natuurlijk ook helpen met vaststellen waar de fout ligt.
Maar met alternatief geheugen, non HP schijven en een non HP Raid Controller gaat dit wat lastig worden.....
HP kan je nu weinig support leveren.

Eerste reactie van het issue: defecte Harddisk, raid contoller of systemboard.

[ Voor 18% gewijzigd door Rolfie op 11-10-2013 11:00 ]


  • ameesters
  • Registratie: Juni 2008
  • Laatst online: 05-01-2022
de tools die je hierbij kunnen helpen zijn `smartmontools` die je `smartctl` verschaft, teven kan er ook vendor specifieke tools nodig zijn(voor 3ware is dit `tw_cli`).

tevens kan de command `iostat` ook uitkomst bieden, vooral de kollom %iowait.

Maar dit "ruikt" idd naar een defecte hdd.

  • CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 15-11 21:29

CAPSLOCK2000

zie teletekst pagina 888

Ik kies ook voor problemen met je storage.
Heb je iets van monitoring?
Zit er een batterij op die RAID-controller? Is die nog nog goed?

This post is warranted for the full amount you paid me for it.


Verwijderd

Ik heb nog niet de smart waardes opgezocht.. Weet iemand zo 123 hoe ik die kan vinden onder Debian? Of moet dit vanuit de Raid Controller gebeuren?
ik zal anders straks even de tools proberen wat ameesters adviseert.

Ik wel monitoring maar die kijkt alleen maar of de server up en running is.. Heb ik in dit geval denk ik niet zo gek veel aan..

Nee er zit batterij op deze raid controller, ik heb wel gehoord dat dit beter is?

Verwijderd

Dit is wat ik krijg wanneer ik de smartmontool draai:


#smartctl -a /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

Device: Areca ARC-1212-VOL#000 Version: R001
Serial number: 40c4fe1244375467
Device type: disk
Transport protocol: Fibre channel (FCP-2)
Local Time is: Fri Oct 11 20:06:08 2013 CEST
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK

Current Drive Temperature: 30 C
Drive Trip Temperature: 25 C
Manufactured in week 30 of year 2002
Specified cycle count over device lifetime: 4278190080
Accumulated start-stop cycles: 256
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 0 0 0 0 0.000 0
write: 0 0 0 0 0 0.000 0

Non-medium error count: 0
Device does not support Self Test logging

  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 17:49

Koffie

Koffiebierbrouwer

Braaimeneer

Move PNS > CSL

Tijd voor een nieuwe sig..

Pagina: 1