Toon posts:

[linux] Constante Vastlopers

Pagina: 1
Acties:

Verwijderd

Topicstarter
Jongens ik heb een probleem met me fileserver in the USA waar ik maar niet uitkom. Hij staat gehost bij fdcserver, en die geven 0,0 support, dus daar krijg ik ook niet veel uit, gelukkig rebooten ze wel snel.

Het probleem, minimaal 1x per dag loopt me server helemaal vast dat hij totaal niet toegankelijk meer is, ook niet via shell access. De server wordt alleen gebruikt als fileserver, voornamelijk media files zoals .wvm, .avi, .swf.

De serverload is normaal altijd rond de 0.6 en soms max rond de 1.1, niets geks. Verder draaien er totaal geen PHP scripten of iets, al is PHP wel geïnstalleerd. Minimaal 1x per dag gaat hij dus plat, en ik zou bij god niet weten waarom. Zouden jullie mij wat tips kunnen geven waar ik naar zou kunnen kijken, dingen die misschien de oorzaak van dit probleem kunnen zijn? Waar kan ik het beste zoeken?

Hieronder wat server specs:
- AMD 2600
- 512 Ram
- 80GB IDE drive
- OS: Linux Redhat 9

Na de dagelijkse reboot die mijn hoster uitvoert gaat de server weer fijn een uur of 20 door, tot het weer raak is… Om gek van te worden dus.

  • consolefreak
  • Registratie: November 2002
  • Laatst online: 20:49
kan het niet de temps zijn? :X kan iets hardware matigs zijn eh..

  • TrailBlazer
  • Registratie: Oktober 2000
  • Laatst online: 07-02 09:48

TrailBlazer

Karnemelk FTW

(jarig!)
wat zeggen je logs. Hoe laat is het dan. Zet je cron eens uit

  • dawuss
  • Registratie: Maart 2001
  • Laatst online: 01-02 20:46

dawuss

gadgeteer

Ik ben bang dat het een hardwareprobleem is, dus daar ben je mooi klaar mee als hij in de VS staat :o

Kun je eens wat relevante stukken uit logs posten van rond de tijd dat hij down gaat? /var/log/syslog en /var/log/messages zijn goede plaatsen om te beginnen :)

micheljansen.org
Fulltime Verslaafde Commandline Fetisjist ©


Verwijderd

Topicstarter
dawuss schreef op zaterdag 26 maart 2005 @ 19:32:
Ik ben bang dat het een hardwareprobleem is, dus daar ben je mooi klaar mee als hij in de VS staat :o

Kun je eens wat relevante stukken uit logs posten van rond de tijd dat hij down gaat? /var/log/syslog en /var/log/messages zijn goede plaatsen om te beginnen :)
Thanks, ik ga daar even naar kijken.

Verwijderd

Topicstarter
In messages staats niets verkeerd, laatste log daarin was op de 20ste. Laatste keer dat me server down ging was 15 min geleden.

Deze logs zijn er aanwezig, welke kan ik het beste in kijken?

boot.log dmesg ksyms.4 maillog.2 mysqld.log.1 samba spooler.2
boot.log.1 httpd ksyms.5 mailman mysqld.log.2 secure squid
boot.log.2 ksyms.0 ksyms.6 messages pgsql secure.1 tomcat4
cron ksyms.1 lastlog messages.1 rpmpkgs secure.2 vbox
cron.1 ksyms.2 maillog messages.2 rpmpkgs.1 spooler wtmp
cron.2 ksyms.3 maillog.1 mysqld.log rpmpkgs.2 spooler.1

Wat me wel op viel in PLESK was dat me SWAPFILE maar voor 1% in gebruik was. 1.4 MB van de 999MB. Memory usage was 96% maar dat is geloof ik normaal in Linux.

[ Voor 12% gewijzigd door Verwijderd op 26-03-2005 19:46 ]


  • BoAC
  • Registratie: Februari 2003
  • Laatst online: 20:41

BoAC

Memento mori

'messages' en dan het stuk vanaf +/-20 regels boven de eerste regel van een nieuwe start :)

* BoAC heeft ook een keer dergelijke problemen gezien met hardware die te heet werd.
Het probleem is dan dat er niets te zien is in de log omdat deze gewoon afbreekt.
Je kan meestal wel bij de smart-values van je HDD zien dat die te heet wordt. Dit onderdeel in je server zal bij hoge temps wel eens het eerste problemen kunnen geven.

[ Voor 67% gewijzigd door BoAC op 26-03-2005 19:48 ]


Verwijderd

Topicstarter
BoAC schreef op zaterdag 26 maart 2005 @ 19:46:
'messages' en dan het stuk vanaf +/-20 regels boven de eerste regel van een nieuwe start :)
Daar staat niets van het probleem is, laatste log daarin was 6 dagen geleden. Laatste reboot was 15min geleden. Zie post hierboven.

Hier nog wat specs van linux:

Version psa v7.5.2_build75050204.16 os_RedHat 9
OS Linux 2.4.20-8

  • dawuss
  • Registratie: Maart 2001
  • Laatst online: 01-02 20:46

dawuss

gadgeteer

Een server die 6 dagen lang geen kernel messages logt is in ieder geval sowieso niet gezond. Staat er in dmesg nog iets raars tijdens de hardware detectie?

Als je server een hele dag gewoon up kan blijven neem ik aan dat de harddisk wel gewoon gemount wordt, en er dus ook gelogd kan worden, dus daar zou ik als eerste achteraan gaan.

micheljansen.org
Fulltime Verslaafde Commandline Fetisjist ©


  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

Verwijderd schreef op zaterdag 26 maart 2005 @ 19:43:
[...] Wat me wel op viel in PLESK was dat me SWAPFILE maar voor 1% in gebruik was. 1.4 MB van de 999MB. Memory usage was 96% maar dat is geloof ik normaal in Linux.
Dat is normaal, Linux zal alleen je swap gebruiken als het echt nodig is (en dan is het dus eigenlijk tijd voor meer geheugen ;))

Zou je misschien de output van dmesg online kunnen zetten? (hier op het forum neemt wat veel ruimte in)

Blog [Stackoverflow] [LinkedIn]


Verwijderd

Topicstarter
dawuss schreef op zaterdag 26 maart 2005 @ 19:51:
Een server die 6 dagen lang geen kernel messages logt is in ieder geval sowieso niet gezond. Staat er in dmesg nog iets raars tijdens de hardware detectie?
Dat van die temperatuur van de HD zou opzich best kunnen, het is een erg drukke server (wordt gebruik als fileserver van dumpalink.com, die site trekt meer traffic dan heel tweakers.net).

Ik zie niets verdachts in dmesg, misschien dat jullie iets opvalt?
[root@localhost log]# vi dmesg
Linux version 2.4.20-8 (bhcompile@stripples.devel.redhat.com) (gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)) #1 Thu Mar 13 17:18:24 EST 2003
BIOS-provided physical RAM map:
BIOS-e820: 0000000000000000 - 000000000009fc00 (usable)
BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
BIOS-e820: 00000000000e8000 - 0000000000100000 (reserved)
BIOS-e820: 0000000000100000 - 000000001dff0000 (usable)
BIOS-e820: 000000001dff0000 - 000000001dff8000 (ACPI data)
BIOS-e820: 000000001dff8000 - 000000001e000000 (ACPI NVS)
BIOS-e820: 00000000fec00000 - 00000000fec01000 (reserved)
BIOS-e820: 00000000fee00000 - 00000000fee01000 (reserved)
BIOS-e820: 00000000ffee0000 - 00000000fff00000 (reserved)
BIOS-e820: 00000000fffc0000 - 0000000100000000 (reserved)
0MB HIGHMEM available.
479MB LOWMEM available.
On node 0 totalpages: 122864
zone(0): 4096 pages.
zone(1): 118768 pages.
zone(2): 0 pages.
Kernel command line: ro root=LABEL=/
Initializing CPU#0
Detected 2019.957 MHz processor.
Console: colour VGA+ 80x25
Calibrating delay loop... 4023.91 BogoMIPS
Memory: 479080k/491456k available (1312k kernel code, 9812k reserved, 996k data, 128k init, 0k highmem)
Dentry cache hash table entries: 65536 (order: 7, 524288 bytes)
Inode cache hash table entries: 32768 (order: 6, 262144 bytes)
Mount cache hash table entries: 512 (order: 0, 4096 bytes)
Buffer-cache hash table entries: 32768 (order: 5, 131072 bytes)
Page-cache hash table entries: 131072 (order: 7, 524288 bytes)
CPU: L1 I Cache: 64K (64 bytes/line), D cache 64K (64 bytes/line)
CPU: L2 Cache: 256K (64 bytes/line)
Intel machine check architecture supported.
Intel machine check reporting enabled on CPU#0.
CPU: After generic, caps: 0383fbff c1c3fbff 00000000 00000000
CPU: Common caps: 0383fbff c1c3fbff 00000000 00000000
CPU: AMD Athlon(tm) XP 2400+ stepping 01
Enabling fast FPU save and restore... done.
Enabling unmasked SIMD FPU exception support... done.
Checking 'hlt' instruction... OK.
POSIX conformance testing by UNIFIX
mtrr: v1.40 (20010327) Richard Gooch (rgooch@atnf.csiro.au)
mtrr: detected mtrr type: Intel
PCI: PCI BIOS revision 2.10 entry at 0xfdb31, last bus=2
PCI: Using configuration type 1
PCI: Probing PCI hardware
PCI: Using IRQ router SIS [1039/0008] at 00:02.0
isapnp: Scanning for PnP cards...
isapnp: No Plug & Play device found
Linux NET4.0 for Linux 2.4
"dmesg" 137L, 6093C

  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

Dat ziet er allemaal nog goed uit, ik zie iig geen fouten/warnings langskomen.

Maar hoe zit het eigenlijk met je logs?
Draait je syslog daemon wel?
Het is namelijk absoluut _niet_ normaal dat er al dagen geens logs meer geweest zijn, zeker na het booten zit er altijd wel wat in je /var/log/messages

Blog [Stackoverflow] [LinkedIn]


  • BoAC
  • Registratie: Februari 2003
  • Laatst online: 20:41

BoAC

Memento mori

Verwijderd schreef op zaterdag 26 maart 2005 @ 19:56:
[...]
Dat van die temperatuur van de HD zou opzich best kunnen, het is een erg drukke server (wordt gebruik als fileserver van dumpalink.com, die site trekt meer traffic dan heel tweakers.net).
smartctl
Ik zie niets verdachts in dmesg, misschien dat jullie iets opvalt?
[...]
Wat voor een disks zitten erin?
Ik zie nl geen ide of scsi support..

Verwijderd

Topicstarter
Wolfboy schreef op zaterdag 26 maart 2005 @ 20:08:
Dat ziet er allemaal nog goed uit, ik zie iig geen fouten/warnings langskomen.

Maar hoe zit het eigenlijk met je logs?
Draait je syslog daemon wel?
Het is namelijk absoluut _niet_ normaal dat er al dagen geens logs meer geweest zijn, zeker na het booten zit er altijd wel wat in je /var/log/messages
Ik denk het niet, er zit namelijk geen syslog bij me logs.

Ben op het moment nog niet zo zelfverzekerd in linux, hopelijk kan dat snel veranderen. Heb al even op google naar syslog gezocht, maar kwam veel onduidelijks tegen. Iemand nog tips voor het installeren/vinden van de syslog daemon?

Verwijderd

Topicstarter
BoAC schreef op zaterdag 26 maart 2005 @ 20:08:
[...]

smartctl

[...]

Wat voor een disks zitten erin?
Ik zie nl geen ide of scsi support..
Ik heb zojuist smartctl ff geinstalleerd, net het werkt allemaal goed. Wat tests gedaan, en totaal geen problemen gevonden.

Nu wil ik graag de temperatuur van me HD weten, maar die optie staat standaard uit. Nu heb ik op google ff lopen zoeken, hoe ik dat aan kan krijgen, en verder dan

smartctl -S 9,temp --saveauto=on /dev/hda

http://smartmontools.sourceforge.net/man/smartctl.8.html

Dat heb ik daar gevonden, althans van opgemaakt.

----------

Verder als ik syslogd -r uitvoer, komt er te staan dat de syslog daemon gewoon actief is. Er is als ik in me log dir kijk alleen geen syslog te vinden, wel ksyms, is dat het zelfde?

[ Voor 14% gewijzigd door Verwijderd op 26-03-2005 20:49 ]


  • GrooV
  • Registratie: September 2004
  • Laatst online: 11-02 08:54
Ik wil niet veel zeggen, Maar als je servertje heel wat meer traffic krijgt als t.net waarom heb je dan 1 80gig ide hd? Je hd kan het gewoon niet meer aan en dan klapt alles dicht! Scsi raidje zou wel slim zijn...

Verwijderd

Topicstarter
GrooV schreef op zaterdag 26 maart 2005 @ 22:16:
Ik wil niet veel zeggen, Maar als je servertje heel wat meer traffic krijgt als t.net waarom heb je dan 1 80gig ide hd? Je hd kan het gewoon niet meer aan en dan klapt alles dicht! Scsi raidje zou wel slim zijn...
De webservers in nederland zijn scsi bakken, maar deze fileserver hoeft niet zoveel requests te verwerken als die. Maar goed wat je zegt kan opzich best waar zijn, zal eens met me hoster overleggen over een andere HD.

  • TrailBlazer
  • Registratie: Oktober 2000
  • Laatst online: 07-02 09:48

TrailBlazer

Karnemelk FTW

(jarig!)
een drukke hd lijtk me toch niet de oorzaak dat je server zichzelf ophangt. Als je toch met syslog bezig bent kan je hem beter meteen alles laten forwarden naar een externe loghost. Dit doe je in syslog.conf het volgende statement op te nemen.
*.* @ipadres of server naam

mocht er iets met de hd misgaan kan hij dat tenminste loggen naar iets mocht het de HD zijn

  • pierre-oord
  • Registratie: April 2002
  • Laatst online: 15-01 10:55
Gaat de server niet ongeveer steeds op dezelde tijd down? Misschien dat je CPU cooler er scheef op zit in het geval van een AMD cpu bij deze server. Temp is dan op het ene deel van de core laag, maar op het andere deel erg hoog, waardoor de server crasht. natuurlijk gebeurd dat bij hogere belasting waarbij meer warmte komt.

Ondernemer in tech (oud LOQED.com, nu UpToMore.com)


  • Coen Rosdorff
  • Registratie: Januari 2000
  • Niet online
Check eens met
code:
1
ps axu |grep -i syslog
eens of syslog echt draait.
Check vervolgens wat er in /etc/syslog.conf staat.

Daarna kan je nog overwegen om het MARK systeem van syslog aan te zetten. Dit kan met de -m optie. In redhat kan je dat in '/etc/sysconfig/syslog' zetten, bij andere distro's kan je het gewoon ergens in het startup script toevoegen. (/etc/rc.....). Met een -m 5 krijg je iedere 5 minuten een regel in /var/log/[messages/syslog]. Dan kan je opzijn minst vaststellen wanneer je machine voor het laatst nog wat deed.

Bij een hoster die 0,0 support geeft zou ik trouwens per direct opstappen. Ze zouden op zijn minst even op de console kunnen kijken voordat ze het reset knopje indrukken. Zonder directe informatie is het enorm lastig een probleem als dit op te lossen.
Pagina: 1