Toon posts:

[RAQ] CPU overbelast.

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ik kreeg vandaag om 6:15 uur en 9:00 uur de melding dat de CPU behoorlijk overbelast was het laatste kwartier.

1 minute load average: 6.01
5 minute load average: 5.66
15 minute load average: 5.24

Deze getallen zeggen mij niet zoveel om eerlijk te zijn. Wanneer moet ik echt bang worden? :)

Ik heb alle logfiles (maillog, messages, access) al doorgespit, maar kan daar geen vreemde zaken vinden rond die tijdstippen. Met het programmaatje "top" kan ik mooi zien welke processen het systeem belasten op een bepaald moment. Zou je deze gegevens ook kunnen loggen?

Bedankt voor tips.

Verwijderd

Zoek eens uit wat e.e.a. betekent:

http://www.deadly.org/article.php3?sid=20030521201844 (even doorscrollen)
http://www.webhostingtalk.com/archive/thread/228165-1.html
http://www.webhostingtalk.com/showthread.php?threadid=8237 (ook een RAQ)

Oh, en het loggen van 'top'; ik heb geen idee hoor, maar misschien werkt 'top > log.txt' :?

Verwijderd

Topicstarter
dat vind ik niet echt loggen, dat is meer de output in een bestand drukken.

Ik ga even je linkjes bekijken. Thanks!

Verwijderd

Topicstarter
Hmm, ik kan daar niks vinden. Mede ook omdat ik geen rare meldingen in mijn logfiles kan vinden. Alles lijkt normaal. Ik kan ook niet zien welke processen allemaal draaide op dat tijdstip. Ik wacht even af of het terugkomt. Als iemand nog suggesties heeft om dit te voorkomen dan hoor ik die graag. Bedankt.

  • 4VAlien
  • Registratie: November 2000
  • Laatst online: 15-02 16:07

4VAlien

Intarweb!

Als een aantal processen op I/O staan te wachten gaat de load nog wel eens omhoog, als het systeem verder nog wel normaal reageert is er niet zoveel aan de hand.

  • ripexx
  • Registratie: Juli 2002
  • Laatst online: 21:19

ripexx

bibs

Uit de faq van NOS:

Hoe wordt het 'load average' berekend?


De gemiddelde load (zoals bijvoorbeeld weergegeven door het 'uptime' commando) is simpelweg het aantal timeslices dat een proces (programma) moet wachten voor het aan de beurt komt op de CPU. Als je gemiddelde load 2.5 is, dan duurt het gemiddeld 2.5 timeslices voordat een proces weer van de CPU gebruik kan maken. Als je 1 proces hebt draaien dat de CPU continu probeert te gebruiken (100% cpu), dan zal je gemiddelde load (ongeveer) 1.00 zijn. Immers: omdat dit proces continu de CPU probeert te claimen, zal het voor willekeurige andere processen gemiddeld 1 timeslice duren voordat ze aan de beurt komen. Als je twee processen hebt draaien die de hele tijd zoveel mogelijk CPU proberen te gebruiken, dan zal het voor andere processen gemiddeld 2 timeslices duren voor ze aan de beurt komen, dus is de load ca. 2.00. CPU-gebruik is niet het enige dat load kan veroorzaken. Als de kernel moet wachten op i/o (met name van de HD en de netwerkkaart), dan kan de kernel soms even geen processen aan de beurt laten, dus duurt het langer voor processen aan de beurt komen, en dus zie je een hogere gemiddelde load. Zo kan het dus zijn dat een bak die heel hard staat te swappen (vanwege geheugen-tekort) een erg hoge gemiddelde load heeft, terwijl er geen processen op draaien die veel cpu trekken.

Het komt er in ieder geval op neer, dat hoe hoger je gemiddelde load is, hoe minder werkbaar de computer zal zijn. Wanneer je het precies gaat merken, hangt vrij sterk af van je soort compu. Een 486 met IDE en weinig ram zal al snel een hoge load hebben, en zal een load van 5 al merkbare vertraging geven. Een dikke UltraSparc met SCSI en veel ram zal iig niet zo snel een hoge load hebben, maar waarschijnlijk zou je van een load van 5 niet eens zo veel merken (nouja, quake 3 spelen kun je dan vergeten, maar verder...)



Oorzaken die load vergroten zijn oa veel verschillende processen, trage diskaccess etc. Load zegt niet alles maar geeft wel degelijk een indicatie dat er iets fout is. Wat je kan proberen is om het monitoring script dus danig aan te passen dat deze dan ook outputs geeft van je diskgebruik, memory gebruik en en overzicht van je processen geeft. Dan zou opzich snel duidelijk moeten zijn waar een eventuele bottleneck zit. :)

buit is binnen sukkel


  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 20:24

Koffie

Koffiebierbrouwer

Braaimeneer

Move PNS > NOS

Tijd voor een nieuwe sig..


  • raoulduke
  • Registratie: Oktober 2003
  • Niet online

raoulduke

Get in!

Over het loggen van 'top': misschien is het een beter idee om je systeem in de gaten te houden met vmstat en de uitvoer daarvan te loggen:

vmstat 10 > vmstat.log

Er wordt dan iedere 10 seconden weggeschreven hoeveel processen er in welke staat staan, disk i/o, geheugengebruik, swap i/o en natuurlijk CPU states.

Remember, if you have any trouble you can always send a telegram to the Right People.


Verwijderd

Verwijderd schreef op 03 februari 2004 @ 09:53:
[...]
Met het programmaatje "top" kan ik mooi zien welke processen het systeem belasten op een bepaald moment. Zou je deze gegevens ook kunnen loggen?
[...]
Welke processen zijn dit dan? Deze data is overigens perfect logbaar als je top in batch-mode zet:
code:
1
top -b > /var/log/top.log

Zonder meer info kunnen we hier niets zinnigs over zeggen. Als je bijvoorbeeld 6 processen hebt die allemaal wachten op IO activiteit, zal je load ook op 6 staan. Echter is het ook mogelijk dat 1 enkel proces dusdanig veel resources vreet dat de load rond de 6 kan komen.

Verwijderd

Topicstarter
Goeie tips. Dat ga ik even toepassen. het heeft zich niet meer voor gedaan eigenlijk. Dus ik wacht even af. Toch bedankt.

Verwijderd

Kijk ook eens met

vmstat 1 100

of probeer :

sar -A 1 100

Je krijgt dan direct te zien of je systeem swapt, waiting IO, CPU load heeft.
Met vmstat kan je niet zien *welk* proces de load veroorzaakt, met sar (-X parameter) kan dat wel. Daarvoor moet je met tools als top aan de gang.

[ Voor 4% gewijzigd door Verwijderd op 04-02-2004 13:07 ]


Verwijderd

Topicstarter
top -b > /var/log/top.log
Is dit ook nog zo in te stellen dat hij dit met een interval van 2 minuten logt? Dan zou ik al een heel eind wezen denk ik.

[ Voor 34% gewijzigd door Verwijderd op 09-02-2004 09:40 ]


  • Wilke
  • Registratie: December 2000
  • Laatst online: 22:40
Verwijderd schreef op 09 februari 2004 @ 09:39:
Is dit ook nog zo in te stellen dat hij dit met een interval van 2 minuten logt? Dan zou ik al een heel eind wezen denk ik.
'man top'.

Een beetje zelf zoeken en de handleidingen lezen mag ook wel op zich..

[ Voor 14% gewijzigd door Wilke op 10-02-2004 01:52 ]


Verwijderd

Topicstarter
Ik heb het al:

top -b -d 120 > top.log &

Dat moet hem wezen. Thanks
Pagina: 1