Uit de faq van NOS:
Hoe wordt het 'load average' berekend?
De gemiddelde load (zoals bijvoorbeeld weergegeven door het 'uptime' commando) is simpelweg het aantal timeslices dat een proces (programma) moet wachten voor het aan de beurt komt op de CPU. Als je gemiddelde load 2.5 is, dan duurt het gemiddeld 2.5 timeslices voordat een proces weer van de CPU gebruik kan maken. Als je 1 proces hebt draaien dat de CPU continu probeert te gebruiken (100% cpu), dan zal je gemiddelde load (ongeveer) 1.00 zijn. Immers: omdat dit proces continu de CPU probeert te claimen, zal het voor willekeurige andere processen gemiddeld 1 timeslice duren voordat ze aan de beurt komen. Als je twee processen hebt draaien die de hele tijd zoveel mogelijk CPU proberen te gebruiken, dan zal het voor andere processen gemiddeld 2 timeslices duren voor ze aan de beurt komen, dus is de load ca. 2.00. CPU-gebruik is niet het enige dat load kan veroorzaken. Als de kernel moet wachten op i/o (met name van de HD en de netwerkkaart), dan kan de kernel soms even geen processen aan de beurt laten, dus duurt het langer voor processen aan de beurt komen, en dus zie je een hogere gemiddelde load. Zo kan het dus zijn dat een bak die heel hard staat te swappen (vanwege geheugen-tekort) een erg hoge gemiddelde load heeft, terwijl er geen processen op draaien die veel cpu trekken.
Het komt er in ieder geval op neer, dat hoe hoger je gemiddelde load is, hoe minder werkbaar de computer zal zijn. Wanneer je het precies gaat merken, hangt vrij sterk af van je soort compu. Een 486 met IDE en weinig ram zal al snel een hoge load hebben, en zal een load van 5 al merkbare vertraging geven. Een dikke UltraSparc met SCSI en veel ram zal iig niet zo snel een hoge load hebben, maar waarschijnlijk zou je van een load van 5 niet eens zo veel merken (nouja, quake 3 spelen kun je dan vergeten, maar verder...)
Oorzaken die load vergroten zijn oa veel verschillende processen, trage diskaccess etc. Load zegt niet alles maar geeft wel degelijk een indicatie dat er iets fout is. Wat je kan proberen is om het monitoring script dus danig aan te passen dat deze dan ook outputs geeft van je diskgebruik, memory gebruik en en overzicht van je processen geeft. Dan zou opzich snel duidelijk moeten zijn waar een eventuele bottleneck zit.