Ik zit momenteel wat verveeld met CPU monitoring van een aantal Checkpoint firewalls. Wij monitoren die hier met PRTG , één van de bekendere commerciele SNMP monitoring pakketten denk ik.
Checkpoint heeft wel zijn eigen MIB uitbreidingen , maar voor die CPU monitoring hoeven we daar geen gebruik van te maken. In feite is mijn vraag dus algemener dan enkel voor onze Checkpoint monitoring.
Ik wens 2 zaken uit te lezen van die CPU , de idle time in % , en de 1 minute load in %
Dit zijn zowat de standaard mogelijkheden/OID's , diegene in het vet , die gebruik ik :
CPU Statistics
Load
1 minute Load: .1.3.6.1.4.1.2021.10.1.3.1
5 minute Load: .1.3.6.1.4.1.2021.10.1.3.2
15 minute Load: .1.3.6.1.4.1.2021.10.1.3.3
CPU
percentage of user CPU time: .1.3.6.1.4.1.2021.11.9.0
raw user cpu time: .1.3.6.1.4.1.2021.11.50.0
percentages of system CPU time: .1.3.6.1.4.1.2021.11.10.0
raw system cpu time: .1.3.6.1.4.1.2021.11.52.0
percentages of idle CPU time: .1.3.6.1.4.1.2021.11.11.0
raw idle cpu time: .1.3.6.1.4.1.2021.11.53.0
raw nice cpu time: .1.3.6.1.4.1.2021.11.51.0
Nu het probleem :
- Voor de 1 minute load ( .1.3.6.1.4.1.2021.10.1.3.1 ) : hier krijgen we extreen lage waardes , bijna allemaal 0,x waardes. Het leek mij dan logisch dat ik de uitgelezen waarde per definitie maal 10 doe , om de effectieve load te zien. Dat komt dan neer op belasting tussen de 3-5% ( wat met TOP op het toestel zelf bevestigd wordt ).
Het enige probleem is dat ik af en toe ook een waarde 11,x en dergelijke uitlees. Als ik deze maal 10 doe , kom ik uiteraard aan een load percentage van meer dan 100 %. Is dit dan gewoon het samentellen van 2 cores tot 200% , die dan 110% belast zijn , is dit dan 1 core 100% belast , en de 2 de core 10 procent ? Indien ja , dan hoef ik me geen zorgen te maken. Indien niet , dan snap ik niet wat ik nu juist uitlees , die OID voor 1 minute idle time moest toch iets héél algemeen zijn in de Linux wereld ?
- 2 de probleem is de Idle time in % ( .1.3.6.1.4.1.2021.11.11.0 ) : Deze lezen op sommige systemen 78% continu , andere systemen 98% continu. Zo'n 'flatline' voor CPU idle time lijkt me toch helemaal niet te kloppen
Graag enig advies , wat ik in TOP zie snap ik allemaal wel , maar wat ik nu met SNMP uitlees slaat voorlopig nergens op
Checkpoint heeft wel zijn eigen MIB uitbreidingen , maar voor die CPU monitoring hoeven we daar geen gebruik van te maken. In feite is mijn vraag dus algemener dan enkel voor onze Checkpoint monitoring.
Ik wens 2 zaken uit te lezen van die CPU , de idle time in % , en de 1 minute load in %
Dit zijn zowat de standaard mogelijkheden/OID's , diegene in het vet , die gebruik ik :
CPU Statistics
Load
1 minute Load: .1.3.6.1.4.1.2021.10.1.3.1
5 minute Load: .1.3.6.1.4.1.2021.10.1.3.2
15 minute Load: .1.3.6.1.4.1.2021.10.1.3.3
CPU
percentage of user CPU time: .1.3.6.1.4.1.2021.11.9.0
raw user cpu time: .1.3.6.1.4.1.2021.11.50.0
percentages of system CPU time: .1.3.6.1.4.1.2021.11.10.0
raw system cpu time: .1.3.6.1.4.1.2021.11.52.0
percentages of idle CPU time: .1.3.6.1.4.1.2021.11.11.0
raw idle cpu time: .1.3.6.1.4.1.2021.11.53.0
raw nice cpu time: .1.3.6.1.4.1.2021.11.51.0
Nu het probleem :
- Voor de 1 minute load ( .1.3.6.1.4.1.2021.10.1.3.1 ) : hier krijgen we extreen lage waardes , bijna allemaal 0,x waardes. Het leek mij dan logisch dat ik de uitgelezen waarde per definitie maal 10 doe , om de effectieve load te zien. Dat komt dan neer op belasting tussen de 3-5% ( wat met TOP op het toestel zelf bevestigd wordt ).
Het enige probleem is dat ik af en toe ook een waarde 11,x en dergelijke uitlees. Als ik deze maal 10 doe , kom ik uiteraard aan een load percentage van meer dan 100 %. Is dit dan gewoon het samentellen van 2 cores tot 200% , die dan 110% belast zijn , is dit dan 1 core 100% belast , en de 2 de core 10 procent ? Indien ja , dan hoef ik me geen zorgen te maken. Indien niet , dan snap ik niet wat ik nu juist uitlees , die OID voor 1 minute idle time moest toch iets héél algemeen zijn in de Linux wereld ?
- 2 de probleem is de Idle time in % ( .1.3.6.1.4.1.2021.11.11.0 ) : Deze lezen op sommige systemen 78% continu , andere systemen 98% continu. Zo'n 'flatline' voor CPU idle time lijkt me toch helemaal niet te kloppen

Graag enig advies , wat ik in TOP zie snap ik allemaal wel , maar wat ik nu met SNMP uitlees slaat voorlopig nergens op
[ Voor 0% gewijzigd door MPAnnihilator op 26-10-2012 11:43 . Reden: opmaak ]