Beste tweakerts,
Volgende probleem. Jobs die draaien onder Linux, afgeschoten vanuit een SGE cluster. Op een node met bijv 64 cores zie ik een load van rond de 64 dus zou je verwachten dat netjes alle cores belast worden.
Echter, met top zie ik maar een paar processen die rond de 100% zitten. Ik kan wel andere processen zien die draaien, alleen hebben die maar paar procent cpu gebruik. Hoe kom ik er nu achter waar alle resources heen gaan? Ik zie ook geen hoge wait%, wat een onderliggend IO probleem zou kunnen aangeven.
Hieronder een de bovenkant van top:
Zo te zien 3% idle en 97% idle?
Volgende probleem. Jobs die draaien onder Linux, afgeschoten vanuit een SGE cluster. Op een node met bijv 64 cores zie ik een load van rond de 64 dus zou je verwachten dat netjes alle cores belast worden.
Echter, met top zie ik maar een paar processen die rond de 100% zitten. Ik kan wel andere processen zien die draaien, alleen hebben die maar paar procent cpu gebruik. Hoe kom ik er nu achter waar alle resources heen gaan? Ik zie ook geen hoge wait%, wat een onderliggend IO probleem zou kunnen aangeven.
Hieronder een de bovenkant van top:
code:
1
2
3
4
5
| top - 12:07:36 up 62 days, 11:03, 1 user, load average: 60.68, 60.51, 60.63 Tasks: 1468 total, 3 running, 1465 sleeping, 0 stopped, 0 zombie Cpu(s): 0.1%us, 0.2%sy, 3.1%ni, 96.6%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 198288720k total, 31010176k used, 167278544k free, 239472k buffers Swap: 16383992k total, 20072k used, 16363920k free, 27889052k cached |
Zo te zien 3% idle en 97% idle?