Wie o wie kan mij helpen met performance problemen op de virtuele omgeving op ons werk? Ik zal proberen zoveel mogelijk informatie in deze OP te verwerken.
Regelmatig door de dag merken we een vertraging op servers binnen de virtuele omgeving (vooral merkbaar op Terminal Servers). Dit zijn CPU gerelateerde problemen, binnen de VM is te zien dat er 100% CPU gebruikt wordt (niet echt aanwijsbaar één proces) en VMware geeft regelmatig een alert over hoog CPU gebruik van die machine. Ook is de algehele performance slecht gezien de resources die gebruikt worden. Voor de storage is er een NetApp aan gekoppeld en de bottleneck lijkt allemaal niet in het geheugen of de disks te zitten, volgens mij is het puur CPU gerelateerd.
Hardware:
2x Dell PowerEdge R900 met 24 cores.

1a. VMware Host 1 General

1b. VMware Host 2 General
Resources in gebruik midden op een dag:

2a. VMware Host 1 Resources

2b. VMware Host 2 Resources
Het lijkt er dus op dat ik nog resources genoeg over heb, maar dat deze niet optimaal gebruikt worden. Ik ben dus al wat op onderzoek uitgegaan en onder andere via deze blog: http://www.gabesvirtualwo...h-check/cpu-health-check/ een stuk wijzer geworden over het CPU gebruik van VMware systemen. Daar wordt ook aangegeven dat je een vuistregel kunt nemen van niet meer dan 6 vCPUs per fysieke core en daar zitten wij nog lang niet aan. Dan ben ik er dus weer verder in gedoken via de console met het commando esxtop en hier heb ik volgens mij wel één van de redenen van traagheid gevonden: de waarde voor %RDY is te hoog, wat betekent dat de CPU's te lang aan het wachten zijn tot er weer resources vrij zijn. Zie onderstaande screenshots:
Console esxtop screenshots

3a. esxtop VMware Host 1

3b. esxtop VMware Host 2
Nu is de grootste boosdoener (in 3b) wel een SQL server die we gauw weer terug gaan zetten naar een fysieke server omdat de performance niet voldoet, dus die zal komen te vervallen, maar de andere servers hebben ook een te hoge %RDY waarde. (dit was namelijk ook al het geval voordat die SQL server überhaupt maar bestond) Ik heb al geprobeerd om de prioriteit van de CPU shares voor de Terminal Servers te veranderen naar High, maar dit lijkt weinig verschil uit te maken.
Ik weet eerlijk gezegd niet waar ik het nu moet zoeken. Ik heb het document "Performance Best Practices for VMware vSphere 5.0" hier voor me liggen, maar tot nu toe nog weinig progressie geboekt. Wie heeft er tips hoe ik dit het beste aan kan pakken?
Regelmatig door de dag merken we een vertraging op servers binnen de virtuele omgeving (vooral merkbaar op Terminal Servers). Dit zijn CPU gerelateerde problemen, binnen de VM is te zien dat er 100% CPU gebruikt wordt (niet echt aanwijsbaar één proces) en VMware geeft regelmatig een alert over hoog CPU gebruik van die machine. Ook is de algehele performance slecht gezien de resources die gebruikt worden. Voor de storage is er een NetApp aan gekoppeld en de bottleneck lijkt allemaal niet in het geheugen of de disks te zitten, volgens mij is het puur CPU gerelateerd.
Hardware:
2x Dell PowerEdge R900 met 24 cores.

1a. VMware Host 1 General

1b. VMware Host 2 General
Resources in gebruik midden op een dag:

2a. VMware Host 1 Resources

2b. VMware Host 2 Resources
Het lijkt er dus op dat ik nog resources genoeg over heb, maar dat deze niet optimaal gebruikt worden. Ik ben dus al wat op onderzoek uitgegaan en onder andere via deze blog: http://www.gabesvirtualwo...h-check/cpu-health-check/ een stuk wijzer geworden over het CPU gebruik van VMware systemen. Daar wordt ook aangegeven dat je een vuistregel kunt nemen van niet meer dan 6 vCPUs per fysieke core en daar zitten wij nog lang niet aan. Dan ben ik er dus weer verder in gedoken via de console met het commando esxtop en hier heb ik volgens mij wel één van de redenen van traagheid gevonden: de waarde voor %RDY is te hoog, wat betekent dat de CPU's te lang aan het wachten zijn tot er weer resources vrij zijn. Zie onderstaande screenshots:
Console esxtop screenshots

3a. esxtop VMware Host 1

3b. esxtop VMware Host 2
Nu is de grootste boosdoener (in 3b) wel een SQL server die we gauw weer terug gaan zetten naar een fysieke server omdat de performance niet voldoet, dus die zal komen te vervallen, maar de andere servers hebben ook een te hoge %RDY waarde. (dit was namelijk ook al het geval voordat die SQL server überhaupt maar bestond) Ik heb al geprobeerd om de prioriteit van de CPU shares voor de Terminal Servers te veranderen naar High, maar dit lijkt weinig verschil uit te maken.
Ik weet eerlijk gezegd niet waar ik het nu moet zoeken. Ik heb het document "Performance Best Practices for VMware vSphere 5.0" hier voor me liggen, maar tot nu toe nog weinig progressie geboekt. Wie heeft er tips hoe ik dit het beste aan kan pakken?
Aan mensen die me ipv mijn gebruiken: hebben jullie in het echt ook zo'n spraakgebrek?
