Ik heb sinds ik een nieuwe dedicated server heb een probleem met mijn virtuele machines. Het lijkt er op dat deze op de meest vreemde tijden zichzelf (vrijwel compleet) ophangen. Dit gebeurd eigenlijk op één van de twee virtuele machines.
Specs van de bak:
Hierop draaien twee virtuele machines:
- email: VM draaiend op Debian Etch (32 bit) met Zimbra Collaboration Suite, 4 gig mem, 2 cpu's
- sync: VM draaiend op Debian Lenny (32 bit) met Funambol, 512MB ram, 1 cpu
De gene die problemen geeft is de email vm. Willekeurig hangt deze zichzelf op, wat er voor zorgt dat zowel de fysieke host niet helemaal lekker werkt (kan bijv. geen top draaien en dstat crashed na 1 regel met een error) als de sync vm, brak tot niet bereikbaar maakt. De enige manier om deze weer te herstarten is een kill van het vmx proces (wat zimbra niet altijd even goed waardeert) en hem weer te starten via de VI-client of VI-web-access.
Nu heb ik al een en ander aan lapwerk gedaan. De vm's komen vanaf mijn vorige server af waar nog een oudere vmware server versie draaide. De oude bak was ook geen 64 bit(maar het lijkt me sterk dat dat problemen oplevert) Wat ik onder andere gedaan heb:
- VMware tools en hardware upgrade op beide vm's
- Kernels ed. geupdate (allemaal nieuwste stock kernels per release)
- Email VM compleet opnieuw aangemaakt en alleen de oude disks weer attached (leek het weer even op te lossen maar uiteindelijk crashde het gewoon weer even hard)
Voor de rest zou ik het echt even niet meer weten waar ik het moet zoeken, heb hier eea aan log files en systeem info waar jullie misschien wat aan kunnen hebben:
Email.vmx
Email vmware.log
Sync.vmx
Sync vmware.log
Host: /proc/interrupts, vmstat, dstat en iostat
Tevens word mn kern.log flink gespammed met:
Ik hoop dat iemand me in de goede richting kan pushen, want ik kan zeer weinig gelijkwaardige situaties op het internet vinden. Als ik info vergeten ben roep maar wat nog meer relevant kan zijn
Specs van de bak:
root@webbak:/home/bart# cat /proc/cpuinfo | grep model\ name | uniq; cat /proc/meminfo | grep MemTotal;mount | grep md; mdadm --detail --scan model name : Intel(R) Xeon(R) CPU X3360 @ 2.83GHz MemTotal: 8099180 kB /dev/md1 on / type ext3 (rw,errors=remount-ro) /dev/md2 on /home type ext3 (rw) ARRAY /dev/md1 level=raid1 num-devices=2 metadata=00.90 UUID=ba5aa658:e287d5f2:a4d2adc2:26fd5302 ARRAY /dev/md2 level=raid1 num-devices=2 metadata=00.90 UUID=af0fcc12:e7082eb4:a4d2adc2:26fd5302 root@webbak:/home/bart# uname -a; cat /etc/debian_version ; vmware -v Linux webbak.barthezz.name 2.6.26-2-amd64 #1 SMP Thu Nov 5 02:23:12 UTC 2009 x86_64 GNU/Linux 5.0.3 VMware Server 2.0.2 build-203138
Hierop draaien twee virtuele machines:
- email: VM draaiend op Debian Etch (32 bit) met Zimbra Collaboration Suite, 4 gig mem, 2 cpu's
- sync: VM draaiend op Debian Lenny (32 bit) met Funambol, 512MB ram, 1 cpu
De gene die problemen geeft is de email vm. Willekeurig hangt deze zichzelf op, wat er voor zorgt dat zowel de fysieke host niet helemaal lekker werkt (kan bijv. geen top draaien en dstat crashed na 1 regel met een error) als de sync vm, brak tot niet bereikbaar maakt. De enige manier om deze weer te herstarten is een kill van het vmx proces (wat zimbra niet altijd even goed waardeert) en hem weer te starten via de VI-client of VI-web-access.
Nu heb ik al een en ander aan lapwerk gedaan. De vm's komen vanaf mijn vorige server af waar nog een oudere vmware server versie draaide. De oude bak was ook geen 64 bit(maar het lijkt me sterk dat dat problemen oplevert) Wat ik onder andere gedaan heb:
- VMware tools en hardware upgrade op beide vm's
- Kernels ed. geupdate (allemaal nieuwste stock kernels per release)
- Email VM compleet opnieuw aangemaakt en alleen de oude disks weer attached (leek het weer even op te lossen maar uiteindelijk crashde het gewoon weer even hard)
Voor de rest zou ik het echt even niet meer weten waar ik het moet zoeken, heb hier eea aan log files en systeem info waar jullie misschien wat aan kunnen hebben:
Email.vmx
Email vmware.log
Sync.vmx
Sync vmware.log
Host: /proc/interrupts, vmstat, dstat en iostat
Tevens word mn kern.log flink gespammed met:
Wat mij eigenlijk zeer weinig zegt.Jan 23 15:00:42 webbak kernel: [67671.644945] /dev/vmmon[24954]: HostIF_ReadUptime: detected settimeofday: fixed uptimeBase old 18445479872308248793 new 18445479872307247852 attempts 1
Ik hoop dat iemand me in de goede richting kan pushen, want ik kan zeer weinig gelijkwaardige situaties op het internet vinden. Als ik info vergeten ben roep maar wat nog meer relevant kan zijn