Het onderstaande probleem kan twee kanten hebben of het is een hardware compatibility probleem of een ESXi software/hardware probleem..., lastig een juiste topic te kiezen..., mijn excuses als deze verkeerd staat...
graag zou ik het volgende probleem aan jullie willen voorleggen.
Wij hebben vier maanden geleden vier nieuwe DELL R620 systemen aangeschaft met nieuwe XEON v2 (ivy Bridge) CPU's.
3x R620, 256GB (1600Mhz), XEON E5-2667 v2 @3.30Ghz
1x R620, 320GB (1333Mhz), XEON E5-2690 v2 @3.00Ghz
Daarnaast hebben wij ook diverse oudere DELL PowerEdge R620 systemen met de oudere Xeon (niet v2) (Sandy Bridge) CPU's.
Als OS gebruiken wij vmware ESXi 5.1 update 2 build 1612806, de oudere systemen zitten nog op Update 1.
Wij hebben een SAN die via twee gescheiden fibre chanel switches verbonden zijn met deze systemen.
In al deze systemen gebruiken wij Qlogic QLE2460 kaarten (via DELL meegeleverd/ingebouwd en dus goedgekeurd)
Nu zijn deze kaarten in de nieuwe servers niet stabiel, in de oude wel.
Probleem: een van de vmhba kaarten meld "dead" connecties naar alle LUN's na verloop van tijd, soms na meerdere dagen variërend van 1 tot 8 dagen. wel is het hoe meer load op de HBA, hoe sneller de fout zich voordoet.
Volgens analyse lijkt het erop dat de driver van de kaarten knalt, het gebeurd altijd met 1 hba tegelijk wachten we langer, dan gaat uiteindelijk ook de tweede dood.
Na een reboot werkt alles weer.
Wat hebben wij inmiddels gedaan, diverse esx drivers via DELL verkregen of via de Qlogic site, diverse ESX installaties via de DELL customized CD uitgevoerd, zelfde build/versie als in de huidige stabiele productie getest, Firmware van de Brocade FC switches geupdate op advies van DELL... enz.. enz...
Waar ik aan denk is dat de Qlogic kaarten niet compatible zijn met de V2 cpu's.
We hebben ook een kaart swap gedaan vanuit een oudere machine dezelfde Qlogic kaarten gewisseld met de nieuwe systemen: zelfde probleem.
DELL wil echter het probleem niet erkennen en denkt nog steeds dat het een ander probleem is.
Maar graag jullie ideeën, de PCI spec van de Xeon is PCIe v3, die van de oudere Xeon (E5-2680) welke wel al ruim een jaar stabiel draait met diezelfde kaarten heeft ook PCIe spec v3.
De Qlogic kaarten PCIe spec 1a, de eerste versie.
Ik weet dat videokaarten niet altijd even goed werken zodra ze in oudere PCIe generatie moederborden worden gestopt, echter is het vreemd dat de kaarten het wel blijven doen in de oude Xeon CPU systemen, maar niet in de nieuwe V2, ondanks dezelfde PCIe spec.
Overigens kampt de Xeon v2 met nog een probleem:
http://kb.vmware.com/self...playKC&externalId=2073791
Nu heb ik dat probleem nog niet ervaren, maar zijn er vergelijkbare ervaringen met deze nieuwere Xeon's?
Of wellicht van de Ivy bridge CPU, nadat je bijvoorbeeld bent overgestapt van een sandy bridge?
Dit hele probleem is overigens een hoofdbreker bij DELL, zij weten ook niet wat er mis gaat.
Inmiddels zijn we gaan testen met nieuwere kaarten van Qlogic en Emulex.
Maar omdat de problemen pas na een paar dagen, soms meer dan een een week op zich laten wachten kunnen we nog niet veel zeggen van de eerste testen, deze staan nu 4 dagen in de test, voor alsnog zonder problemen.
graag zou ik het volgende probleem aan jullie willen voorleggen.
Wij hebben vier maanden geleden vier nieuwe DELL R620 systemen aangeschaft met nieuwe XEON v2 (ivy Bridge) CPU's.
3x R620, 256GB (1600Mhz), XEON E5-2667 v2 @3.30Ghz
1x R620, 320GB (1333Mhz), XEON E5-2690 v2 @3.00Ghz
Daarnaast hebben wij ook diverse oudere DELL PowerEdge R620 systemen met de oudere Xeon (niet v2) (Sandy Bridge) CPU's.
Als OS gebruiken wij vmware ESXi 5.1 update 2 build 1612806, de oudere systemen zitten nog op Update 1.
Wij hebben een SAN die via twee gescheiden fibre chanel switches verbonden zijn met deze systemen.
In al deze systemen gebruiken wij Qlogic QLE2460 kaarten (via DELL meegeleverd/ingebouwd en dus goedgekeurd)
Nu zijn deze kaarten in de nieuwe servers niet stabiel, in de oude wel.
Probleem: een van de vmhba kaarten meld "dead" connecties naar alle LUN's na verloop van tijd, soms na meerdere dagen variërend van 1 tot 8 dagen. wel is het hoe meer load op de HBA, hoe sneller de fout zich voordoet.
Volgens analyse lijkt het erop dat de driver van de kaarten knalt, het gebeurd altijd met 1 hba tegelijk wachten we langer, dan gaat uiteindelijk ook de tweede dood.
Na een reboot werkt alles weer.
Wat hebben wij inmiddels gedaan, diverse esx drivers via DELL verkregen of via de Qlogic site, diverse ESX installaties via de DELL customized CD uitgevoerd, zelfde build/versie als in de huidige stabiele productie getest, Firmware van de Brocade FC switches geupdate op advies van DELL... enz.. enz...
Waar ik aan denk is dat de Qlogic kaarten niet compatible zijn met de V2 cpu's.
We hebben ook een kaart swap gedaan vanuit een oudere machine dezelfde Qlogic kaarten gewisseld met de nieuwe systemen: zelfde probleem.
DELL wil echter het probleem niet erkennen en denkt nog steeds dat het een ander probleem is.
Maar graag jullie ideeën, de PCI spec van de Xeon is PCIe v3, die van de oudere Xeon (E5-2680) welke wel al ruim een jaar stabiel draait met diezelfde kaarten heeft ook PCIe spec v3.
De Qlogic kaarten PCIe spec 1a, de eerste versie.
Ik weet dat videokaarten niet altijd even goed werken zodra ze in oudere PCIe generatie moederborden worden gestopt, echter is het vreemd dat de kaarten het wel blijven doen in de oude Xeon CPU systemen, maar niet in de nieuwe V2, ondanks dezelfde PCIe spec.
Overigens kampt de Xeon v2 met nog een probleem:
http://kb.vmware.com/self...playKC&externalId=2073791
Nu heb ik dat probleem nog niet ervaren, maar zijn er vergelijkbare ervaringen met deze nieuwere Xeon's?
Of wellicht van de Ivy bridge CPU, nadat je bijvoorbeeld bent overgestapt van een sandy bridge?
Dit hele probleem is overigens een hoofdbreker bij DELL, zij weten ook niet wat er mis gaat.
Inmiddels zijn we gaan testen met nieuwere kaarten van Qlogic en Emulex.
Maar omdat de problemen pas na een paar dagen, soms meer dan een een week op zich laten wachten kunnen we nog niet veel zeggen van de eerste testen, deze staan nu 4 dagen in de test, voor alsnog zonder problemen.
[ Voor 9% gewijzigd door TheTeek op 29-04-2014 13:59 . Reden: aanvullingen... ]
No one knows what TheTeek is