[Dell] Probleem met HW installatie Cluster

Pagina: 1
Acties:

  • Angelfire
  • Registratie: September 2000
  • Laatst online: 10:51

Angelfire

AKA AZwaanR or RZA

Topicstarter
Heren/Dames,

ik zit met een probleem waar ik een beetje geïrriteerd van begin te raken, ik ben er al drie dagen mee bezig.
Ik zal de situatie schetsen:
Ik moet een Print cluster bouwen voor een test, er is geen budget beschikbaar om extra hardware aan te schaffen, dus ik zal het moeten doen met wat ik heb.
Ik heb: 2 Dell PowerEdge 2550 servers. identiek aan elkaar in HW en FW.
2 Dell Perc3/DC Raidcontrolers die clustering ondersteunen, en ze zijn goed getest
1 Powervault 210S met 12 stuks 36Gb harde schijven.
Ik sluit aan zoals het moet:
In elke server in hetzelfde PCI slot de Raid controler.
Van elke Raidcontroler gaat er vanaf hetzelfde kanaal een kabel naar het kabinet.
Op de management poorten (2 stuks) van het kabinet staat de jumper (J8) Force Joined ingesteld, dit moet om het kabinet in Cluster mode te laten draaien. (officieel moet het ID van elke van de management poorten 15 zijn, ik heb ook al met afwijkende geprobeerd).
In elke Raid controler staat ingesteld dat die in Cluster Mode moet draaien (bij boot geeft de Raid controler dit netjes aan). Elke Raid Controler heeft een afwijkend ID (dit moet).

Wat is nu het probleem zou je denken??
Om de diskconfiguratie aan te maken moet 1 server uit staan. 1 server start je op, je maakt de configuratie aan, sluit hem af, start de 2e server op en importeerd de configuratie. Ik heb dit al honderden malen gedaan, en het werkt echt altijd.
Behalve nu dan.
Ik zet server 1 aan. Deze start op, probeerd de controler te initalizeren, en komt bij het scannen van de SCSI ID's niet verder. Zet ik server 2 aan, dan werkt het wel. (Echter dit hoort niet). Ok verder: Als ik alles (OS etc) installeer, en ik initieer een failure (om te testen of het cluster werkt), de server die op zou moeten blijven die hangt nu domweg, herstart van die machine, jawel zelfde gedonder, hij hangt bij initialisatie. 8)7
Ik heb hetvolgende al geprobeerd:
nieuw diskcabinet, met nieuwe schijven >> zelfde ellende
nieuwe SCSI kabels >> zelfde ellende
andere servers (500SC) >> zelfde ellende
De controlers zijn goed, deze hebben nl. in een ander systeem altijd gewerkt (alleen nooit in clustering). Ik heb diverse FW voor zowel de controlers als de servers geprobeerd, geen effect. Er bestaat helaas geen firmware voor het diskcabinet, dus die kan ik niet updaten. Ik heb zelfs geprobeerd met de FW van de fabrikant van de kaarten (LSI), ook dit hielp niet.

Contact met onze HW leverancier: zou moeten werken hoor !!
Contact met Dell: wij weten het ook niet !!

Is er iemand die deze arme ziel nog een hint kan geven over hoe verder te gaan??

Het moet helaas aan het eind van volgende week draaien, en ik ben vanaf 19.00 uur t/m woensdag niet meer aanwezig.. (ik stuur deze link wel door naar een collega van me).

I play my enemies like a game of chess...


Verwijderd

Als ik je verhaal goed begrijp werkt het cluster alleen als beide nodes aan staan. Zet je er 1 uit, dan kan de ander de devices op de SCSI bus niet meer benaderen.

Hmmm... klinkt als een classiek clustering probleem. Hardware specs lijken me OK, daar kan het niet aan liggen (tenzij een technisch defect).

[logische nadenk mode]

Normaliter heb je voor een SCSI cluster speciale controllers nodig die zowel active als passive terminatie ondersteunen. M.a.w. de SCSI bus tussen de 2 nodes moet ten alle tijden getermineerd worden, ook als 1 van de servers uit staat.

[/logische nadenk mode]

Die Perc's zouden dat in principe moeten ondersteunen. Maar gezien het feit dat deze controllers al eens in een niet cluster systeem gebruikt zijn, kan het best dat dit uitgezet is. Kortom ff de BIOS sjekken of de 'springers' op de plank zelf controlleren ;)

  • Angelfire
  • Registratie: September 2000
  • Laatst online: 10:51

Angelfire

AKA AZwaanR or RZA

Topicstarter
BinaryBrain, ik wil je danken voor het meedenken. In de BIOS van de controlers (hebben geen jumpers) staat dat ie in CLUSTER MODE is ingesteld. Hierna moest ik ook opnieuw starten.
De Jumpers op de management boards staan op Force Joined (welke noodzakelijk is voor Cluster Operation). Van mijn leverancier heb ik ook nog niets gehoord, ik denk dat ik ze maar weer eens ga bellen.

Iemand anders nog ideëen?

I play my enemies like a game of chess...


  • Abbadon
  • Registratie: Februari 2000
  • Laatst online: 10:32
Ik heb geen ervaring met Dell clusters en het in cluster zetten d.m.v. zulke kaarten maar als je node één configureert terwijl node twee off-line staat (wat dus moet), is de SCSI keten dan wel goed getermindeerd?
En hoe zit het met SCSI (initiator) ID's? Zelf speel ik met Sun Clusters en daar loopt het al vrij snel spaak als je die dingen niet goed ingesteld hebt.

Just pick a dead end and chill out 'till you die.


  • Angelfire
  • Registratie: September 2000
  • Laatst online: 10:51

Angelfire

AKA AZwaanR or RZA

Topicstarter
SCSI ID initiators zijn per kaart verschillend. (kaart 1 op 6, kaart 2 op 7). De bus lijkt me goed geterminate, dit doet het management board. Geen power op het board betekend dat ie geterminate word. (Dit gedrag wordt bepaald door de Force Joined Jumper). De tweede node is ook Offline (staat uit, wel spanning op de PSU), echter hij hangt dan bij het scannen van de bus. Ik begin ook sterk te vermoeden dat de termination niet goed gaat. Het vreemde is dat ik dus al twee kabinetten geprobeerd heb (ieder met zijn eigen management boards) en alle kabels al een keer vervangen heb. Dit lijkt het me behoorlijk uit te sluiten.

Het enige dat dat er eigenlijk nog overblijft zijn de Raid Controlers zelf. Ik ga aan mijn leverancier vragen om twee nieuwe kaarten. Die verwacht ik dan volgende week ergens, ze zijn nl. nogal traaaaaaaag (hebben een beroerd voorraad beheer). Ik hou jullie op de hoogte, en keep the idea's comming.

I play my enemies like a game of chess...


  • Angelfire
  • Registratie: September 2000
  • Laatst online: 10:51

Angelfire

AKA AZwaanR or RZA

Topicstarter
Medetweakers: Ik ben weer een stuk wijzer geworden. Dus daarom wil ik mijn kennis met jullie delen opdat een ander hier zijn voordeel mee kan doen.

Het schijnt dat er twee typen management boards bestaan. Eentje ondersteund wel clustering. De ander niet. Je kan het verschil niet zien. De layout en firmware versie is identiek hetzelfde. Mij is het ook nog niet gelukt om de firmware uit te lezen. Laat staan te flashen.
Wel clustering: Dell P/N: 0107KT
Geen clustering: Dell P/N: 055FKV
De nummers staan op de management boards, vlak bij de lokatie waar je je SCSI kabel aansluit.

I play my enemies like a game of chess...

Pagina: 1