IBM Server: gebruik van SCA backplanes levert Event ID 11 op

Pagina: 1
Acties:

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Inleiding
Ik heb hier een PC Server 704 (8650-4M0) staan dat te zijner tijd de huidige webserver (PC Server 520) moet gaan vervangen. Ik ben al weken bezig geweest met het voorbereiden van de server voor het gebruik. Het duurde zo lang, omdat ik problemen ondervond met de SCA backplanes :/

Relevante specs
• IBM moederbord met Intel 450GX chipset
• 4x Pentium Pro 200 met 1MB L2 cache
• 16x 32MB 70ns EDO reepjes (512MB)
• 2x onboard Adaptec AIC7880 controllers met elk 1 UW SCSI kanaal
• 2x IBM SCA backplane met elk 6 SCA connectoren
• 10x IBM DGHS-04Y 4,5GB 7200rpm UW SCA schijven
• Er zit niks in de PCI en MCA sloten geprikt, alles zit onboard

Het probleem
Tijdens het installeren van Windows 2000 Server op een der 4,5GB SCA disken kon het formatteren niet voltooid worden. Het bleef de hele tijd op 100% staan. Dit kwam voor bij zowel Quick als Full format en het maakte niet uit of ik voor NTFS of FAT32 koos (NTFS heeft de voorkeur). Toen had ik W2KS op een tijdelijke IDE disk (Quantum Fireball LM 20GB) geinstalleerd en dat ging probleemloos. Al het hardware werd correct herkend en alle vereiste drivers zijn reeds in W2KS embedded. Maar wanneer ik binnen het OS een van de SCA disken wil formatteren, bleef het formatteren ook hangen op 100%.

Troubleshooting
In de Event Viewer kwam ik een heleboel Event ID 11 meldingen tegen van AIC78xx (de onboard controller). En wanneer ik een van de schijven formatteer danwel benader ook nog heel af en toe Event ID 9. Wanneer ik na het formatteren (die dus op 100% hangt) de server reboot, kan ik de schijven wel benaderen, maar de Event meldingen bleven niet uit. Ook zijn de schijven duidelijk trager bij het schrijven van data. Hierover heeft Microsoft de Q154690 beschreven. Deze meldingen blijven wel uit wanneer er geen harddisks aan de SCA backplane zijn aangesloten en wanneer er een losse SCSI harddisk (Maxtor Atlas 15K) aan de controller werd aangesloten.

Terminatie: zit op zowel de controller als de backplanes, niet op de disken (want: SCA). Deze lijkt me dus in orde, alle disken worden ook gewoon correct herkend.

ID's: worden automatisch geregeld door de backplanes. 0 t/m 5 worden gebruikt. Dmv een jumpersetting kan ook o.a. 8 t/m 13 worden gebruikt (6=backplane, 7=controller). Levert niks op en alle disken worden nochtans correct herkend.

Kabels: 3 verschillende kabels geprobeerd (UW, U320, U320). Levert niks op.

Controller: daarvan zijn er 2 op het bord, beiden hebben dezelfde problemen. Een losse Adaptec AHA2940UW PCI controller leverde ook niks op. Ik heb ook nog een reserve-mobo liggen met dezelfde onboard controllers en dat was ook niet de oplossing. Of het moet liggen aan de combo Adaptec / SCA backplane, al lijkt me dat sterk, aangezien dit de standaardcombo is waarmee de server wordt geleverd.

Harddisks: het lijkt me niet aan de harddisks te liggen, want het zou wel erg toevallig zijn dat alle de 10 harddisks brak zijn, aangezien ze allemaal exact dezelfde probleem vertoonden. Ik heb helaas geen SCA converters voorhanden om een schijf direct op de controller te testen. Ook heb ik helaas geen ander merk/type SCA disken voorhanden om ermee te testen. Al lijkt het me niet direct aan de schijven te liggen, zeker omdat ze alle 10 dezelfde kuren vertoonden icm de backplanes. IBM's diagnosetooltjes en de Acaptec BIOS melden dat de schijven gezond zijn.

OS: in Windows XP en Windows 2003 Server (en met PartitionMagic binnen W2KS! ) werd het formatteren wel voltooid, echter de Event ID foutmeldingen bleven niet weg. Daarnaast is XP geen optie als OS, daar deze maximaal 1 fysieke CPU ondersteunt. Datzelfde geldt ook voor 2K3S, ook al ondersteunt deze minimaal 4 CPU's: Q319091. Windows NT 4.0 vertoonde dezelfde problemen als 2KS.

Drivers: deze zijn reeds in het OS embedded en nergens op de Adaptec website kan ik andere versies downloaden. Laat staan de huidige drivers. Zal vast wel komen omdat deze MS-approved zijn en in het OS zijn embedded. Er zijn wel WinNT 3.5 drivers te vinden, maar deze werken dus niet op nieuwere Windows versies. Ik heb zelfs ook drivers van WinNT en WinXP/2K3 lichtjes aangepast en op 2KS geprobeerd. Leverde niks op.

BIOS versie: de server is voorzien van de laatste BIOS (1.00.10) en op de de IBM supportsite zijn geen oudere versies beschikbaar. De BIOS van de controller is wellicht ook de laatste versie (1.26b3) en nergens kan ik alternatieven vinden.

BIOS instellingen: met alles op defaults werkt het dus niet. In de BIOS van het mobo is er met betrekking tot de SCSI controller enkel de optie om deze in danwel uit te schakelen. De SCSISelect utility in de BIOS van de controller heb ik deze opties (deze hebben dan wel betrekking op de AHA2940UW controller, maar da's niks anders dan de offboard versie van de AIC7880 controller). Ik heb werkelijk elke instelling geprobeerd, zelfs de meest onlogische instellingen, zonder resultaat.

Jumper instellingen: de jumpers op het mobo zijn niet relevant. De backplanes zijn voorzien van 5 jumpertjes. Je kunt de beschrijvingen terugvinden op de PC Server 704 manual (blz 71 en verder). Daarin zit eigenlijk ook niks relevants tussen. Ik heb de alle ID instellingen en de beide backplane instellingen geprobeerd (internal/external en primary/secondary). De flash protection jumper levert (logisch) ook niks op. Tussen de jumperinstellingen van de schijven kan ik ook niks relevants vinden. Je kunt deze hier vinden (blz 8 en verder).

Vorige eigenaar: hij had de backplanes nooit gebruikt, hij gebruikte storage via het netwerk. Van de eigenaar daarvóór weet ik het niet.

GoT Search: Ik heb o.a. de volgende searches uitgevoerd:
[search=formatteren blijft hangen op 100%], oplossingen: jumpers, kabels, drivers, firmware, andere formateerprogseltjes. Al geprobeerd.
[search=scsi event id 11], oplossingen: niks relevants. Wel 1 topic met hetzelfde probleem, echter onopgelost.

Google: er wordt in praktisch alle gevallen naar Q154690 verwezen, die ik dus al had doorgenomen. Verder nog een zut onopgeloste problemen.

Tot slot
Ik zit vast :/ Ik verdenk zelf de SCA backplanes, maar ik kan niks vinden. Mijn laatste hoop is op jullie gevestigd. Mogelijk is er iemand met dezelfde ervaringen met de server of heb ik gewoonweg iets cruciaals over het hoofd gezien of heeft er iemand een geniale inval.


Ik kan natuurlijk de schijven mbv o.a. Partition Magic formatteren en de Event ID foutmeldingen negeren, maar dat is een ranzige oplossing en de performance van de schijven wordt er niet beter van op.

[ Voor 12% gewijzigd door BalusC op 28-03-2005 22:50 ]


  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 09:41

Koffie

Koffiebierbrouwer

Braaimeneer

Wat me nog even niet duidelijk is :
Een andere PCI SCSI controller aan de backplanes levert hetzelfde probleem op ?
Heb je het ook op alle plaatsen (zal wel, 10 schijven namelijk .. al weet ik niet meer hoeveel disks er in gaan) op de backplane ?
Als ik het me goed herinner is de bacplane verdeelt over 2 stukken, welke je elk op 1 van de 2 SCSI controllers aansluit (de backplane vreet dus meteen beide onboard controllers).

Als het dus *en* met een andere controller op de backplane *en* op ALLE mogelijke SCA aansluitingen zo is, dan zal de backplane toch echt gaar zijn ben ik bang.

De vorige eigenaar melde dat het ding niet stabiel te krijgen is, maar ja ... diezelfde dude vertelde ook dat het een AS/400 zou zijn 8)7
Wellicht dat die backplane dus idd nooit jofel is geweest ?

Tijd voor een nieuwe sig..


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Koffie schreef op maandag 28 maart 2005 @ 23:26:
Een andere PCI SCSI controller aan de backplanes levert hetzelfde probleem op ?
Inderdaad, ik had het ook met een Adaptec AHA2940UW PCI controller geprobeerd.
Heb je het ook op alle plaatsen (zal wel, 10 schijven namelijk .. al weet ik niet meer hoeveel disks er in gaan) op de backplane ?
Alle plaatsen zijn idd uitgetest. Ik heb 10 disken en er gaan 12 disken in.
Als ik het me goed herinner is de bacplane verdeelt over 2 stukken, welke je elk op 1 van de 2 SCSI controllers aansluit (de backplane vreet dus meteen beide onboard controllers).
Er zijn idd 2 backplanes, maar ze hoeven niet per-se allebei aangesloten worden. Ook met 1 backplane aangesloten ondervind ik dezelfde problemen.
Als het dus *en* met een andere controller op de backplane *en* op ALLE mogelijke SCA aansluitingen zo is, dan zal de backplane toch echt gaar zijn ben ik bang.
Ben ik ook bang voor .. Ik zal de backplanes tzt nog wel loshalen en opnieuw grondig bekijken.
De vorige eigenaar melde dat het ding niet stabiel te krijgen is
Als er geen schijven op de backplanes zitten, dan is het beest rock stable :) Met de SCA disken aangesloten crasht ie eigenlijk ook nooit, maar die Event ID fouten hé.
, maar ja ... diezelfde dude vertelde ook dat het een AS/400 zou zijn 8)7
8)7

  • Shuriken
  • Registratie: November 1999
  • Laatst online: 12:01

Shuriken

Life is all about priorities

Je zou nog even een SCA naar 68 pins converter kunnen gebruiken om de schijven te testen. Maar zoals je zelf al aangeeft is het zeer onwaarschijnlijk dat er 10 schijven kaduuk zijn.

Ik vond dit nog ergens:
If repeated timeouts are observed (viewed as "Event ID 11" in the Event Viewer), the following recommendation can help correct this:
Set the SCSI ID of the host adapter to the lowest priority ID on the SCSI bus (the order of priority starts from 7-0, then 15-8). This gives other devices a better chance to gain access to the SCSI bus to complete their commands. Please consult the User's Guide for procedures on how to change the ID of the SCSI host adapter.


Als backplane kaduuk is, is het wel zonde. Zal niet makkelijk zijn om daar nog vervanging voor te vinden :'(

I rather have a bottle in front of me, then a frontal lobotomie


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Dat is een tip die ik vanavond zeker zal proberen :)

Verwijderd

de chip die op het backplane zit kan die niet met een jumper worden uitgeschakeld?

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Verwijderd schreef op dinsdag 29 maart 2005 @ 12:12:
de chip die op het backplane zit kan die niet met een jumper worden uitgeschakeld?
Op de backplanes zitten geen andere jumpers dan in de in de TS genoemde handleiding vermeld :)

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Shuriken schreef op dinsdag 29 maart 2005 @ 10:08:
Ik vond dit nog ergens:
If repeated timeouts are observed (viewed as "Event ID 11" in the Event Viewer), the following recommendation can help correct this:
Set the SCSI ID of the host adapter to the lowest priority ID on the SCSI bus (the order of priority starts from 7-0, then 15-8). This gives other devices a better chance to gain access to the SCSI bus to complete their commands. Please consult the User's Guide for procedures on how to change the ID of the SCSI host adapter.
Dat was helaas niet de oplossing. Ik ga te zijner tijd nog eens kijken of Knoppix meer opheldering kan geven.

  • Shuriken
  • Registratie: November 1999
  • Laatst online: 12:01

Shuriken

Life is all about priorities

Zal er nog een firmware update voor de backplane zijn?

I rather have a bottle in front of me, then a frontal lobotomie


  • DJSmiley
  • Registratie: Mei 2000
  • Laatst online: 16:44
Shuriken schreef op dinsdag 29 maart 2005 @ 10:08:
Je zou nog even een SCA naar 68 pins converter kunnen gebruiken om de schijven te testen. Maar zoals je zelf al aangeeft is het zeer onwaarschijnlijk dat er 10 schijven kaduuk zijn.

Ik vond dit nog ergens:
If repeated timeouts are observed (viewed as "Event ID 11" in the Event Viewer), the following recommendation can help correct this:
Set the SCSI ID of the host adapter to the lowest priority ID on the SCSI bus (the order of priority starts from 7-0, then 15-8). This gives other devices a better chance to gain access to the SCSI bus to complete their commands. Please consult the User's Guide for procedures on how to change the ID of the SCSI host adapter.


Als backplane kaduuk is, is het wel zonde. Zal niet makkelijk zijn om daar nog vervanging voor te vinden :'(
idd, dat zat ik me ook te bedenken. Wat doet een SCSI disk ZONDER de backplane? Dan kun je iig t moederbord/scsi krt/drive uitsluiten.

mocht je geen sca-68p convertors hebben liggen, als ik ff zoek heb ik er eventueel nog wel een tje liggen voor je, ligt hier toch weg te rotten. Is alleen dan 68/50pins, dus geen LVD/U160 ding, maar icm jouw scsi krt maakt dat niet uit.

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Ik kreeg van een verre IBM-collega die in storage zit het volgende linkje doorgespeeld: http://www-1.ibm.com/supp...psg1MIGR-4GSU4F&loc=en_US Op de CD die je daar kunt downloaden staan een hoop firmware updates voor verschillende HDD's. De daarop beschikbare firmware voor mijn disken zou de oplossing moeten zijn voor dit probleem.

* BalusC gaat het vanavond eens proberen.

  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 09:41

Koffie

Koffiebierbrouwer

Braaimeneer

Klinkt plausibel en interessant ;)

Tijd voor een nieuwe sig..


  • Shuriken
  • Registratie: November 1999
  • Laatst online: 12:01

Shuriken

Life is all about priorities

En??

I rather have a bottle in front of me, then a frontal lobotomie


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Helaas, het lukte niet. De disken werden herkend als "non-warranty" disks. Het tooltje zegt dat de firmware updates niet daarop toepasbaar zijn. Echter ik ben er wel achter gekomen dat alle 10 de disken zijn voorzien van firmware versie 03A0, terwijl die op de CD versie 04F0 is. Nieuwer dus.

Nu alleen nog uitvinden hoe ik de "non-warranty" status kan veranderen. Wellicht kan die IBM storage collega me hierover meer vertellen :)

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Ik heb van hem de versie 1.11 gekregen (huidige = 1.16). Deze zou geen warranty check hebben. Vanavond maar weer eens kijken :)

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Deze lukte ook niet. Ik kreeg dan wel geen "non-warranty" melding meer, de schijven kregen de status "OK". Echter de update-programma meldt dat alleen de schijven met de status "update" een nieuwe firmware zouden krijgen. Dat was dus niet het geval :/ Ook al staat in de readme van de firmware dat het versie 04F0 is en werden de schijven getoond als versie 03A0.

Ik wacht wel even de reactie van die collega af :)

  • Bierkameel
  • Registratie: December 2000
  • Niet online

Bierkameel

I use Debian btw

Mooi spul he IBM ;)

Alle proemn in n drek


  • richard_kraal
  • Registratie: September 2001
  • Laatst online: 24-03-2025
ongeveer een halfjaar geleden ook zo'n geintje gehad met SCA backplane van een HP Netserver LC 2000, deze vernielde een raid set welke vervolgens ook nog eens niet opnieuw opgebouwd kon worden

advies, koop voor de gein eens een SCA naar scsi convertor, kost je 20euro ongeveer, dan weet je wel alles! je kan dan gewoon een test doen op de raid controller/scsi controller

mochten de backplanes kapot zijn, dan zou een storage cabinet van compaq een aardige zijn, de oudere zijn voor een prikkie te koop en werken (meestal ;)) goed

Verwijderd

zon compaq ding heb hier nog wel staan :)

  • Shuriken
  • Registratie: November 1999
  • Laatst online: 12:01

Shuriken

Life is all about priorities

Bella schreef op donderdag 31 maart 2005 @ 20:14:
Deze lukte ook niet. Ik kreeg dan wel geen "non-warranty" melding meer, de schijven kregen de status "OK". Echter de update-programma meldt dat alleen de schijven met de status "update" een nieuwe firmware zouden krijgen. Dat was dus niet het geval :/ Ook al staat in de readme van de firmware dat het versie 04F0 is en werden de schijven getoond als versie 03A0.

Ik wacht wel even de reactie van die collega af :)
Vaag, maar misschien is een update niet nodig.

offtopic:
Leuke Nick heb je nu. 1 april grap?

I rather have a bottle in front of me, then a frontal lobotomie


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Tijdens een zoektochtje door de binaries op de firmware CD en diskettes kwam ik erachter dat de DGHS-04Y (PN 59H7011) er niet in staat gedefinieerd als schijftype dat ge-update kan worden. Alleen de DGHS-18U, DGHS-18Y en DGHS-09Y kwamen erin voor :/

Nu kan ik wel mbv een hexeditor de updateprogramma de DGHS-04Y laten herkennen en dan de firmware van DGHS-09Y te laten gebruiken of misschien zelfs die van DCHS-04Y. Maar ik denk niet dat dit gezond is voor de schijf.

  • Shuriken
  • Registratie: November 1999
  • Laatst online: 12:01

Shuriken

Life is all about priorities

Ik heb eventueel hier nog 2 x IBM DDRS-34560 SCA liggen. Kan je in elk geval even kijken of het daarmee lekkerder draait.

Die schijven gaat ik toch nooit meer gebruiken.

I rather have a bottle in front of me, then a frontal lobotomie


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Het probleem is opgelost met behulp van een Adaptec driver dat je op IBM's FTP site kunt vinden :)
ftp://ftp.software.ibm.co...r/Windows/adaptec_lun.zip

Deze driver was in de eerste instantie bedoeld voor performanceproblemen met LTO drives in IBM servers. Maar dat was in mijn specifieke geval kennelijk ook de oplossing :) De Event ID foutmeldingen kwamen nooit terug en het formatteren wordt keer op keer succesvol afgerond. Kopieeracties naar de schijven gaan ook veel soepeler.

G., nogmaals bedankt voor je hulp en het vinden van die driver :)

[ Voor 5% gewijzigd door BalusC op 04-04-2005 10:44 ]


  • Shuriken
  • Registratie: November 1999
  • Laatst online: 12:01

Shuriken

Life is all about priorities

Beter! :)

I rather have a bottle in front of me, then a frontal lobotomie

Pagina: 1