Toon posts:

[Novell 5] Multiple abends na update SP6

Pagina: 1
Acties:

Verwijderd

Topicstarter
- Dell PowerEdge 2550 met PERC-SCSI-RAID
- Netware 5, SP6a

Fout: de machine start goed op, loopt een tijdje stabiel en zonder problemen (5 minuten) en gaat dan door z'n knieen (multiple abends have occured processor halted)

Wat ik tot nu toe gedaan heb:
- Alle laatste drivers mbt. SCSI gedownload en geinstalleerd
- Alle laatste drivers mbt. netwerk geinstalleerd
- post sp6-NDS update van novell geinstalleerd
- server.exe patch voor PIII issues geinstalleerd

netwerkkaarten:
- Broadcom Gigabit (wordt niet gebruikt en wordt niets voor geladen
- Intel Pro 100Mbit (laatste drivers geinstalleerd)
- Madge Smart PCI Token Ring (16Mbit) (laatste drivers geinstalleerd)

Tijdens het opstarten geeft de machine geen foutmeldingen.

Ik heb maximum recieve packets op 4224 gezet en minimum op 2048.

Ik heb het idee dat er ergens een buffer/stack vol loopt oid, temeer daar hij pas naar een paar minuten crashed.

Iemand enig idee? Ik zit hier erg mee omhoog.

(rollback SP is geen optie aangezien deze SP nodig is ivm. bep software welke gedraaid zal gaan worden)

Verwijderd

Topicstarter
inmiddels de laatste nici update geinstalleerd, evenals de laatste winsock. Beide mochten niet baten.

Het lastige is dat de server niet gelijk crashed en ook niet op gezette tijden of bij een bepaalde actie. Opeens stopt hij er mee.

Ik heb sterk het vermoeden dat er ergens een buffertje oid vol loopt maar weet niet waar ik het moet zoeken.

Bijkomende fout is dat zodra ik de ndps manager laad en deze alle lexgate.nlm's laadt (printer agents) ik continu de melding krijg dat hij 'unable to establish a TCP connection to Printer Agent' oid loopt te balken. Daarnaast beginnen alle printers documenten uit te printen welke vorige week al geprint zijn.

Van die lexgate.nlm ook al de laatste versie opgehaald, wederom geen effect :(

de foutmelding is
'multiple abends have occured, processor halted'

Verwijderd

Topicstarter
Ik heb het probleem inmiddels kunnen isoleren 'tot' de token-ring adapter danwel de daarmee gemoeide instellingen.

Als ik nl. de token-ring adapter er helemaal uithaal loopt de machine gewoon stabiel. Probleem is echter dat die adapter er gewoon in MOET.

Ik heb al geprobeerd een andere adapter te gebruiken, helaas had dit niet het gewenste effect, precies dezelfde problemen.

Heeft dan NIEMAND een idee?

Kloterige is dat er geen abend.log is...

  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
in autoexec zetten: load conlog max.. save =sys:etc\console.log
hiermee heb je na een abend altijd een console log.

Dit kwam ik tegen op support.....
Server Abend in Module route.nlm  (Last modified: 03JUN1997)
This document (2925783) is provided subject to the disclaimer at the end of this document.
Printer friendly version of this document
Forward this document to a colleague
Submit comment about this document to its author

Symptom
Server abends while execute module route.nlm
Cause
A token ring card installed in the secondary bus.
Solutions
The CompaQ told to the customer that there are possibilities of abends in the Proliant 5000 servers when others type of cards are installed in the secondary bus of the servers.
The cards in question are the card that have on board the Texas TI380PCI Processor, like Madge, 3Com card or Olicom.
The customer had a Madge SmartRing 16/4 installed in the secondary bus.
After the customer moved that card in the primary bus the problem went away.

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


  • Onno
  • Registratie: Juni 1999
  • Niet online
Op vrijdag 19 oktober 2001 21:36 schreef hezik het volgende:
Kloterige is dat er geen abend.log is...
Is dit toevallig een dual cpu server? In dan geval moet je mps14 tijdelijk even uit je startup.ncf halen, want zolang multiprocessor-support aanstaat worden er geen abend.log entries geschreven. (erg onhandig)
in autoexec zetten: load conlog max.. save =sys:etc\console.log
hiermee heb je na een abend altijd een console log.
Aan een consolelog heb je vrijwel nooit iets.

Critical error has blabla, returned to safe state blabla.. maar in welke module iets foutgegaan is krijg je niet te zien.

  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
aan console log heb je vaak wel iets, maar aan abend log wel veel meer natuurlijk.
Op basis van conlog kan je vaak in novell's knowledgebase wat achterhalen.

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


Verwijderd

Topicstarter
die conlog werd al geladen echter heb ik daar geen biet aan helaas. De server draait gewoon zonder foutmeldingen en ineens is daar die 'multiple abends occured' melding.

Het is dus ook niet zo dat dit gebeurd tijdens het laden van route.nlm, aangezien hij rustig al een kwartier up kan zijn als hij ineens crashed.

Het is een single-CPU machine alhoewel hij wel dual-CPU zou kunnen.

Het verplaatsen van slot van die Token-Ring kaart had ik idd ook al geprobeerd onder het motto baat het niet dan schaadt het ook niet. Helaas.

In de door conlog gemaakte log staat een normale boot, meer niet.

Verwijderd

Er is niet heel veel info, maar misschien leid dit tot iets... Ik denk dat MPS14.PSM default geladen wordt omdat Netware de 2550 als dual herkent, in het verleden zijn er diverse issue's geweest op dual systemen die 'maar' 1 proc hebben. Probeer deze eens via nwconfig->multi cpu options of je startup.ncf te verwijderen.

Verder kun je proberen via monitor eea te volgen, threads die kuren vertonen vallen hier vaak op...

Verwijderd

Topicstarter
ok, zal dat eens controleren alhoewel ik wel moet aantekenen dat hij zonder die token-ring kaart prima werkt..

morgen weer een dag dat ik bij die machine kan/ben dus dan ga ik 't gelijk bekijken.

Wat betreft die monitor, ik heb er de hele dag in rond zitten bladeren maar kan niet echt iets vreemds ontdekken. Geen memory leaks oid, voorzover ik kan zien.

Mocht je tips hebben omtrend waar ik precies moet kijken dan houdt ik me aanbevolen...

Verwijderd

Topicstarter
iemand nog belang bij een config.txt oid?

  • Roelant
  • Registratie: Januari 2001
  • Niet online
[forum=19] >> [forum=24]

  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 22:19

Koffie

Koffiebierbrouwer

Braaimeneer

hmmz ... ik wilde net vragen wat voor NIC, maar 't is een Madge zie ik.

2 kleine dingen die waarschijnlijkgeen oplossing bieden:

- Probeer eens een ander madge kaart
- Indien je nog ISA het , douw eens een Mdge ISA kaartje erin (heb ik misschien nog wel voor je liggen).

Welke niewe drivers heb je voor de NIC die van Novell of die van Madge ?

Tijd voor een nieuwe sig..


Verwijderd

Topicstarter
't is een is madge netwerkkaart en ik heb 't met zowel drivers van madge als van novell geprobeerd, beide zelfde effect.

Inmiddels heb ik die hele kaart uit de novell machine gehaald en er een linux routertje tussen gezet welke het verkeer van token-ring routeerd naar het ethernet (iets wat Netware ook al niet kon) en nu werkt alles weer.

route.nlm en bridge.nlm zuigen big time, da's mijn conclusie.

Het antwoord van novell (kostte me 200 piek om dat te horen) 'ja er zijn issues met een gemengde token-ring/ethernet omgeving'.

  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 22:19

Koffie

Koffiebierbrouwer

Braaimeneer

:? :? :?

Misschien niet helemaal routeren in de zin die jij bedoelt, maar in mijn NW servertje hangt een TRN en een Eth. kaart.

De ethernet is voor internet, en TRNvoor m'n lokale netwerk.
En dat erkt prima hoor.

Tijd voor een nieuwe sig..


Verwijderd

Topicstarter
Welke belastingen praat je dan over? Er zitten hier 40 clients op token-ring en die maken allemaal gebruik van services welke op het ethernet segment zitten. Na een normale werkdag (beginnend om 7uur 's ochtends en de laatste vertrekt rond 7 uur 's avonds) heeft de token-ring adapter er volgens linux zo'n 30Gb doorgepompt, oftewel gemiddeld zo'n 700Kb per seconde.

  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 22:19

Koffie

Koffiebierbrouwer

Braaimeneer

Ik zit hier uiteraard in m'n uppie.
Maar op m'n werk heb ik een NT4 staan, met dezelfde indeling (TRN is voor de WAN, en de eth. voor een lokaal subringetje).

Gezien het feit dat 4 man een dataopslag van 40 Gb hebben daar ... (grafische ontwikkelaars).

Maarja, da's NT en geen NW.
Ik hoor het overigens voor 't eerst.

Tijd voor een nieuwe sig..


Verwijderd

Topicstarter
Tsja ik vind het zelf ook nog steeds dubieus.. volgens mij moet het gewoon kunnen. Het zou kunnen dat ze in SP6 iets vernaggeld hebben tav. de MTU instellingen ofzo, of dat ze toch de volle 512K ram van die Token-Ring adapter gebruiken oid.

Hoe dan ook, voor SP6 deed hij het prima, erna niet meer. Volgens Novell kan dat voorkomen.

  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
TID 10013292
The maximum Physical Receive Packet Size: 1524 bytes for Ethernet segments, 4540 bytes for Token-Ring.

Stond die wel goed?

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


Verwijderd

Topicstarter
hmm, m'n reply lijkt weggevallen (of is ergens in een verkeerde thread terecht gekomen? :) )

Maar goed, 4k is idd. de standaard voor 4Mbit token ring. 16Mbit gebruikt 16K (max 18K, windows default 17954, zie ms kb).

Ik heb 1500, 3000, 8000 en 16000 geprobeerd, alle met hetzelfde effect.
Pagina: 1