Toon posts:

Crash windows 2003 servers

Pagina: 1
Acties:
  • 103 views sinds 30-01-2008

Verwijderd

Topicstarter
Hallo.

Ik heb het volgende probleem:

We hebben hier 4 terminal servers staan die herhaaldelijk crashen op een 0x00000027. Dus niet een server, maar alle 4 op dezelfde foutmelding.

Nu heb ik het idee dat er ergens een file die het geheugen aanstuurd corrupt is.

Met de debugging tools for windows heb ik het volgende eruit weten te halen, maar sta nog steeds voor een raadsel:

-----


Loading Dump File [C:\WINDOWS\MEMORY.DMP]
Kernel Summary Dump File: Only kernel address space is available

Symbol search path is: SRV*c:\websymbols*http://msdl.microsoft.com/download/symbols
Executable search path is: C:\WINDOWS
Windows Server 2003 Kernel Version 3790 (Service Pack 1) MP (4 procs) Free x86 compatible
Product: Server, suite: Enterprise TerminalServer
Built by: 3790.srv03_sp1_rtm.050324-1447
Kernel base = 0x80800000 PsLoadedModuleList = 0x808af988
Debug session time: Thu Apr 5 16:09:46.901 2007 (GMT+2)
System Uptime: 1 days 5:12:44.963
Loading Kernel Symbols
..........................................................................................................
Loading User Symbols
PEB is paged out (Peb.Ldr = 7ffdd00c). Type ".hh dbgerr001" for details
Loading unloaded module list
................................................
ERROR: FindPlugIns 8007007b
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck 27, {baad0080, b6796f1c, b6796c18, f57f6f8a}

*** ERROR: Module load completed but symbols could not be loaded for nlem32nt.sys
*** ERROR: Module load completed but symbols could not be loaded for naiavf5x.sys
Probably caused by : memory_corruption

Followup: memory_corruption
---------

0: kd> .reload
Loading Kernel Symbols
..........................................................................................................
Loading User Symbols
PEB is paged out (Peb.Ldr = 7ffdd00c). Type ".hh dbgerr001" for details
Loading unloaded module list
................................................
0: kd> !analyze -v
ERROR: FindPlugIns 8007007b
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

RDR_FILE_SYSTEM (27)
If you see RxExceptionFilter on the stack then the 2nd and 3rd parameters are the
exception record and context record. Do a .cxr on the 3rd parameter and then kb to
obtain a more informative stack trace.
The high 16 bits of the first parameter is the RDBSS bugcheck code, which is defined
as follows:
RDBSS_BUG_CHECK_CACHESUP = 0xca550000,
RDBSS_BUG_CHECK_CLEANUP = 0xc1ee0000,
RDBSS_BUG_CHECK_CLOSE = 0xc10e0000,
RDBSS_BUG_CHECK_NTEXCEPT = 0xbaad0000,
Arguments:
Arg1: baad0080
Arg2: b6796f1c
Arg3: b6796c18
Arg4: f57f6f8a

Debugging Details:
------------------

*** ERROR: Module load completed but symbols could not be loaded for nlem32nt.sys
*** ERROR: Module load completed but symbols could not be loaded for naiavf5x.sys

EXCEPTION_RECORD: b6796f1c -- (.exr ffffffffb6796f1c)
ExceptionAddress: f57f6f8a (rdbss!__RxAcquireFcb+0x0000020c)
ExceptionCode: c0000005 (Access violation)
ExceptionFlags: 00000000
NumberParameters: 2
Parameter[0]: 00000000
Parameter[1]: 00000088
Attempt to read from address 00000088

CONTEXT: b6796c18 -- (.cxr ffffffffb6796c18)
eax=8a9b1b01 ebx=00000000 ecx=00000000 edx=8a9b1bf0 esi=88c1a008 edi=00000000
eip=f57f6f8a esp=b6796fe4 ebp=b6797014 iopl=0 nv up ei pl zr na pe nc
cs=0008 ss=0010 ds=0023 es=0023 fs=0030 gs=0000 efl=00010246
rdbss!__RxAcquireFcb+0x20c:
f57f6f8a 399988000000 cmp dword ptr [ecx+88h],ebx ds:0023:00000088=????????
Resetting default scope

PROCESS_NAME: explorer.exe

CURRENT_IRQL: 0

ERROR_CODE: (NTSTATUS) 0xc0000005 - De instructie op 0x%08lx verwijst naar geheugen op 0x%08lx. Een lees- of schrijfbewerking op het geheugen is mislukt: The memory could not be %s.

READ_ADDRESS: 00000088

BUGCHECK_STR: 0x27

DEFAULT_BUCKET_ID: CODE_CORRUPTION

LAST_CONTROL_TRANSFER: from f57f92d6 to f57f6f8a

STACK_TEXT:
b6797014 f57f92d6 88871970 88c1a008 00000001 rdbss!__RxAcquireFcb+0x20c
b6797078 f57e9613 88c1a008 890b2008 8866e630 rdbss!RxCommonClose+0x92
b6797108 f57f5338 f57f4028 890b2008 8866e630 rdbss!RxFsdCommonDispatch+0x320
b6797128 f57910d0 8a663c00 890b2008 8a3b6900 rdbss!RxFsdDispatch+0xd3
b6797148 8083f9d0 00000000 010b2008 8ab4c030 mrxsmb!MRxSmbFsdDispatch+0x134
b679715c f732fc53 8ab4c030 890b20e4 8083f9d0 nt!IofCallDriver+0x45
b6797184 8083f9d0 8a3b6900 890b2008 8ab41b38 fltmgr!FltpDispatch+0x6f
b6797198 f74f3342 8a9b1b00 b67971b8 00000002 nt!IofCallDriver+0x45
WARNING: Stack unwind information not available. Following frames may be wrong.
b67971c8 8083f9d0 8a8c38d0 890b2008 890b2108 nlem32nt+0xc342
b67971dc f4d33eae 890b2008 8a155d38 8866e630 nt!IofCallDriver+0x45
b6797208 f4d3a184 890b2008 b6797238 890b2108 naiavf5x+0x1eae
b6797244 f4d34960 8866e630 890b2108 8a8ad1f0 naiavf5x+0x8184
b6797258 8083f9d0 8a474020 890b2008 890b212c naiavf5x+0x2960
b679726c f721d38a 890b2008 8866e630 00000000 nt!IofCallDriver+0x45
b6797284 f7226c1c 896d0328 890b2008 890b2008 Mup!DfsFilePassThrough+0x3d
b67972c8 f7222cc2 888d8968 890b2008 890b2008 Mup!DfsCommonClose+0x6e
b679730c f7222bd7 888718b8 890b2008 890b2008 Mup!DfsFsdClose+0xf6
b6797358 8083f9d0 888718b8 890b2008 890b2018 Mup!MupClose+0x223
b679736c 80937b66 80a79be4 00000000 8866e618 nt!IofCallDriver+0x45
b67973a4 8092ac38 0066e630 8866e618 00000000 nt!IopDeleteFile+0x13a
b67973bc 80840172 8866e630 00000000 00000520 nt!ObpRemoveObjectRoutine+0xde
b67973dc 8092af82 e145d008 88fa7020 8a9b1bf0 nt!ObfDereferenceObject+0x67
b67973f4 8092ae9e e145d008 8866e630 00000520 nt!ObpCloseHandleTableEntry+0x139
b6797438 8092aee9 00000520 00000001 b6797454 nt!ObpCloseHandle+0x82
b6797448 80834d3f 00000520 0198dda8 7c93ed54 nt!NtClose+0x1b
b6797448 7c93ed54 00000520 0198dda8 7c93ed54 nt!KiFastCallEntry+0xfc
0198dda8 00000000 00000000 00000000 00000000 0x7c93ed54


CHKIMG_EXTENSION: !chkimg -lo 50 -d !nt
8084008c-8084008f 4 bytes - nt!KiServiceTable+440
[ d7 7b 97 80:d0 26 10 f5 ]
4 errors : !nt (8084008c-8084008f)

MODULE_NAME: memory_corruption

IMAGE_NAME: memory_corruption

FOLLOWUP_NAME: memory_corruption

DEBUG_FLR_IMAGE_TIMESTAMP: 0

MEMORY_CORRUPTOR: LARGE

STACK_COMMAND: .cxr 0xffffffffb6796c18 ; kb

FAILURE_BUCKET_ID: MEMORY_CORRUPTION_LARGE

BUCKET_ID: MEMORY_CORRUPTION_LARGE

Followup: memory_corruption
---------

Heeft iemand van jullie nog tips, ideeen, of wat helemaal mooi zou wezen de oplossing ;)

Bij voorbaat dank!

Groeten,

Eric

Verwijderd

Tja, heb je nog updates van bepaalde programma's gedraaid sinds je die foutmelding krijgt? Daar zou ik beginnen met zoeken

  • SKiLLa
  • Registratie: Februari 2002
  • Niet online

SKiLLa

Byte or nibble a bit ?

De lib waarin de Access Violation optreedt: http://msdn2.microsoft.com/en-us/library/ms794132.aspx

4 servers tegelijkertijd sluit een RAM of HDD issue wel uit lijkt me, of zijn ze allemaal op dezelfde SAN aangesloten ? Zijn de servers allemaal slechts 1 keer gecrasht of komt het vaker door ? Misschien was het een power-dipje ? Hebben de servers een Internet-oplink; security-patches uptodate ?

'Political Correctness is fascism pretending to be good manners.' - George Carlin


Verwijderd

Topicstarter
@SKilla

Inderdaad, dat was ook mijn gedachte. 4 servers tegelijk moet aan een softwarematige fout liggen.

Deze servers zijn alle 4 op hetzelfde SAN aangesloten. Het probleem komt meerdere keren per week voor op willekeurige servers.

Wat we tot nu toe gedaan hebben is:

* Door de TD de stroomtoevoer laten nameten, (was goed)
* Alle UPS-en na laten kijken (geen problemen mee)
* Koeling in de server ruimte staat op 20 graden (moet geen probleem zijn)
* Alle printerdrivers gedeinstalleerd en een voor een opnieuw geinstalleerd (was het probleem ook niet)

Nu heb ik dus met die debugging tools voor window's dit rapport uitgedraaid, en ik heb sterk het idee dat er een corrupt iets is dat het geheugen fout aanstuurd. Maar wat kan dat zijn. Is er iets dat je de geheugen aansturing kan resetten ofzoiets?

  • dion_b
  • Registratie: September 2000
  • Laatst online: 20:23

dion_b

Moderator Harde Waren

say Baah

PMG Beleid

Het is hier Processors, Moederborden en Geheugen. Hoe verwacht je dat wij iets zinnigs melden als je niets over die onderdelen vertelt :?

Als je een softwareprobleem vermoedt, ga in de softwaresubfora kijken :o

Maar waar dan ook op GoT verwachten we meer eigen inzet (en liefst minder overloze uitdraai), incl melding van wat je zelf gezocht hebt en zelf geprobeerd hebt.

Oslik blyat! Oslik!


Dit topic is gesloten.