Hallo,
Ik zit al 3 weken met het volgende probleem:
We hebben een VMWare ESX omgeving (9 hosts) met daarop ongeveer 80 servers. Het merendeel daarvan draait Server 2008 R2 (ongeveer 60).
Sinds 3 weken komt er op 3 van deze virtuele servers de volgende melding in de System Log:
(Ik heb de namen van het domein en de servernamen geanonimiseerd)
Op de TEST applicatieserver heb ik uitgebreider onderzoek kunnen doen. Opvallende zaken:
1. Op het moment dat het probleem zich voordoet, kan ik met NSLookup alle records uit de DNS opvragen. Ook de service records van de DC's (2 stuks)
2. Op het moment dat het probleem zich voordoet, kan ik op de betreffende server met NLtest de volgende informatie opvragen:
Wat heb ik allemaal geprobeert: (alle acties op de TEST Oracle server)
- Move naar andere ESX host
- E1000 netwerkkaart toegekend ipv VMXNET3
- Alle TCP Offload settings in de netwerkkaart op DISABLED
- Uninstall van KB3002657 op de domeincontrollers
- NETLOGON debuglogging aangezet (nltest /DBFlag:0x2080FFFF)
Output hiervan:
- ESET Antivirus disabled
- VMWare Tools deinstallatie uitgevoerd en lagere versie geinstalleerd
Na deze laatste actie is de server nog niet weer 'down' geweest, maar dit is ook pas deze ochtend uitgevoerd.
Op diverse fora zie ik hetzelfde probleem voor bij komen, echter zonder oplossing. Iemand die mij wel een oplossing kan geven of die nog een briljante tip heeft?
Ik zit al 3 weken met het volgende probleem:
We hebben een VMWare ESX omgeving (9 hosts) met daarop ongeveer 80 servers. Het merendeel daarvan draait Server 2008 R2 (ongeveer 60).
Sinds 3 weken komt er op 3 van deze virtuele servers de volgende melding in de System Log:
(Ik heb de namen van het domein en de servernamen geanonimiseerd)
EVENT ID: 5719 (NETLOGON)
This computer was not able to set up a secure session with a domain controller in domain DOMEIN due to the following:
The remote procedure call was cancelled.
This may lead to authentication problems. Make sure that this computer is connected to the network. If the problem persists, please contact your domain administrator.
ADDITIONAL INFO
If this computer is a domain controller for the specified domain, it sets up the secure session to the primary domain controller emulator in the specified domain. Otherwise, this computer sets up the secure session to any domain controller in the specified domain.
EVENT ID: 5783 (NETLOGON)
The session setup to the Windows NT or Windows 2000 Domain Controller \\DC2.DOMEIN.local for the domain DOMEIN is not responsive. The current RPC call from Netlogon on \\APPLSRV1 to \\DC2.DOMEIN.local has been cancelled.
Het probleem doet zich niet voor bij het opstarten, maar komt op willekeurige tijdstippen, behalve bij het opstarten. Het gaat om 1 Oracle Weblogic Productieserver, 1 Oracle Weblogic TEST Server en een andere Productie applicatieserver. Wanneer het probleem optreedt, zijn de Oracle Applicaties op de betreffende server niet meer beschikbaar. Om het probleem snel op te lossen, rebooten we de betreffende server zodat de gebruikers weer verder kunnen.EVENT ID: 1006 (GROUPPOLICY)
The processing of Group Policy failed. Windows could not authenticate to the Active Directory service on a domain controller. (LDAP Bind function call failed). Look in the details tab for error code and description.
SupportInfo1 1
SupportInfo2 5288
ProcessingMode 0
ProcessingTimeInMilliseconds 903199
ErrorCode 81
ErrorDescription Server Down
DCName
Op de TEST applicatieserver heb ik uitgebreider onderzoek kunnen doen. Opvallende zaken:
1. Op het moment dat het probleem zich voordoet, kan ik met NSLookup alle records uit de DNS opvragen. Ook de service records van de DC's (2 stuks)
2. Op het moment dat het probleem zich voordoet, kan ik op de betreffende server met NLtest de volgende informatie opvragen:
code:
1
2
3
| nltest /dsgetsite Default-First-Site-Name The command completed successfully |
code:
1
2
3
4
5
6
7
8
9
10
11
| nltest /dsgetdc:DOMEIN DC: \\DC1 Address: \\10.100.102.51 Dom Guid: 0f2228b3-c05e-4f08-be1c-9b9cb4c53b7e Dom Name: DOMEIN Forest Name: DOMEIN.local Dc Site Name: Default-First-Site-Name Our Site Name: Default-First-Site-Name Flags: PDC GC DS LDAP KDC TIMESERV GTIMESERV WRITABLE DNS_FOREST CLOSE_S ITE FULL_SECRET WS The command completed successfully |
code:
1
2
3
4
5
| nltest /sc_query:DOMEIN Flags: 30 HAS_IP HAS_TIMESERV Trusted DC Name \\DC1.DOMEIN.local Trusted DC Connection Status Status = 0 0x0 NERR_Success The command completed successfully |
code:
1
2
| nltest /dclist:DOMEIN Deze geeft een Time-OUT en kan niet worden opgevraagd. De precieze foutmelding kan ik op dit moment niet achterhalen, omdat de servers op dit moment in de lucht zijn. |
Wat heb ik allemaal geprobeert: (alle acties op de TEST Oracle server)
- Move naar andere ESX host
- E1000 netwerkkaart toegekend ipv VMXNET3
- Alle TCP Offload settings in de netwerkkaart op DISABLED
- Uninstall van KB3002657 op de domeincontrollers
- NETLOGON debuglogging aangezet (nltest /DBFlag:0x2080FFFF)
Output hiervan:
code:
1
2
3
4
5
6
7
8
9
10
11
12
| 08/16 07:29:04 [MISC] DsGetDcName function called: Dom:DOMEIN.local Acct:(null) Flags: FORCE DS BACKGROUND RET_DNS 08/16 07:29:04 [MISC] NetpDcInitializeContext: DSGETDC_VALID_FLAGS is c01ffff1 08/16 07:29:04 [MAILSLOT] NetpDcPingListIp: DOMEIN.local: Sent UDP ping to 10.100.102.52 08/16 07:29:04 [MISC] NetpDcGetName: NetpDcGetNameIp returned 0 08/16 07:29:04 [MISC] LoadBalanceDebug (Flags: FORCE DS IP BACKGROUND DNS RET_DNS ): DC=DC2, SrvCount=2, FailedAQueryCount=0, DcsPinged=1, LoopIndex=0 08/16 07:29:04 [MISC] DsGetDcName function returns 0: Dom:DOMEIN.local Acct:(null) Flags: FORCE DS BACKGROUND RET_DNS 08/16 07:29:04 [MISC] DsGetDcName function called: Dom:DC2.DOMEIN.local Acct:(null) Flags: LDAPONLY RET_DNS 08/16 07:29:04 [MISC] NetpDcInitializeContext: DSGETDC_VALID_FLAGS is c01ffff1 08/16 07:29:04 [CRITICAL] NetpDcGetNameIp: DC2.DOMEIN.local: No data returned from DnsQuery. 08/16 07:29:04 [MISC] NetpDcGetName: NetpDcGetNameIp returned 1355 08/16 07:29:04 [CRITICAL] NetpDcGetName: DC2.DOMEIN.local: IP and Netbios are both done. 08/16 07:29:04 [MISC] DsGetDcName function returns 1355: Dom:DC2.DOMEIN.local Acct:(null) Flags: LDAPONLY RET_DNS |
- ESET Antivirus disabled
- VMWare Tools deinstallatie uitgevoerd en lagere versie geinstalleerd
Na deze laatste actie is de server nog niet weer 'down' geweest, maar dit is ook pas deze ochtend uitgevoerd.
Op diverse fora zie ik hetzelfde probleem voor bij komen, echter zonder oplossing. Iemand die mij wel een oplossing kan geven of die nog een briljante tip heeft?