We hebben 3 sites, elke site is verbonden via een 500Kb WAN verbinding. In elke site staat 1 server die DC en DFS server is voor die site. Dit alles werkte goed, het het DFS repliceerde keurig alles gedurrende 2 weken. Op vrijdagmiddag was ik bezig om een nieuwe site toe te voegen die op dezelfde WAN verbinding zit, en in een tijdspanne van maximaal 2 minuten is in 3 van de 4 sites de File replication service beginnen crashen. Na de automatische recovery van de service houd deze het zowat 20 seconden vol alvorens weer te crashen. Dit is het event:
ik heb geen enkele relevante KB gevonden bij MS
over het DFS:
In elke site wordt de DFS root gerepliceerd, de staging folder is in elke site 10 GB groot, niet elke link is in elke site aanwezig. elke site heeft zijn eigen DC (2k3 laatste patchen) deze DC is tevens ook de File server
Ondertussen wel geprobeerd:
In de laatste site alles afgesneden wat met dfs te maken heeft, daarnaa de root en links op die server opnieuw aangemaakt; dit loste voor die site het probleem op, er was nog niet veel data beschikbaar daar dus dat duurde niet zo lang.
In mn andere sites: FRS gestopt en de volumes waar DFS data op staat de system account opnieuw full control gegeven (deze was aanwezig) daarna de FRS weer aangezet. De service houd het nu een half uur vol waarnaa er toch weer een crash volgt. na de eerste crash is de tijd tussen 2 crashes weer veel korter.
probleem is waarschijnlijk dat de system account zijn permissie doorgeeft, maar dat er "ergens" in de replicatiequeue een opdracht zit om een deel van die rechten weg te nemen, iets wat FRS niet goed kan verdragen. Dit vermoedden wordt bevestigd door volgende fout in th NTFRS debug logs:
In het slechtste geval snij ik ook mn andere sites af en doe ook daar een rebuild, maar dan beginnen we over heel veel data te spreken, en met 500K zou dat wel weer een tijdje kunnen duren, Bovendien mag ik er niet aan denken dat dit later nog eens zou gebeuren, waneer we dit systeem definief lanceren (momenteel is het nog in inloopfase). Voor ik hieraan denk zou ik echter liever alle andere mogelijkheden proberen, alleen, wat zijn de mogelijkheden nog?
Maw oorzaak onbekend.Source: service control manager
event ID: 7031
The File Replication Service service terminated unexpectedly. It has done this 1 time(s). The following corrective action will be taken in 300000 milliseconds: Restart the service.
ik heb geen enkele relevante KB gevonden bij MS
over het DFS:
In elke site wordt de DFS root gerepliceerd, de staging folder is in elke site 10 GB groot, niet elke link is in elke site aanwezig. elke site heeft zijn eigen DC (2k3 laatste patchen) deze DC is tevens ook de File server
Ondertussen wel geprobeerd:
In de laatste site alles afgesneden wat met dfs te maken heeft, daarnaa de root en links op die server opnieuw aangemaakt; dit loste voor die site het probleem op, er was nog niet veel data beschikbaar daar dus dat duurde niet zo lang.
In mn andere sites: FRS gestopt en de volumes waar DFS data op staat de system account opnieuw full control gegeven (deze was aanwezig) daarna de FRS weer aangezet. De service houd het nu een half uur vol waarnaa er toch weer een crash volgt. na de eerste crash is de tijd tussen 2 crashes weer veel korter.
probleem is waarschijnlijk dat de system account zijn permissie doorgeeft, maar dat er "ergens" in de replicatiequeue een opdracht zit om een deel van die rechten weg te nemen, iets wat FRS niet goed kan verdragen. Dit vermoedden wordt bevestigd door volgende fout in th NTFRS debug logs:
Die mn debug logs staan vol met dergelijke fouten (oplock dus), ik vermoed dat dit gelijkaardig is aan krijg geen permissie om te schrijven?<FrsOpenSourceFileById: 6120: 3360: S0: 11:42:58> ++ ERROR - NtCreateFile failed : NTStatus: STATUS_OPLOCK_NOT_GRANTED
In het slechtste geval snij ik ook mn andere sites af en doe ook daar een rebuild, maar dan beginnen we over heel veel data te spreken, en met 500K zou dat wel weer een tijdje kunnen duren, Bovendien mag ik er niet aan denken dat dit later nog eens zou gebeuren, waneer we dit systeem definief lanceren (momenteel is het nog in inloopfase). Voor ik hieraan denk zou ik echter liever alle andere mogelijkheden proberen, alleen, wat zijn de mogelijkheden nog?
[ Voor 6% gewijzigd door Yalopa op 10-03-2005 12:04 ]
You don't need eyes to see, you need vision