Windows 7 Offline Files: Path disconnected - Serversoftware en clouddiensten

dinsdag 4 februari 2014 16:19

Acties:

Anti Android

Topicstarter

Op het werk hier zit ik met een probleem waar ik zo langzamerhand een beetje moedeloos van aan het worden ben.

Wij hebben ongeveer een computer of 50. Grofweg de helft van deze computers hebben een redirected Desktop, Mijn documenten map en Roaming AppData. Er wordt hier nooit van werkplek gewisseld dus een volledig roaming profile is niet nodig. Het enige wat belangrijk is, is dat belangrijke data van de werkstations gebackupped wordt en met deze opstelling gaat dat prima

Het probleem waar ik mee zit is dat sommige werkstations geregeld in de offline modus springen. Niet in de slow-link, maar echt in de offline modus. In het logboek is dan event 9 te zien van Offline files. Dat ziet er ongeveer zo uit:

code:

1 2	Path disconnected. \\server\map

Om na een minuutje weer up te komen. Meldingen van gebruikers komen nooit op dezelfde tijden. Het is altijd één user die op dat specifieke moment weer dit probleem heeft. Niet specifiek één persoon, maar na een paar uur is het weer iemand anders, maar het is er altijd één

Op de switches zijn op dat moment geen errors te zien. Geen link die verbroken is, geen errors op de lijnen, niets..

Een oplossing leek even in zocht toen ik bij een aantal gebruikers verbinding liet maken met de FQDN van de server in plaats van de NetBIOS naam. Helaas ging het vandaag toch weer fout. Weer eenzelfde melding in het logboek en een vastlopende Word. De betreffende PC is een HP Pro 3500 MT. Deze is verbonden met een D-Link DGS-1210-24. Hiervoor hing er een switch van Allied Telesys en die gaf hetzelfde probleem, daar ligt het dus niet aan.

Deze DGS-1210-24 is verbonden met een HP ProCurve 1810-48G. Deze heeft weer een 4 poorts trunk met een HP 1910-48G (LACP). Op deze switch zitten onze vSphere hosts aangesloten.

De hosts zijn een tweetal HP DL380 G6 met beiden een Xeon E5640 met beiden 64GB RAM. Op deze hosts draait vSphere 5.5 in een HA cluster. Shared Storage wordt geleverd door een HP P2000 G3 iSCSI. Deze is gevuld met 24 schijven van elk 500 GB groot (6G 7.2K SAS MHL). Dit SAN is weer verdeeld in twee RAID arrays (beiden RAID 50). Disk 1 beslaat 12 schijven, disk 2 10 schijven. De resterende 2 schijven zijn Global Hot Spares

Tussen beide vSphere hosts en het SAN liggen vier UTP kabels verdeeld over twee onboard netwerk adapters en een PCIe adapter (chips zijn van Broadcom en worden ondersteund door VMware). Via Round Robin wordt de load over deze links verdeeld.

Tussen de hosts en de switch is static link aggregation geconfigureerd. Dit is niet ideaal maar met onze Essentials Plus licentie wordt het helaas niet beter

Probleem
Dat Windows 7 clients zo nu en dan aangeven dat de verbinding met sommige paden (shares) is verbroken. Om het nog iets complexer te maken: users hebben de beschikking over 4 netwerkschijven en 3 redirected folders. Als er een disconnect plaats vind dan gaat het meestal niet over al deze paden. Dan liggen er twee of drie uit.

Troubleshooting
- Schijven en mappen geredirect met behulp van de FQDN naam i.p.v. NETBIOS. Dit lijkt te helpen maar nog steeds treden er zo nu en dan disconnects op.
- Packet Loss. PingPlotter geeft na een periode van een paar dagen aan dat er geen enkel pakketje verloren is geraakt of zelfs maar vertraagd is. De hoogste gemeten tijd bedroeg zo'n 3ms. Dat is natuurlijk niks..
- Drukte op de server. De Disk Queue van zowel read/write komt (overdag) zelden boven de 1 uit. Ik meet dit met behulp van Zabbix en die meet - toegegeven - niet real-time. Toch lijkt het mij hoogst onwaarschijnlijk dat er geen enkele piek gemeten zou worden in een periode van enkele weken als hier het probleem zou liggen (tijdens kantooruren).. 's Nachts liggen deze waarden wel een stuk hoger door back-ups, maar dat is niet zo gek.
- In de logbestanden van VMware is weinig bijzonders te vinden. 's Nachts zie ik wel eens een melding voorbij komen dat de performance van het SAN 'drastisch is afgenomen', maar dat komt omdat er nogal wat data wordt gebackupped.
- Slechte bekabeling? Dit moet ik nog volledig uitsluiten door extra tests, maar het lijkt me sterk omdat het probleem zo extreem weinig voorkomt (relatief gezien). Bij slechte bekabeling zou ik veel meer problemen verwachten, en belangrijker, errors in de logs van de switches.
- Fouten in het SAN? Hier is niets van te vinden in de management interface.
- Analatic en debug log van Offline Files bekeken maar dit log produceert geen nuttige informatie.

Wij maken ook gebruik van een ERP pakket van een niet nader te noemen leverancier. Bij sommige users wil dit pakket nog wel eens spontaan vastlopen. Volgens de leverancier komt dit omdat een request naar de server soms 'niet beantwoord' wordt. Dan ga ik aan packet loss denken? Toch kan ik dit op geen enkele manier reproduceren.

De fileserver draait overigens op Server 2008 (x86). Deze heeft twee virtuele schijven; een op array 1 en de ander op array 2. Het lijkt niet zo te zijn dat shares op een van beide array's vaker wegvallen dan de op de andere.

Iemand enig idee wat een eventuele vervolgstap zou kunnen zijn?

Toevoeging:

Wim-Bart schreef op vrijdag 07 februari 2014 @ 00:58:
Een vraag, waarom zet je met vaste werkplekken offline folders aan? Kan je dat niet beter uitzetten. Daarnaast zou ik eens nadenken en goed onderzoek doen naar roaming profiles en redirected folders.

Omdat zonder Offline Files het hele bureaublad in een klap leeg is en ook niet meer terugkomt. Het probleem ligt dus waarschijnlijk niet aan Offline Files. Offline Files stelt ons alleen in staat om te 'recoveren' van deze error na enkele minuten. Een klassiek geval van symptoonbestrijding dus

Ik zie dat ik dit niet in de OP had gezet, waarvoor mijn excuses.

[ Voor 6% gewijzigd door Glashelder op 07-02-2014 10:01 ]

PV 4915wp op oost, 2680 wp op west, 1900 wp op zuid. pvoutput - AUX 8 kW bi bloc

dinsdag 4 februari 2014 16:54

Acties:

T0ny

Wat draai je als antivirus?
Heb wel eens meegemaakt dat deze server communicatie met werkplekken als "gevaarlijk" bestempelt en het werkstation een uurtje in de timeout zet.

dinsdag 4 februari 2014 17:21

Acties:

Glashelder

Anti Android

Topicstarter

Norman Endpoint protection. Die heeft overigens al eens de hele server op zijn bek laten gaan met een BSOD

Wellicht kan ik die inderdaad eens tijdelijk uitschakelen..

Liever niet maar je hebt wel een goed punt om te bekijken.

PV 4915wp op oost, 2680 wp op west, 1900 wp op zuid. pvoutput - AUX 8 kW bi bloc

donderdag 6 februari 2014 20:49

Acties:

alt-92

ye olde farte

Leesvoer:
http://blogs.technet.com/...7-and-dfs-namespaces.aspx

En uiteraard de Enterprise hotfix rollup package voor 2008R2/Win7 en relevante Fileserver hotfixes gebruiken.

ik heb een 864 GB floppydrive! - certified prutser - the social skills of a thermonuclear device

vrijdag 7 februari 2014 00:58

Acties:

Wim-Bart

Zie signature voor een baan.

Een vraag, waarom zet je met vaste werkplekken offline folders aan? Kan je dat niet beter uitzetten. Daarnaast zou ik eens nadenken en goed onderzoek doen naar roaming profiles en redirected folders.

Ik zou alleen de Documents, Music, Videos, Favorites, Links, Saved Games, Pictures, Downloads redirecten. En de rest in Roaming laten, Appdata kan je wel is waar redirecten maar heeft hele negatieve effecten welke tot veel problemen kunnen leiden tot instabiel zijnde applicaties.

Daarnaast is AppData redirected op een Offline beschikbare share een drama waarbij je CSC cache corrupt kan raken, je versie problemen krijgt tussen documenten. Tevens heb je kans op instabiliteit en traagheid en loopt je server vol met zinloze connecties omdat er heel snel heel veel files geopend worden op je share doordat AppData daar op staat.

Beheerders, Consultants, Servicedesk medewerkers. We zoeken het allemaal. Stuur mij een PM voor meer info of kijk hier De mooiste ICT'er van Nederland.

vrijdag 7 februari 2014 10:00

Acties:

Glashelder

Anti Android

Topicstarter

alt-92 schreef op donderdag 06 februari 2014 @ 20:49:
Leesvoer:
http://blogs.technet.com/...7-and-dfs-namespaces.aspx

En uiteraard de Enterprise hotfix rollup package voor 2008R2/Win7 en relevante Fileserver hotfixes gebruiken.

Wij gebruiken geen DFS

Buiten dat is de melding voor het overschakelen op slow-link-mode een ander event dan die wij krijgen. Wij krijgen echt de melding 'Path disconnected'.

Wim-Bart schreef op vrijdag 07 februari 2014 @ 00:58:
Een vraag, waarom zet je met vaste werkplekken offline folders aan? Kan je dat niet beter uitzetten. Daarnaast zou ik eens nadenken en goed onderzoek doen naar roaming profiles en redirected folders.

Omdat zonder Offline Files het hele bureaublad in een klap leeg is en ook niet meer terugkomt. Het probleem ligt dus waarschijnlijk niet aan Offline Files. Offline Files stelt ons alleen in staat om te 'recoveren' van deze error na enkele minuten. Een klassiek geval van symptoonbestrijding dus

Ik zie dat ik dit niet in de OP had gezet, waarvoor mijn excuses.

Ik zou alleen de Documents, Music, Videos, Favorites, Links, Saved Games, Pictures, Downloads redirecten. En de rest in Roaming laten, Appdata kan je wel is waar redirecten maar heeft hele negatieve effecten welke tot veel problemen kunnen leiden tot instabiel zijnde applicaties.

Ik redirect alleen Desktop en Documents. De rest hebben wij niet nodig.

Daarnaast is AppData redirected op een Offline beschikbare share een drama waarbij je CSC cache corrupt kan raken, je versie problemen krijgt tussen documenten. Tevens heb je kans op instabiliteit en traagheid en loopt je server vol met zinloze connecties omdat er heel snel heel veel files geopend worden op je share doordat AppData daar op staat.

Ondanks de vele problemen heb ik nog geen corrupte CSC gezien. De reden dat ik (Roaming) AppData redirect is omdat veel instellingen van de gebruiker hierin terecht komen en je zo toch een 'semi roaming profile' hebt. Dit maakt het uitwisselen van computers makkelijker.

Maar ik ben het met je eens dat dit niet ideaal is. In een test GPO heb ik dit voor enkele gebruikers nu uitgeschakeld. We zullen zien of het uitmaakt

Overigens kreeg ik gisteren te horen dat wij in het pand overal CAT5 hebben liggen i.p.v. de CAT5e waar ik vanuit was gegaan. Een van de switches (de D-Link) is nu direct verbonden met het rack met een CAT6 kabel. De users die op die switch zijn aangesloten melden dat het netwerk nu veel sneller reageert maar helaas was er zojuist wel weer één user met een aantal mappen die weer verbroken waren

Toevallig is dit de enige user in het hele pand die van begin tot eind met CAT6 is verbonden.

Overigens zijn inmiddels ook de switches uitgesloten als mogelijke oorzaak.

We wachten af hoe het zonder redirected appdata gaat

PV 4915wp op oost, 2680 wp op west, 1900 wp op zuid. pvoutput - AUX 8 kW bi bloc

vrijdag 7 februari 2014 10:04

Acties:

StarWing

Huh ?!?

kan dit het probleem zijn ?
Mapped Drive Connection to Network Share May Be Lost

Page intentionally left blank.

vrijdag 7 februari 2014 10:08

Acties:

Glashelder

Anti Android

Topicstarter

Helaas al geprobeerd, die tijd staat bij ons op 3 uur. Bovendien gebeurd het bij shares die echt actief in gebruik zijn.

Je scrolt bijvoorbeeld door een PDF en halverwege krijg je dan alleen lege pagina's te zien. Dat komt dan weer omdat Adobe het bestand niet kan verder kan lezen.

PV 4915wp op oost, 2680 wp op west, 1900 wp op zuid. pvoutput - AUX 8 kW bi bloc

vrijdag 7 februari 2014 11:48

Acties:

StarWing

Huh ?!?

soortgelijk, heeft ook te maken met mapped drives.

I had this exact same issue. The fix for me was to disable Maintenance from running.

I deployed the fix through group policy and it seems to have stopped my mapped drives/icons from removing.
In group policy -
Computer configuration > Policies > Administrative Templates > System > Troubleshooting and Diagnostics > Scheduled Maintenance
Disable "Configure Schedule Maintenance and Behavior"
This fixed the issue for me. Hope it works for you.

Page intentionally left blank.

vrijdag 7 februari 2014 12:45

Acties:

Glashelder

Anti Android

Topicstarter

Dat heeft weer met iets anders te maken. Toevallig hadden wij hier maanden geleden al een keer last van. Het issue waar jij het over hebt komt omdat die Maintenance zo slim is om alle snelkoppelingen van het bureaublad af te gooien op het moment dat er meer dan 5 refereren naar een pad dat niet meer bestaat (welke idioot verzint dat echt?).

Bij ons worden geen bestanden verwijderd, ze zijn alleen (tijdelijk) niet meer zichtbaar.

Buiten dat draait deze fix al bij iedereen

Overigens kan er nog wel steeds een gemeenschappelijke oorzaak zijn, want het blijft vreemd dat Windows denkt dat die snelkoppelingen leiden naar een pad wat als niet bestaand wordt gezien.

Wel bedankt voor het meedenken hoor

[ Voor 3% gewijzigd door Glashelder op 07-02-2014 12:45 ]

PV 4915wp op oost, 2680 wp op west, 1900 wp op zuid. pvoutput - AUX 8 kW bi bloc

vrijdag 7 februari 2014 14:09

Acties:

wagenveld

Zie het hier af en toe bij een klant ook, redirected bureaublad is leeg. Een F5 herstelt dit echter!
Het lijkt er vooralsnog op dat het een netwerk probleem betreft maar ik hou dit topic in de gaten voor andere suggesties.
1 gebruiker waar het vaker mee gebeurd is inmiddels van PC verhuist en het lijkt verminderd/opgelost te zijn. Nog te vroeg om conclusie te trekken.