Wilde dit probleem en oplossing delen met jullie, ik heb er 3 weken mee gestoeid met de heren synology en vandaag de oplossing gevonden. (met de software ontwikkelaars van Synology...)
Setup: 2 esx hosts (hp 530sfp+) > 10gbit > Synology rs3614xs 10gbit. (Synology E10G15-F1 10Gbps SFP+ Ethernet Adapter
Elke esx host heeft een eigen 10gbit kaart naar de Synology.
VMware > Synology via NFS partities.
Software Synology: DSM 6.0.1-7393 Update 2
Probleem:
Bij hoge random IO over 10gbit, dus bijv. veel VM's te gelijk starten, of storage migrations naar andere volumes zolang je het maar over 10gbit doet, klapt de 10gbit NIC eruit van je synology. vanaf je VMware esx host geen PING meer naar je synology (op je 10gbit kaart).
Gevolg al je NFS partities in VMware verbroken, en al je running vm's liggen er dan ook uit.
Analyze developers Synology: De 10gbit NIC op de Synology loopt uit zijn Paged memory buffers (op de kaart zelf) gevolg is dat de NIC stopt met werken en je de Synology moet rebooten om je NFS partities weer terug te krijgen.
Oplossing:
- Login met ssh op je synology met je admin account.
- Tik in: sudo -i (om jezelf root level access te geven)
- Tik in: vi /etc.defaults/modules.conf
Ga naar een verse regel:
- Tik in: R
- Plak deze regel erin: module_tn40xx_args_bromolow="paged_buffers=0"
- Tik in: :wq
- Schrijf je config weg met :wq (dubbele punt meenemen)
(mislukt het (voor de niet VI kenners); tik in dubbele punt q uitroepteken. :q!
Reboot je synology (tik in: reboot)
log nog een keer met ssh, zie boven, tik in: cat /sys/module/tn40xx/parameters/paged_buffers
t getal 0 moet naar voren komen dan zit je goed.
T was zo n hardnekkige hufter dat 9 van de 10 mensen dit probleem nooit zullen hebben (laat staan 10gbit gebruiken) maar t is zo k*t als je elke keer je partities kwijt bent en je vm's down gaan dat ik het toch wilde delen voor die ene die hier misschien wel tegen aan loopt.
---------------------------
Engelse versie: (voor google ;-))
Synology E10G15-F1
HP 530sfp+
Software version: DSM 6.0.1-7393 Update 2
Problem:
High random io you loose NFS partitions (NFS share) on VMware environment. (like storage migrations, booting VM's) no ping between esx host and 10gbit Synology NIC possible. after reboot Synology everything is online again.
Analyze Synology: Buffer overflow on 10Gbit NIC will cause a crash on the NIC it self.
Solution:
- SSH to your Synology
- sudo -i
- vi /etc.defaults/modules.conf
- add following rule: module_tn40xx_args_bromolow="paged_buffers=0"
safe it, and reboot.
login ssh after reboot, check with command: cat /sys/module/tn40xx/parameters/paged_buffers
it need to return: 0
thats it....NFS over 10gbit should be stable again!
edit; message from synology: For your information, the option will be overwritten if upgrade to 6.0.2. which will releaser in the near future. (dus de entry moet je na de upgrade er weer inzetten. zodra er een definitieve oplossing is meld ik t.
5-2-2017 edit:
DSM 6.0.2-8451 Update 9
Synology still continues to add the rule (module_tn40xx_args_bromolow="paged_buffers=0") with the disabled cache setting. i think it will stay this way. it is stable.
8-11-2016 edit;
Problem is still not solved in version: 6.0.2-8451 update 2.
Synology wrote:
- Fixed an issue where Synology E10G15-F1 NIC may disconnect under certain circumstances.
- Fixed an issue where Full File Clone via VMware VAAI could cause NFS protocol to act abnormally under certain circumstances.
I updated to 6.0.2-8451 update 2 and the problem still stays active:
Eventvwr in Windows will show: The IO operation at logical block address 0x192cc32 for Disk 0 (PDO name: \Device\00000028) was retried. <-wat dit betekend staat hier.
I opened up a new ticket at Synology.
14-11-2016:
Reactie van synology. Het is dus nog niet opgelost na het analyseren van de opgestuurde debuglogs.
Dear Leon,
Thank you for your message.
Please kindly help us keep using the workaround.
Or engineers will improve the driver again in the future version as far as we could.
Thank you for your understanding.
Regards,
Eilon Chien
Setup: 2 esx hosts (hp 530sfp+) > 10gbit > Synology rs3614xs 10gbit. (Synology E10G15-F1 10Gbps SFP+ Ethernet Adapter
Elke esx host heeft een eigen 10gbit kaart naar de Synology.
VMware > Synology via NFS partities.
Software Synology: DSM 6.0.1-7393 Update 2
Probleem:
Bij hoge random IO over 10gbit, dus bijv. veel VM's te gelijk starten, of storage migrations naar andere volumes zolang je het maar over 10gbit doet, klapt de 10gbit NIC eruit van je synology. vanaf je VMware esx host geen PING meer naar je synology (op je 10gbit kaart).
Gevolg al je NFS partities in VMware verbroken, en al je running vm's liggen er dan ook uit.
Analyze developers Synology: De 10gbit NIC op de Synology loopt uit zijn Paged memory buffers (op de kaart zelf) gevolg is dat de NIC stopt met werken en je de Synology moet rebooten om je NFS partities weer terug te krijgen.
Oplossing:
- Login met ssh op je synology met je admin account.
- Tik in: sudo -i (om jezelf root level access te geven)
- Tik in: vi /etc.defaults/modules.conf
Ga naar een verse regel:
- Tik in: R
- Plak deze regel erin: module_tn40xx_args_bromolow="paged_buffers=0"
- Tik in: :wq
- Schrijf je config weg met :wq (dubbele punt meenemen)
(mislukt het (voor de niet VI kenners); tik in dubbele punt q uitroepteken. :q!
Reboot je synology (tik in: reboot)
log nog een keer met ssh, zie boven, tik in: cat /sys/module/tn40xx/parameters/paged_buffers
t getal 0 moet naar voren komen dan zit je goed.
T was zo n hardnekkige hufter dat 9 van de 10 mensen dit probleem nooit zullen hebben (laat staan 10gbit gebruiken) maar t is zo k*t als je elke keer je partities kwijt bent en je vm's down gaan dat ik het toch wilde delen voor die ene die hier misschien wel tegen aan loopt.
---------------------------
Engelse versie: (voor google ;-))
Synology E10G15-F1
HP 530sfp+
Software version: DSM 6.0.1-7393 Update 2
Problem:
High random io you loose NFS partitions (NFS share) on VMware environment. (like storage migrations, booting VM's) no ping between esx host and 10gbit Synology NIC possible. after reboot Synology everything is online again.
Analyze Synology: Buffer overflow on 10Gbit NIC will cause a crash on the NIC it self.
Solution:
- SSH to your Synology
- sudo -i
- vi /etc.defaults/modules.conf
- add following rule: module_tn40xx_args_bromolow="paged_buffers=0"
safe it, and reboot.
login ssh after reboot, check with command: cat /sys/module/tn40xx/parameters/paged_buffers
it need to return: 0
thats it....NFS over 10gbit should be stable again!
edit; message from synology: For your information, the option will be overwritten if upgrade to 6.0.2. which will releaser in the near future. (dus de entry moet je na de upgrade er weer inzetten. zodra er een definitieve oplossing is meld ik t.
5-2-2017 edit:
DSM 6.0.2-8451 Update 9
Synology still continues to add the rule (module_tn40xx_args_bromolow="paged_buffers=0") with the disabled cache setting. i think it will stay this way. it is stable.
8-11-2016 edit;
Problem is still not solved in version: 6.0.2-8451 update 2.
Synology wrote:
- Fixed an issue where Synology E10G15-F1 NIC may disconnect under certain circumstances.
- Fixed an issue where Full File Clone via VMware VAAI could cause NFS protocol to act abnormally under certain circumstances.
I updated to 6.0.2-8451 update 2 and the problem still stays active:
Eventvwr in Windows will show: The IO operation at logical block address 0x192cc32 for Disk 0 (PDO name: \Device\00000028) was retried. <-wat dit betekend staat hier.
I opened up a new ticket at Synology.
14-11-2016:
Reactie van synology. Het is dus nog niet opgelost na het analyseren van de opgestuurde debuglogs.
Dear Leon,
Thank you for your message.
Please kindly help us keep using the workaround.
Or engineers will improve the driver again in the future version as far as we could.
Thank you for your understanding.
Regards,
Eilon Chien
[ Voor 20% gewijzigd door itlee op 05-02-2017 18:08 . Reden: informatie toegevoegd. issue is nog niet opgelost. ]