Voor een situatieschets is het misschien handig om even naar Rendabiliteit vervangen server te kijken (waar input ook welkom is overigens
), maar in het kort:
Ik heb een server met 2x24 cores, 196GB geheugen, 10x10TB aan hardeschijven. Het primaire doel van deze server is docker en PVE, waarbij PVE eigenlijk alleen maar een kleine VM en Home Assistant heeft draaien (dus docker overheerst).
Ik heb sinds een tijdje pi-hole (en om te testen nu even AdGuard Home) draaien, en ik merk nu de laatste paar weken dat mijn DNS echt absurd traag is.
Om dit te debuggen heb ik allerlei dingen geprobeerd, maar uiteindelijk komt het erop neer dat de verbinding naar de container toe heel traag lijkt te zijn. Dat inclusief directe IP+poort verbindingen naar andere containers.
Of het op de heenweg of terugweg is weet ik niet, en ik heb ook echt totaal geen idee hoe ik dat zou kunnen testen. Mijn ping naar de server is zo'n 0,3ms gemiddeld, vanaf iedere container naar het internet en naar mijn interne netwerk gaat prima, andere DNS servers (ook vanuit pi-hole of AGH) zijn snel. Om het nog even ingewikkelder te maken; het is niet constant.
Ik heb steeds ergens tussen een paar minuten en een paar uur perfecte verbindingen, alles laadt snel en geen gedoe met DNS die niet wil resolven oid, en dan ineens is het even enorm traag. DNS blijft dan timeouts geven (en sommige sites willen dus niet laden) en ook mijn Home Assistant heeft ineens allemaal sensoren die unavailable worden omdat ze data van het internet moeten trekken.
Als voorbereiding heb ik alvast in Grafana een dashboard met statistieken van het aantal packets en het aantal MB per container, en ook grafieken van het totaal + de gemiddelden over de afgelopen 6 uur:
Je ziet dat er flink wat verkeer is, maar geen enorme schommelingen die dit gedrag kunnen verklaren. De pieken komen niet overeen met wanneer ik de problemen ervaar.
CPU load e.d. zijn allemaal prima, en als ik de lokale DNS omzeil zijn de problemen op mijn client weg, dus ik kan andere internetapparatuur in huis ook uitsluiten.
Ik heb ook Smokeping draaien, en die laat in de DNS tests naar bijv. Google niks vreemds zien, en ook andere tests zijn prima. Ik zal jullie de screenshots even besparen, maar de hoogste latency intern is heel soms 24ms, inclusief slimme stekkers in de garage (waar slecht bereik is).
Even opgesomd wat ik al kan uitsluiten:
- CPU/geheugen zijn normaal
- AGH/pi-hole zelf , want verse installatie is even langzaam
- Netwerk in huis, want omzeilen lost het probleem op
- Bufferbloat test is prima
- Speedtest is prima
- Ligt niet aan mijn client, want omzeilen lost het probleem op
- Upstream DNS is niet het probleem
Praktisch is mijn vraagstuk dus; hoe ga ik dit in hemelsnaam troubleshooten?
Ik zal op de één of andere manier moeten bevestigen waar het probleem zit door 'iets' te testen op het moment dat het gebeurt, maar het is soms enkele seconden en totaal niet voorspelbaar.
Zijn er tools die ik over het hoofd zie, of een logische verklaring voor dit gedrag?
Ik heb een server met 2x24 cores, 196GB geheugen, 10x10TB aan hardeschijven. Het primaire doel van deze server is docker en PVE, waarbij PVE eigenlijk alleen maar een kleine VM en Home Assistant heeft draaien (dus docker overheerst).
Ik heb sinds een tijdje pi-hole (en om te testen nu even AdGuard Home) draaien, en ik merk nu de laatste paar weken dat mijn DNS echt absurd traag is.
Om dit te debuggen heb ik allerlei dingen geprobeerd, maar uiteindelijk komt het erop neer dat de verbinding naar de container toe heel traag lijkt te zijn. Dat inclusief directe IP+poort verbindingen naar andere containers.
Of het op de heenweg of terugweg is weet ik niet, en ik heb ook echt totaal geen idee hoe ik dat zou kunnen testen. Mijn ping naar de server is zo'n 0,3ms gemiddeld, vanaf iedere container naar het internet en naar mijn interne netwerk gaat prima, andere DNS servers (ook vanuit pi-hole of AGH) zijn snel. Om het nog even ingewikkelder te maken; het is niet constant.
Ik heb steeds ergens tussen een paar minuten en een paar uur perfecte verbindingen, alles laadt snel en geen gedoe met DNS die niet wil resolven oid, en dan ineens is het even enorm traag. DNS blijft dan timeouts geven (en sommige sites willen dus niet laden) en ook mijn Home Assistant heeft ineens allemaal sensoren die unavailable worden omdat ze data van het internet moeten trekken.
Als voorbereiding heb ik alvast in Grafana een dashboard met statistieken van het aantal packets en het aantal MB per container, en ook grafieken van het totaal + de gemiddelden over de afgelopen 6 uur:
![]() | ![]() |
Je ziet dat er flink wat verkeer is, maar geen enorme schommelingen die dit gedrag kunnen verklaren. De pieken komen niet overeen met wanneer ik de problemen ervaar.
CPU load e.d. zijn allemaal prima, en als ik de lokale DNS omzeil zijn de problemen op mijn client weg, dus ik kan andere internetapparatuur in huis ook uitsluiten.
Ik heb ook Smokeping draaien, en die laat in de DNS tests naar bijv. Google niks vreemds zien, en ook andere tests zijn prima. Ik zal jullie de screenshots even besparen, maar de hoogste latency intern is heel soms 24ms, inclusief slimme stekkers in de garage (waar slecht bereik is).
Even opgesomd wat ik al kan uitsluiten:
- CPU/geheugen zijn normaal
- AGH/pi-hole zelf , want verse installatie is even langzaam
- Netwerk in huis, want omzeilen lost het probleem op
- Bufferbloat test is prima
- Speedtest is prima
- Ligt niet aan mijn client, want omzeilen lost het probleem op
- Upstream DNS is niet het probleem
Praktisch is mijn vraagstuk dus; hoe ga ik dit in hemelsnaam troubleshooten?
Ik zal op de één of andere manier moeten bevestigen waar het probleem zit door 'iets' te testen op het moment dat het gebeurt, maar het is soms enkele seconden en totaal niet voorspelbaar.
Zijn er tools die ik over het hoofd zie, of een logische verklaring voor dit gedrag?