Ik heb een VPS bij Strato, vrij simpel ding:
. Mijn kennis ontbreekt hier. Ik heb al eens gekeken naar de output van systemctl status systemd-networkd, en daar zie ik dan wel wat rare foutmeldingen. Echter wat nu precies de oorzaak is: geen idee. Zie ook bijgevoegde screenshots. Het lijkt iets met de network stack te zijn. Een simpele reboot lost alles op.
Mijn vraag aan jullie
Hoe kan ik zoiets nu debuggen? Stel de VM is weer in deze broken state, welke commando's kan ik dan uitvoeren om een beter beeld te krijgen bij de oorzaak van dit?
Screenshots van de "broken state"
/f/image/1kDRKAqJEFxkK3I6dTYu5FTC.png?f=fotoalbum_large)
/f/image/LgQuPXfEdWeg5bFoY3pWQG3n.png?f=fotoalbum_large)
- 2 CPU vCores
- 4 GB RAM gegarandeerd
- 100 GB NVMe SSD
- Provisionning met ansible
- Er staat niet veel op, beetje dotfiles config, docker installatie, etc.
- Tailscale om het bakkie te benaderen via SSH
- Er draaien een aantal services via een grote docker-compose file.
- Poortje 80+443 staan open en worden geserveerd door Caddy (reverse proxy, draait ook in container)
- Deze reverse proxy zorgt ervoor dat het spul in de containers wordt ge-exposed naar de buitenwereld
- Op moment één werkt alles goed
- Dan opeens is het ding op geen enkele manier meer te bereiken. Via poort 80 niet, 443 niet en ook via ssh niet.
- Het enige dat ik dan nog kan doen is via de Strato admin console een "VNC sessie" opzetten en op die manier dus de controle overnemen. Ik kan dan prima inloggen op de machine.
- Ik kan dan dus ook de staat van de VM bekijken, logfiles inzien, etc.
Mijn vraag aan jullie
Hoe kan ik zoiets nu debuggen? Stel de VM is weer in deze broken state, welke commando's kan ik dan uitvoeren om een beter beeld te krijgen bij de oorzaak van dit?
Screenshots van de "broken state"
/f/image/1kDRKAqJEFxkK3I6dTYu5FTC.png?f=fotoalbum_large)
/f/image/LgQuPXfEdWeg5bFoY3pWQG3n.png?f=fotoalbum_large)
/f/image/EzUjiA8h5cJlh6AY6cAA3kyr.png?f=fotoalbum_large)