Hallo,
Sinds enige tijd hebben wij een applicatie die om de enkele weken stopt met werken. Na een herstart is alles terug okee.
Ik ben zelf geen developer maar sysadmin van die server. De applicatie draait op jboss en er is een frontend met apache.
Vandaag is die server weer onderuit gegaan en ik moet het nu is grondig onderzoeken van mijn baas :-).
In de monitoring ( zabbix ) kan ik zien dat de applicatie de laatste 2 maanden 4 keer een plotselinge verhoging heeft van het aantal processen. Meestal zijn er tussen de 130 - 160 processen actief en vlak voor een crash gaat het boven de 300.
Ik heb de server tijdens de crash niet kunnen onderzoeken en ik ga dit ook niet kunnen doen in de toekomst. Applicatie is heel belangrijk en na een herstart werkt alles terug.
Als extra monitoring heb ik nu atop geinstalleerd. Om de 10 minuten wordt er nu een log opgeslagen waar ik kan zien welke processen op dat moment actief waren.
Mijn vraag is of er mensen zijn met nog ideeen om deze server te monitoren. We gebruiken nu zabbix maar qua cpu, mem, netwerk etc.. is er geen enkel probleem.
Ik zoek dus naar nog mogelijkheden om de processen te monitoren. Eens ik zie welke processen erbij komen ga ik moeten onderzoeken "waarom" deze processen erbij komen.
Waarschijnlijk weer vuile code maar dat mag ik nu nog niet zeggen :-).
Groeten,
Jeroen
Sinds enige tijd hebben wij een applicatie die om de enkele weken stopt met werken. Na een herstart is alles terug okee.
Ik ben zelf geen developer maar sysadmin van die server. De applicatie draait op jboss en er is een frontend met apache.
Vandaag is die server weer onderuit gegaan en ik moet het nu is grondig onderzoeken van mijn baas :-).
In de monitoring ( zabbix ) kan ik zien dat de applicatie de laatste 2 maanden 4 keer een plotselinge verhoging heeft van het aantal processen. Meestal zijn er tussen de 130 - 160 processen actief en vlak voor een crash gaat het boven de 300.
Ik heb de server tijdens de crash niet kunnen onderzoeken en ik ga dit ook niet kunnen doen in de toekomst. Applicatie is heel belangrijk en na een herstart werkt alles terug.
Als extra monitoring heb ik nu atop geinstalleerd. Om de 10 minuten wordt er nu een log opgeslagen waar ik kan zien welke processen op dat moment actief waren.
Mijn vraag is of er mensen zijn met nog ideeen om deze server te monitoren. We gebruiken nu zabbix maar qua cpu, mem, netwerk etc.. is er geen enkel probleem.
Ik zoek dus naar nog mogelijkheden om de processen te monitoren. Eens ik zie welke processen erbij komen ga ik moeten onderzoeken "waarom" deze processen erbij komen.
Waarschijnlijk weer vuile code maar dat mag ik nu nog niet zeggen :-).
Groeten,
Jeroen