Toon posts:

Het Grote Monitoring Topic

Acties:

Onderwerpen


  • Sjnirk
  • Registratie: Maart 2001
  • Laatst online: 16-10-2022

Sjnirk

Hie vrieve

Niemand bezig met de elastic stack? icm beats, logstash, kibana/grafana?

AWS biedt het tegenwoordig zelfs managed aan.

Bikkelen gebeurt pas na 2:00


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Yarisken schreef op donderdag 13 december 2018 @ 11:27:
[...]


Bekijk deze video eens en start zabbix in een container.
YouTube: Zabbix 3.0/3.2/3.4/4.0/trunk quick deployment with docker

Dan kan je snel merken of het iets is voor jullie. Aanpassingen worden bewaard als je de container stopt en terug start.

Zabbix is geen plug en play en je gaat er wel wat effort moeten insteken maar zoals hierboven al vermeld ga je er veel kunnen uithalen.
Voor mij was zabbix essentieel om mijn werk te kunnen doen.
Voor virtuele machines gebruikte ik ook nog veeam one als extra.
Ik heb ondertussen heel wat uurtjes verstookt in het draaiende krijgen van de zabbix service. Ik heb alle mogelijke dingen gecheckt. Dbname en WW
Poort
Cache grootte

En nog zegt hij zabbix server not running.
Wat ik hieruit haal is dat je redelijk diepgaande kennis moet hebben om het draaiende te krijgen. Is er geen vergelijkbaar pakket zoals prtf maar dan kosteloos?

Keep it calm...en lek mig de zuk


  • Yarisken
  • Registratie: Augustus 2010
  • Laatst online: 13:21
kromme schreef op woensdag 2 januari 2019 @ 21:38:
[...]


Ik heb ondertussen heel wat uurtjes verstookt in het draaiende krijgen van de zabbix service. Ik heb alle mogelijke dingen gecheckt. Dbname en WW
Poort
Cache grootte

En nog zegt hij zabbix server not running.
Wat ik hieruit haal is dat je redelijk diepgaande kennis moet hebben om het draaiende te krijgen. Is er geen vergelijkbaar pakket zoals prtf maar dan kosteloos?
Download de appliance, alles is dan gedaan voor jou. Juist nog ip aanpassen naar jou netwerk

https://www.zabbix.com/download_appliance

  • Yarisken
  • Registratie: Augustus 2010
  • Laatst online: 13:21
Sjnirk schreef op vrijdag 28 december 2018 @ 10:45:
Niemand bezig met de elastic stack? icm beats, logstash, kibana/grafana?

AWS biedt het tegenwoordig zelfs managed aan.
Ik gebruik graylog , heeft een plugin voor netflow verkeer en zo haal ik de logs van mijn mikrotik binnen.
Graylog is een pak eenvoudiger op te zetten als elk stack vind ik persoonlijk.

  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Yarisken schreef op woensdag 2 januari 2019 @ 22:50:
[...]


Download de appliance, alles is dan gedaan voor jou. Juist nog ip aanpassen naar jou netwerk

https://www.zabbix.com/download_appliance
Dit is een kant en klare vmdk?
Heeft dit geen nadelen?

Keep it calm...en lek mig de zuk


  • Yarisken
  • Registratie: Augustus 2010
  • Laatst online: 13:21
kromme schreef op woensdag 2 januari 2019 @ 22:58:
[...]


Dit is een kant en klare vmdk?
Heeft dit geen nadelen?
Ja in productie moet je die niet gebruiken. Is meer om te spelen / testen.

  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Yarisken schreef op woensdag 2 januari 2019 @ 23:00:
[...]

Ja in productie moet je die niet gebruiken. Is meer om te spelen / testen.
Dan gaat het al voorbij, dit moet prtg gaan vervangen uiteindelijk.

Keep it calm...en lek mig de zuk


  • MrNGm
  • Registratie: Augustus 2004
  • Laatst online: 02-03 20:34
kromme schreef op woensdag 2 januari 2019 @ 21:38:
En nog zegt hij zabbix server not running.
Wat ik hieruit haal is dat je redelijk diepgaande kennis moet hebben om het draaiende te krijgen. Is er geen vergelijkbaar pakket zoals prtf maar dan kosteloos?
Afhankelijk van je Linuxdistributie moet je misschien zelf de service nog starten? Denk systemctl start zabbix-server, of vergelijkbaar. Wat zegt ps aux | grep zabbix, of ss -plantu | grep -E '1005[01]'?

  • Equator
  • Registratie: April 2001
  • Laatst online: 16:07

Equator

Crew Council

#whisky #barista

kromme schreef op woensdag 2 januari 2019 @ 23:04:
[...]


Dan gaat het al voorbij, dit moet prtg gaan vervangen uiteindelijk.
De VMDK die je kan downloaden, kan je mee spelen en rommelen.
Als jij een productieomgeving wilt opzetten, dan moet je dus niet die VMDK gebruiken, maar zelf een eigen server installeren en configureren die voldoende capaciteit heeft voor de grootte van jouw omgeving. Zabbix is echt wel te gebruiken in een productieomgeving. :)

Vragen/opmerkingen
Privacy is something you can sell, but you can't buy back!


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

kromme schreef op woensdag 2 januari 2019 @ 23:04:
[...]
Dan gaat het al voorbij, dit moet prtg gaan vervangen uiteindelijk.
Huh!? Je laat een pakket als Zabbix aan je voorbij gaan, omdat je het lastig vind de service op Linux te starten en de appliance niet bedoeld is om productie te draaien?

Er is een behoorlijk straightforward howto beschikbaar:

Debian/Ubuntu:
https://www.zabbix.com/do...om_packages/debian_ubuntu

RHEL:
https://www.zabbix.com/do...from_packages/rhel_centos

In principe is het weinig meer dan het toevoegen van de Zabbix repo aan je distro en zabbix-server installeren. Na een reboot zou die normaliter automatisch moeten starten, *maar* als MySQL (of andere database) niet draait start 'ie niet. (Of meer, hij start, maar stopt na een paar seconden omdat MySQL niet draait.)

Da's gewoon basis Linux en zul je met praktisch ieder monitoring pakket hebben. Het lástige deel van willekeurig welk monitoring pakket zit 'm vooral in de configuratie van het pakket zelf. Ook daarin in Zabbix niet anders. Monitoring goed opzetten is niet triviaal.

Ná Scaoll. - Don’t Panic.


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Natuurlijk snap ik dat Zabbix te gebruiken is in een productieomgeving. Echter ontbreekt bij mij gewoon linux kennis en is her hier ook niemand op kantoor die dit heeft. Probleem 2 is dat ik er geen mega uren in mag stouwen van mijn baas. Dus als ik tegen een (klein) probleem aan loop kan dat voor mij door ontbreken van kennis een groot probleem zijn waar veel uren in gaan zitten om het werkend te krijgen.

Keep it calm...en lek mig de zuk


  • Oogje
  • Registratie: Oktober 2003
  • Niet online
kromme schreef op donderdag 3 januari 2019 @ 08:18:
Natuurlijk snap ik dat Zabbix te gebruiken is in een productieomgeving. Echter ontbreekt bij mij gewoon linux kennis en is her hier ook niemand op kantoor die dit heeft. Probleem 2 is dat ik er geen mega uren in mag stouwen van mijn baas. Dus als ik tegen een (klein) probleem aan loop kan dat voor mij door ontbreken van kennis een groot probleem zijn waar veel uren in gaan zitten om het werkend te krijgen.
Als het niks mag kosten qua licenties en je mag er niet heel veel uren in stoppen ben je snel klaar. Misschien je baas informeren dat dan het piepsysteem het beste is. Dan wacht je gewoon tot iemand piept dat iets het niet doet :)

Any errors in spelling, tact, or fact are transmission errors.


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Oogje schreef op donderdag 3 januari 2019 @ 08:24:
[...]

Als het niks mag kosten qua licenties en je mag er niet heel veel uren in stoppen ben je snel klaar. Misschien je baas informeren dat dan het piepsysteem het beste is. Dan wacht je gewoon tot iemand piept dat iets het niet doet :)
Dat is iets wat ik zelf dus niet prettig vind. Maakt het allemaal redelijk stressvoller en drukker.
Misschien eens thuis een server opzetten om te kijken of deze wel werkt.

Keep it calm...en lek mig de zuk


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

kromme schreef op donderdag 3 januari 2019 @ 08:18:
Natuurlijk snap ik dat Zabbix te gebruiken is in een productieomgeving. Echter ontbreekt bij mij gewoon linux kennis en is her hier ook niemand op kantoor die dit heeft. Probleem 2 is dat ik er geen mega uren in mag stouwen van mijn baas. Dus als ik tegen een (klein) probleem aan loop kan dat voor mij door ontbreken van kennis een groot probleem zijn waar veel uren in gaan zitten om het werkend te krijgen.
Wat je kunt doen is een partij inhuren die het systeem installeert en configureert, waarna jullie het dagelijks beheer doen. Heb je de Linux kennis niet nodig en de investering is héél snel terugverdiend.

Wij hebben dat ook gedaan, niet vanwege het ontbreken van Linux kennis maar omdat ik er op dat moment domweg de tijd niet voor had. Dus bedrijf ingehuurd en sindsdien hebben we monitoring.

De businesscase is in een dag geschreven en voor een beetje bedrijf is het misschien 5 dagen werk *inclusief* het inregelen van je basis monitoring, toevoegen van je systemen en documentatie/overdracht. Zeg dat het je 5K kost. Da's in een jaar terugverdiend, makkelijk.

Ná Scaoll. - Don’t Panic.


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

unezra schreef op donderdag 3 januari 2019 @ 08:42:
[...]


Wat je kunt doen is een partij inhuren die het systeem installeert en configureert, waarna jullie het dagelijks beheer doen. Heb je de Linux kennis niet nodig en de investering is héél snel terugverdiend.

Wij hebben dat ook gedaan, niet vanwege het ontbreken van Linux kennis maar omdat ik er op dat moment domweg de tijd niet voor had. Dus bedrijf ingehuurd en sindsdien hebben we monitoring.

De businesscase is in een dag geschreven en voor een beetje bedrijf is het misschien 5 dagen werk *inclusief* het inregelen van je basis monitoring, toevoegen van je systemen en documentatie/overdracht. Zeg dat het je 5K kost. Da's in een jaar terugverdiend, makkelijk.
5K krijg ik er nooit doorheen, maar ik zal eens kijken of ik de tijd heb om iets op papier te zetten.
MrNGm schreef op woensdag 2 januari 2019 @ 23:21:
[...]


Afhankelijk van je Linuxdistributie moet je misschien zelf de service nog starten? Denk systemctl start zabbix-server, of vergelijkbaar. Wat zegt ps aux | grep zabbix, of ss -plantu | grep -E '1005[01]'?
root 1764 0.0 0.0 126368 1880 tty1 T Jan02 0:00 vi /etc/zabbix/zabbix_server.conf
root 1899 0.0 0.0 126356 1684 tty1 T Jan02 0:00 vi zabbix.conf
root 1905 0.0 0.0 126292 1800 tty1 T Jan02 0:00 vi zabbix.conf.php
root 3947 0.0 0.0 126368 1880 tty1 T Jan02 0:00 vi /etc/zabbix/zabbix_server.conf
root 3992 0.0 0.0 126296 1852 tty1 T Jan02 0:00 vi zabbix.conf.php
root 17864 0.0 0.0 112704 968 pts/0 S+ 11:28 0:00 grep --color=auto zabbix

[Voor 33% gewijzigd door kromme op 03-01-2019 09:32]

Keep it calm...en lek mig de zuk


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

kromme schreef op donderdag 3 januari 2019 @ 09:27:
[...]
5K krijg ik er nooit doorheen, maar ik zal eens kijken of ik de tijd heb om iets op papier te zetten.
Je kunt uitrekenen wat het jou aan uren kost om zoiets op te zetten, die uren reken je á €50,-, daar tel je op wat de pieptest kost en je hebt heel snel een valide case te pakken.

Pieptest is *gruwelijk* duur. Je merkt te laat dat er iets mis is en als bijvoorbeeld je storage vol loopt ben je écht te laat. Een server die 0% over heeft, staat plots stil. Als je dan nog disks moet gaan kopen heb je een uitdaging. Hier word dat gemonitord, ook de onderliggende hardware.

Er zijn zo ongelooflijk veel redenen om je monitoring goed op orde te hebben en al doe je maar de basis: CPU load, memory, diskusage, network, dan ben je al heel ver. Uitbreiden kan altijd als het draait. (90% hier is ook gewoon de basis.)

Ná Scaoll. - Don’t Panic.


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

unezra schreef op donderdag 3 januari 2019 @ 09:35:
[...]


Je kunt uitrekenen wat het jou aan uren kost om zoiets op te zetten, die uren reken je á €50,-, daar tel je op wat de pieptest kost en je hebt heel snel een valide case te pakken.

Pieptest is *gruwelijk* duur. Je merkt te laat dat er iets mis is en als bijvoorbeeld je storage vol loopt ben je écht te laat. Een server die 0% over heeft, staat plots stil. Als je dan nog disks moet gaan kopen heb je een uitdaging. Hier word dat gemonitord, ook de onderliggende hardware.

Er zijn zo ongelooflijk veel redenen om je monitoring goed op orde te hebben en al doe je maar de basis: CPU load, memory, diskusage, network, dan ben je al heel ver. Uitbreiden kan altijd als het draait. (90% hier is ook gewoon de basis.)
Het gaat in eerste instantie ook om de basis dingen, de hoofdservers zitten hier allemaal in prtg....(dus dat loopt :'( ). Ik maar ik had er graag alle servers in, en dan op een scherm in de ruimte dat het inzichtelijk is. Ook voor alle programmeurs hier.

Keep it calm...en lek mig de zuk


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

kromme schreef op donderdag 3 januari 2019 @ 09:38:
[...]
Het gaat in eerste instantie ook om de basis dingen, de hoofdservers zitten hier allemaal in prtg....(dus dat loopt :'( ). Ik maar ik had er graag alle servers in, en dan op een scherm in de ruimte dat het inzichtelijk is. Ook voor alle programmeurs hier.
Het leuke is, als dit bevalt kun je PRTG er uit flikkeren.
Scheelt je weer geld. :) Nóg makkelijker om de businesscase rond te krijgen dus. :)

Oh, en ze hebben support. Je kunt ze inhuren, ook voor nieuwe templates. (Dat kost logischerwijs wél geld.)

Ná Scaoll. - Don’t Panic.


  • Chiron
  • Registratie: Januari 2001
  • Laatst online: 18:57

Chiron

Moderator Tweakers Discord
Sjnirk schreef op vrijdag 28 december 2018 @ 10:45:
Niemand bezig met de elastic stack? icm beats, logstash, kibana/grafana?

AWS biedt het tegenwoordig zelfs managed aan.
Collectd, Influxdb en Grafana hier, (in combinatie met nog wat bespoke code die meuk inschiet in influxdb), in combinatie met icinga2. Op de werkvloer hebben we tv's hangen met een pi eraan met coole grafiekjes uit grafana (doet het goed bij bezoekende klanten, want ziet er indrukwekkender uit dan het is :P)

Elastic Stack ben ik nu mee bezig om de logging netjes in te krijgen.

[Voor 14% gewijzigd door Chiron op 03-01-2019 09:43]

"Light thinks it travels faster than anything. It doesn't. For wherever light travels it finds darkness has got there first and is waiting for it."


  • Oogje
  • Registratie: Oktober 2003
  • Niet online
unezra schreef op donderdag 3 januari 2019 @ 09:41:
[...]


Het leuke is, als dit bevalt kun je PRTG er uit flikkeren.
Scheelt je weer geld. :) Nóg makkelijker om de businesscase rond te krijgen dus. :)
Nee want hij heeft de gratis versie van PRTG draaien.
Dat een piepsysteem veel kost ben ik helemaal met je eens :)

@kromme Misschien in je business case meenemen wat PRTG gaat kosten als je die gaat uitbreiden? Ervanuitgaande dat je dat pakket al wel kent dus kennis opbouw/uren al gedekt zijn.

[Voor 5% gewijzigd door Oogje op 03-01-2019 10:09]

Any errors in spelling, tact, or fact are transmission errors.


  • ijdod
  • Registratie: April 2000
  • Laatst online: 19:03
Sjnirk schreef op vrijdag 28 december 2018 @ 10:45:
Niemand bezig met de elastic stack? icm beats, logstash, kibana/grafana?

AWS biedt het tegenwoordig zelfs managed aan.
Mee gespeeld, maar nooit meer dan dat. Om de een of andere reden 'klikt' dit bij mij nog niet echt. Volgens mij heeft Nagios daar zijn logserver op gebaseerd.
unezra schreef op donderdag 3 januari 2019 @ 07:23:
[...]
Da's gewoon basis Linux en zul je met praktisch ieder monitoring pakket hebben. Het lástige deel van willekeurig welk monitoring pakket zit 'm vooral in de configuratie van het pakket zelf. Ook daarin in Zabbix niet anders. Monitoring goed opzetten is niet triviaal.
Ik ken partijen die Windows als een harde eis hebben wegens gebrek aan (breed binnen het team gedragen; een enkele hobbyist is wel te vinden :D) kennis.
unezra schreef op donderdag 3 januari 2019 @ 08:42:
[...]


Wat je kunt doen is een partij inhuren die het systeem installeert en configureert, waarna jullie het dagelijks beheer doen. Heb je de Linux kennis niet nodig en de investering is héél snel terugverdiend.
Monitoring as a service is ook nog een optie. Voordeel is dat je het hele specialistische werk uitbesteedt aan een partij die daar verstand van heeft. Een partij waar ik goede ervaringen mee heb is Monitor Now.

--
Toevoeging voor de lijst: PIM+. Is bij ons eigenlijk door stom toeval op de radar gekomen (komt uit de facilities hoek) en wordt binnenkort aangeschaft. (andere opties waren de usual suspects).

[Voor 44% gewijzigd door ijdod op 03-01-2019 11:57]

Root don't mean a thing, if you ain't got that ping...


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Oogje schreef op donderdag 3 januari 2019 @ 10:09:
[...]
Nee want hij heeft de gratis versie van PRTG draaien.
*autsj*
Dat een piepsysteem veel kost ben ik helemaal met je eens :)

@kromme Misschien in je business case meenemen wat PRTG gaat kosten als je die gaat uitbreiden? Ervanuitgaande dat je dat pakket al wel kent dus kennis opbouw/uren al gedekt zijn.
Uberhaupt, PRTG gebruiken zoals je het wíl gebruiken. Als je nu de helft of minder monitort van wat je eigenlijk zou moeten monitoren is dat al niet echt lekker.

Ná Scaoll. - Don’t Panic.


  • MrNGm
  • Registratie: Augustus 2004
  • Laatst online: 02-03 20:34
kromme schreef op donderdag 3 januari 2019 @ 08:18:
Echter ontbreekt bij mij gewoon linux kennis en is her hier ook niemand op kantoor die dit heeft. Probleem 2 is dat ik er geen mega uren in mag stouwen van mijn baas.
Misschien eerst je baas overtuigen dat ie je die uren moet geven. Of zoals @unezra aangaf, een toko inhuren die dat voor je kan doen. Dat kost ook geld, en waarschijnlijk ben jij als werknemer toch net wat goedkoper dan een externe partij.
kromme schreef op donderdag 3 januari 2019 @ 09:27:
root 1764 0.0 0.0 126368 1880 tty1 T Jan02 0:00 vi /etc/zabbix/zabbix_server.conf
root 1899 0.0 0.0 126356 1684 tty1 T Jan02 0:00 vi zabbix.conf
root 1905 0.0 0.0 126292 1800 tty1 T Jan02 0:00 vi zabbix.conf.php
root 3947 0.0 0.0 126368 1880 tty1 T Jan02 0:00 vi /etc/zabbix/zabbix_server.conf
root 3992 0.0 0.0 126296 1852 tty1 T Jan02 0:00 vi zabbix.conf.php
root 17864 0.0 0.0 112704 968 pts/0 S+ 11:28 0:00 grep --color=auto zabbix
Veel in de config zitten neuzen, maar de service nog niet gestart dus. Lees de installation guide die @unezra linkte nog maar eens door ;)
ijdod schreef op donderdag 3 januari 2019 @ 11:52:
Toevoeging voor de lijst: PIM+. Is bij ons eigenlijk door stom toeval op de radar gekomen (komt uit de facilities hoek) en wordt binnenkort aangeschaft. (andere opties waren de usual suspects).
Zal 'm zo toevoegen.

  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

MrNGm schreef op donderdag 3 januari 2019 @ 13:21:
[...]
Misschien eerst je baas overtuigen dat ie je die uren moet geven. Of zoals @unezra aangaf, een toko inhuren die dat voor je kan doen. Dat kost ook geld, en waarschijnlijk ben jij als werknemer toch net wat goedkoper dan een externe partij.
In dit geval: 100% zeker niet

Probleem is 2-ledig:
- @kromme heeft beperkt Linux (dus moet op dat gebied ook nog veel leren)
- @kromme heeft beperkt kennis van monitoring systemen in het algemeen en Zabbix in het bijzonder

Wil je monitoring goed inrichten, moet je óf de tijd hebben om je er goed in te verdiepen (en die heeft 'ie niet) óf mensen inhuren die je een vliegende start kunnen geven. Dus bouwen, opleveren, overdragen.

In dit geval kan een specialist in 40 uur, waar @kromme waarschijnlijk 160 uur voor nodig heeft. Zo'n externe kost misschien €100 per uur, @kromme kost de helft maar is 2x zo lang bezig.

Long story short (en even heel kort door de bocht):
@kromme kost €8000 (160 uur á €50), een externe €4000 (40 uur á €100), met waarschijnlijk een slechter eindresultaat. (Want: zie boven. Monitoring is niet triviaal.)

Overigens, ik twijfel nergens aan de kennis van @kromme, het is ook niet bedoeld als sneer. Het is puur de rekensom die ik zelf ook 4 of 5 jaar geleden heb gemaakt. Inmiddels ken ik Zabbix wel een beetje en heb ik geen externe partij meer nodig om zaken in te richten, maar toen was het redelijk bovenstaande rekensom. (Waarbij ik natuurlijk snap dat die som érg vereenvoudigd is.)

Dus uitgeschreven en het uitbesteed.

Bijkomend voordeel: We hadden sneller en betere monitoring, waar we echt de week na oplevering al profijt van hadden. Dat hele pakket heeft zichzelf ruim terug verdiend.

Ná Scaoll. - Don’t Panic.


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
kromme schreef op woensdag 2 januari 2019 @ 21:38:
[...]


Ik heb ondertussen heel wat uurtjes verstookt in het draaiende krijgen van de zabbix service. Ik heb alle mogelijke dingen gecheckt. Dbname en WW
Poort
Cache grootte

En nog zegt hij zabbix server not running.
Wat ik hieruit haal is dat je redelijk diepgaande kennis moet hebben om het draaiende te krijgen. Is er geen vergelijkbaar pakket zoals prtf maar dan kosteloos?
LAMP stack goed opgebouwd? (Apache, MariaDB, PHP)

Wat zegt ie wanneer je de service probeert op te starten?

systemctl status zabbix-server.service -l

Kijk eens wat in de logs staat. Staat SELinux toevallig aan?

sestatus
kromme schreef op woensdag 2 januari 2019 @ 23:04:
[...]


Dan gaat het al voorbij, dit moet prtg gaan vervangen uiteindelijk.
Als je er zo weinig tijd in mag steken en het eigenlijk super makkelijk beheerbaar moet zijn zodat iedereen het kan waarom gaat PRTG er dan uit?

👩‍🚀 -> Astronauts use Linux because you cant open Windows in space <- 🚀


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Ingegno schreef op donderdag 3 januari 2019 @ 13:28:
[...]


LAMP stack goed opgebouwd? (Apache, MariaDB, PHP)

Wat zegt ie wanneer je de service probeert op te starten?

systemctl status zabbix-server.service -l

Kijk eens wat in de logs staat. Staat SELinux toevallig aan?

sestatus
Status zabbix-service zegt gewoon kan kan niet starten. Inmiddels heb ik de database eens verwijderd. En mariadb. Krijg hem nu niet meer erop. Ik ga gewoon thuis eens van scratch beginnen.
HKLM_ schreef op donderdag 3 januari 2019 @ 13:37:
[...]


Als je er zo weinig tijd in mag steken en het eigenlijk super makkelijk beheerbaar moet zijn zodat iedereen het kan waarom gaat PRTG er dan uit?
Omdat er niet alles in kan in de gratis versie.

[Voor 7% gewijzigd door kromme op 03-01-2019 13:42]

Keep it calm...en lek mig de zuk


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

HKLM_ schreef op donderdag 3 januari 2019 @ 13:37:
[...]
Als je er zo weinig tijd in mag steken en het eigenlijk super makkelijk beheerbaar moet zijn zodat iedereen het kan waarom gaat PRTG er dan uit?
Omdat PRTG snel veel duurder is dan een Zabbix installatie met vergelijkbare functionaliteit?

Ná Scaoll. - Don’t Panic.


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
kromme schreef op donderdag 3 januari 2019 @ 13:41:
[...]


Status zabbix-service zegt gewoon kan kan niet starten. Inmiddels he
[...]


Omdat er niet alles in kan in de gratis versie.
Inmiddels heb je wat? :P

  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Te snel geklik...

Keep it calm...en lek mig de zuk

kromme schreef op donderdag 3 januari 2019 @ 13:41:


Omdat er niet alles in kan in de gratis versie.
Nee inderdaad maar dan koop je toch een licentie? ja ze zijn prijzig maar je krijgt er wel wat voor terug. Nu moet je met linux aan de bak waar je geen kaas van hebt gegeten. De tijd die je nu al in een opvolger hebt besteed kost waarschijnlijk meer als een prtg licentie.
unezra schreef op donderdag 3 januari 2019 @ 13:42:
[...]


Omdat PRTG snel veel duurder is dan een Zabbix installatie met vergelijkbare functionaliteit?
Wat is duur? Als je niks van linux weet er geen tijd hebt om dit te gaan doen weet ik wel wat duurder is..

@unezra ik weet dat zabix perfect voor je is :P net als prtg voor mij 8)

[Voor 32% gewijzigd door HKLM_ op 03-01-2019 13:47]

👩‍🚀 -> Astronauts use Linux because you cant open Windows in space <- 🚀


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

HKLM_ schreef op donderdag 3 januari 2019 @ 13:45:
[...]
Wat is duur? Als je niks van linux weet er geen tijd hebt om dit te gaan doen weet ik wel wat duurder is..
Daarom dus mijn suggestie het op te laten zetten.
Kost je misschien 5K aan consultancy, dan draait het.

Done, geen licentiekosten, onbeperkt uitbreidbaar en *tonnen* aan pre-made templates beschikbaar.

Die Linux server heeft daarna niet zo veel onderhoud nodig, da's echt 5 minuten per maand.

Ná Scaoll. - Don’t Panic.


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
Even omdat ik mezelf herken in de situatie waar je nu in zit:

1. Installeer CentOS7 (mijn voorkeur gaat uit naar minimale installatie maar voor beginners misschien handiger om Server with GUI optie te nemen.

2. Voer commando 'yum update' uit om alle pakketten te updaten.

3. Installeer & configureer de LAMP-stack:

yum install httpd
systemctl enable httpd && systemctl start httpd
systemctl start httpd


yum install mariadb mariadb-server
systemctl start mariadb && systemctl enable mariadb


mysql_secure_installation

De 'mysql_secure_installation' begint een prompt om je database in te richten en vraagt om een password. Deze heb je nog niet dus druk gewoon op enter. Vervolgens kun je een root wachtwoord voor je database kiezen. Klik vervolgens bij de vragen gewoon op enter om de default value te accepteren (vraagt dingen zoals disable remote root login en delete test database e.d.)

4. Commando invoeren: yum install php php-mysql

5. Zabbix repo installeren:

 rpm -i https://repo.zabbix.com/z...ease-4.0-1.el7.noarch.rpm

5. Voer commando uit: yum install zabbix-server-mysql zabbix-web-mysql zabbix-agent

6. Voer nu het volgende commando in: sh
Dit brengt je naar de shell. Van hieruit voer je als volgt in: mysql -uroot -p
In de prompt voer je nu het wachtwoord in wat je eerder hebt gekozen (je zal je input niet terugzien).

shell> mysql -uroot -p
mysql> create database zabbix character set utf8 collate utf8_bin;
mysql> grant all privileges on zabbix.* to zabbix@localhost identified by 'wachtwoordhier';
mysql>flush privileges;
mysql> quit;


7. Schema setup en import data in Zabbix database die je hebt aangemaakt:

zcat /usr/share/doc/zabbix-server-mysql/create.sql.gz | mysql -uzabbix -p zabbix

In de prompt het wachtwoord van de database user zabbix invoeren.

Open /etc/zabbix/zabbix_server.conf

Zoeken naar

### Option: DBPassword
# Database password. Ignored for SQLite.
# Comment this line if no password is used.
#
# Mandatory: no
# Default:
# DBPassword=


Hekje weghalen en daar het wachtwoord invoeren van Zabbix-database.

Open /etc/httpd/conf.d/zabbix.conf (btw om tekst te editen gebruik ik het liefst vim, 'yum install vim')

Zoeken naar


php_value max_execution_time 300
php_value memory_limit 128M
php_value post_max_size 16M
php_value upload_max_filesize 2M
php_value max_input_time 300
php_value always_populate_raw_post_data -1
# php_value date.timezone Europe/Riga



Haal het hekje nogmaals weg en verander Europe/Riga naar Europe/Amsterdam. Opslaan (indien je vim gebruikt, 'i' om in insert mode aanpassingen te maken, esc om eruit te gaan. :x en dan enter om op te slaan. zoek anders de vi/vim handleiding erbij, of mocht je nano gebruiken dat.).

systemctl restart httpd

systemctl start zabbix-server


Let op: default staat selinux aan. Dit zal gegarandeerd zabbix blokkeren aangezien zabbix rechten nodig heeft zonder dat het de nodige security context heeft. Voor je doeleinden nu zou ik het gewoon uitschakelen. in /etc/selinux/config moet je het wijzigen van 'enforcing' naar 'disabled' (dacht ik). Doe deze handeling anders als eerst en start de server opnieuw op. Met sestatus kun je zien wat de status is van selinux.

Eenmaal zabbix-server.service gestart zou je via je webinterface erbij moeten kunnen. Ware het niet dat de firewalld waarschijnlijk ook dit tegen zal houden.

firewall-cmd --permanent --add-service=http
firewall-cmd --reload


Om even snel de http service toe te staan. Hoop dat ik niks heb gemist. :)

  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Ingegno schreef op donderdag 3 januari 2019 @ 14:12:
[...]


Let op: default staat selinux aan. Dit zal gegarandeerd zabbix blokkeren aangezien zabbix rechten nodig heeft zonder dat het de nodige security context heeft. Voor je doeleinden nu zou ik het gewoon uitschakelen. in /etc/selinux/config moet je het wijzigen van 'targeted' naar 'disabled' (dacht ik). Doe deze handeling anders als eerst en start de server opnieuw op. Met sestatus kun je zien wat de status is van selinux.

Eenmaal zabbix-server.service gestart zou je via je webinterface erbij moeten kunnen. Ware het niet dat de firewalld waarschijnlijk ook dit tegen zal houden.

firewall-cmd --permanent --add-service=http
firewall-cmd --reload


Om even snel de http service toe te staan. Hoop dat ik niks heb gemist. :)
En hier gaat het mis, waar het in het begin ook mis ging. Hoewel ik blij ben met je hulp denk ik dat dit geen zabbix topic moet worden. Wellicht even via PM?

[root@localhost zabbix]# systemctl start zabbix-server
Job for zabbix-server.service failed because the control process exited with error code. See "systemctl status zabbix-server.service" and "journalctl -xe" for details.
[root@localhost zabbix]# systemctl status zabbix-server.service"
> ^C
[root@localhost zabbix]# systemctl status zabbix-server.service
â zabbix-server.service - Zabbix Server
Loaded: loaded (/usr/lib/systemd/system/zabbix-server.service; enabled; vendor preset: disabled)
Active: activating (auto-restart) (Result: exit-code) since Thu 2019-01-03 16:27:53 CET; 9s ago
Process: 21068 ExecStart=/usr/sbin/zabbix_server -c $CONFFILE (code=exited, status=1/FAILURE)

Jan 03 16:27:53 localhost.localdomain systemd[1]: Failed to start Zabbix Server.
Jan 03 16:27:53 localhost.localdomain systemd[1]: Unit zabbix-server.service entered failed state.
Jan 03 16:27:53 localhost.localdomain systemd[1]: zabbix-server.service failed.

Keep it calm...en lek mig de zuk


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
Zou je even in de logjournal willen kijken:

journalctl -xe

En dan wat hij specifiek te zeggen heeft over de reden waarom ie niet kan starten.

  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Ingegno schreef op donderdag 3 januari 2019 @ 14:35:
Zou je even in de logjournal willen kijken:

journalctl -xe

En dan wat hij specifiek te zeggen heeft over de reden waarom ie niet kan starten.
Jan 03 16:51:26 localhost.localdomain systemd[1]: Unit zabbix-server.service entered failed state.
Jan 03 16:51:26 localhost.localdomain systemd[1]: zabbix-server.service failed.

Keep it calm...en lek mig de zuk


  • TAMW
  • Registratie: Augustus 2000
  • Laatst online: 19-03 20:00
kromme schreef op donderdag 3 januari 2019 @ 14:54:
[...]

Jan 03 16:51:26 localhost.localdomain systemd[1]: Unit zabbix-server.service entered failed state.
Jan 03 16:51:26 localhost.localdomain systemd[1]: zabbix-server.service failed.
Je moet even de zabbix-server log bekijken:

cat /var/log/zabbix_server.log

Ergens aan het eind zal exact staan waar het fout gaat,

  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
We zijn even doorgegaan per DM en bleek dat zcat /usr/share/...etc. niet helemaal goed was gegaan. Dus de zabbix data in database en schema opzet waren niet gerealiseerd. Helaas door een foutje van moi (gaf aan selinux uit te zetten maar fout gemaakt door aan te geven ‘targeting’ om te zetten naar disabled ipv ‘enforcing’ regel aan te passen). Krijg je wanneer je het even snel uit wilt tikken :P Krommert kreeg de machine vervolgens niet opgestart (wilde ook niet lukken met rescue ed), dus besloten om het geheel opnieuw te doen. Njah, zonder trial-and-error is er ook niet veel aan :)

Anyway, zelf ook veel interesse in dit topic. Gebruik Zabbix voor diverse grote projecten en omgevingen. Draait in dit soort projecten vaak om wat je kunt verkopen en Zabbix is een easy sell. Na veel vallen en opstaan heel mooi een eigen appliance van gemaakt voor productie doeleinden. Komt echt heel wat bij kijken wanneer je over omgevingen praat met honderden values per second.

Hebben jullie een alternatief gevonden voor de iReasoning MIB browser? Het is een heel gaaf stukje software om MIBs in te laden en vervolgens queries uit te voeren. Helaas is de gratis versie beperkt tot 10MIBs en SNMPv2.

  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Ingegno schreef op donderdag 3 januari 2019 @ 18:22:
Anyway, zelf ook veel interesse in dit topic. Gebruik Zabbix voor diverse grote projecten en omgevingen. Draait in dit soort projecten vaak om wat je kunt verkopen en Zabbix is een easy sell. Na veel vallen en opstaan heel mooi een eigen appliance van gemaakt voor productie doeleinden. Komt echt heel wat bij kijken wanneer je over omgevingen praat met honderden values per second.
Duizenden bedoel je neem ik aan?

Wij draaien nu 315 required new values per second en dat is niet écht spannend. De boel is nauwelijks getuned en geoptimaliseerd. Wel opgesplitst in een master/proxy setup met 1 master en 4 proxies.

Maar goed, ik vind het nog steeds een fijn product, alleen idioot dat ze geen echte multi-master ondersteunen. Je kunt MySQL geclusterd uitvoeren op MySQL niveau, maar de Zabbix Master is er vooralsnog altijd maar één. (De proxies ook, die zijn ook niet HA uit te voeren. Helaas.)

Ná Scaoll. - Don’t Panic.


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
unezra schreef op donderdag 3 januari 2019 @ 18:43:
[...]


Duizenden bedoel je neem ik aan?

Wij draaien nu 315 required new values per second en dat is niet écht spannend. De boel is nauwelijks getuned en geoptimaliseerd. Wel opgesplitst in een master/proxy setup met 1 master en 4 proxies.

Maar goed, ik vind het nog steeds een fijn product, alleen idioot dat ze geen echte multi-master ondersteunen. Je kunt MySQL geclusterd uitvoeren op MySQL niveau, maar de Zabbix Master is er vooralsnog altijd maar één. (De proxies ook, die zijn ook niet HA uit te voeren. Helaas.)
Dat ja, had vrij weinig (lees: geen) ervaring met Linux en Zabbix. Denk je het eindelijk draaiende te hebben komen al die Zabbix processen zeiken. Finetunen etc. Op een gegeven moment klapte MariaDB eruit met meldingen over "too many connections" en dan weer daar achteraan rennen. Vervolgens de webinterface die ontzettend sloom was. Bleef maar tegen dingen aanlopen. Maar moet zeggen: top product _/-\o_

Hadden voor een bepaald project ook gekeken naar aan multi-master opzet. Iets gevonden vanuit de community wat was opgezet voor versie 2.4 oid, tjah. Hadden we niet veel aan aangezien we toen op 3.4 zaten. Nu voor een nieuwe omgeving 4.0 geïnstalleerd, nog niet aan toegekomen om de inventory te vullen maar ben benieuwd naar de verbeterpunten.

Welke syslog systemen gebruiken jullie trouwens? Heb in de omgevingen waarin ik werk behoefte aan een syslog met webinterface waar ik kan filteren op zaken als source e.d. (niet heel spannend). Heb de combinatie CentOS + Adiscon Loganalyzer nu al meerdere keren ingezet en het bevalt me prima. Beetje klooien in de CSS om de PayPal donation button weg te halen en je eigen logo in de header en het ziet er nog best gelikt uit. Ook heb ik ervoor gekozen om als source te kiezen voor diskfile (dus ik laat alles loggen naar een bestand) ipv de MariaDB te gebruiken. Met dat laatste ging het queryen echt ontzettend traag. Kan zijn dat ik het fout deed en niet goed had getuned oid. Maar sinds de overgang op diskfile based sources is het ophalen van de syslogs in de webview echt heel veel sneller.

  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Ingegno schreef op donderdag 3 januari 2019 @ 19:30:
[...]
Dat ja, had vrij weinig (lees: geen) ervaring met Linux en Zabbix. Denk je het eindelijk draaiende te hebben komen al die Zabbix processen zeiken. Finetunen etc. Op een gegeven moment klapte MariaDB eruit met meldingen over "too many connections" en dan weer daar achteraan rennen. Vervolgens de webinterface die ontzettend sloom was. Bleef maar tegen dingen aanlopen. Maar moet zeggen: top product _/-\o_
:)
Hadden voor een bepaald project ook gekeken naar aan multi-master opzet. Iets gevonden vanuit de community wat was opgezet voor versie 2.4 oid, tjah. Hadden we niet veel aan aangezien we toen op 3.4 zaten. Nu voor een nieuwe omgeving 4.0 geïnstalleerd, nog niet aan toegekomen om de inventory te vullen maar ben benieuwd naar de verbeterpunten.
4.0 heeft echt een paar heel fijne features, ik wil graag updaten, maar zie een paar regels naar beneden...
Welke syslog systemen gebruiken jullie trouwens? Heb in de omgevingen waarin ik werk behoefte aan een syslog met webinterface waar ik kan filteren op zaken als source e.d. (niet heel spannend). Heb de combinatie CentOS + Adiscon Loganalyzer nu al meerdere keren ingezet en het bevalt me prima. Beetje klooien in de CSS om de PayPal donation button weg te halen en je eigen logo in de header en het ziet er nog best gelikt uit. Ook heb ik ervoor gekozen om als source te kiezen voor diskfile (dus ik laat alles loggen naar een bestand) ipv de MariaDB te gebruiken. Met dat laatste ging het queryen echt ontzettend traag. Kan zijn dat ik het fout deed en niet goed had getuned oid. Maar sinds de overgang op diskfile based sources is het ophalen van de syslogs in de webview echt heel veel sneller.
Helaas op dit moment niets. Los van std. syslog op Linux en eventlog op Windows.

Heeft er mee te maken dat ik afgelopen jaar los van een grote migratie naar het datacenter, geen geld had voor welk project dan ook (en met zoiets is externe expertise toch op zijn minst handig om te kunnen inschakelen) en dit jaar opnieuw geen geld heb maar dat is vooral omdat ik aan het nadenken ben of we in 2020 óf de hele bende de cloud in gaan schuiven (en dus onze afdeling opheffen) óf een paar ton aan investeringen moeten doen om het in-house houden.

Vooralsnog neig ik naar het eerste, maar ik moet de eerste serieuze gesprekken nog voeren. Er is geen businesscase. Enkel een schatting van de kosten al we onze hele ICT in-house houden. Da's een paar ton. Heb ik 2 FTE aan ICTer nog niet meegeteld. (2 FTE as in, mijn collega en ik.)

Zolang we niet weten wát we gaan doen, staan alle grote en kleine projecten even on-hold en is het brandjes blussen. Dit jaar een bewuste keuze, vorig jaar gedwongen wegens geen budget om andere redenen.

Kortom, centrale syslog en een hoop andere projecten staan al een paar jaar (!) op de planning, maar met anderhalve schoenveter aan budget kan ik het niet uitvoeren en ontbreekt de motivatie het dan maar zelf te doen.

Ná Scaoll. - Don’t Panic.


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
Begrijpelijk, moet wel kunnen. Mocht iemand dus zoeken naar een leuk syslog systeem: Adiscon is een geinige. En nee krijg er niet voor betaald, was het maar zo :P

Kun je ook geinige dingen doen zoals foutieve inlogpogingen detecteren middels regex. Al kan dat natuurlijk ook direct op de lokale syslog van de machines zelf but soit.

  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 12:39
Ingegno schreef op donderdag 3 januari 2019 @ 19:42:
Begrijpelijk, moet wel kunnen. Mocht iemand dus zoeken naar een leuk syslog systeem: Adiscon is een geinige. En nee krijg er niet voor betaald, was het maar zo :P

Kun je ook geinige dingen doen zoals foutieve inlogpogingen detecteren middels regex. Al kan dat natuurlijk ook direct op de lokale syslog van de machines zelf but soit.
Ik vond Kiwi syslog ook wel fijn werken, geen idee of het nog bestaat ;)

  • ijdod
  • Registratie: April 2000
  • Laatst online: 19:03
shadowman12 schreef op donderdag 3 januari 2019 @ 20:50:
[...]


Ik vond Kiwi syslog ook wel fijn werken, geen idee of het nog bestaat ;)
Dat is een oude bekende. Tegenwoordig onderdeel van Solarwinds. (niet per se een pluspunt :D)

Root don't mean a thing, if you ain't got that ping...


  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
shadowman12 schreef op donderdag 3 januari 2019 @ 20:50:
[...]


Ik vond Kiwi syslog ook wel fijn werken, geen idee of het nog bestaat ;)
Destijds ook naar gekeken. Dacht dat het een betaalde oplossing is en daardoor viel ie eigenlijk meteen af. IT mag niets kosten :P

  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 12:39
Ingegno schreef op vrijdag 4 januari 2019 @ 12:32:
[...]


Destijds ook naar gekeken. Dacht dat het een betaalde oplossing is en daardoor viel ie eigenlijk meteen af. IT mag niets kosten :P
Dat heb je slecht management die terug naar de schoolbanken mag, want IT kost ook gewoon geld. Ik heb daarvoor zelf het vak Informatiseringseconomie gevolgd tijdens mij duale opleiding en daar leer IT budgetten maken ;)
Een manager kan wel proberen de kosten te beperken, daar is niks mee. Maar als er een goede business case is en de aanschaf goed onderbouwd wordt lijkt mij dat een manager het gewoon dient goed te keuren en aan te schaffen/opdracht daar toe geven.

[Voor 9% gewijzigd door Turdie op 04-01-2019 12:40]


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Ingegno schreef op vrijdag 4 januari 2019 @ 12:32:
[...]
Destijds ook naar gekeken. Dacht dat het een betaalde oplossing is en daardoor viel ie eigenlijk meteen af. IT mag niets kosten :P
Als je ICT goed bedrijft, levert het indirect geld op.

Monitoring is, net als een ticket systeem, een van die -tig dingen die zichzelf heel snel terug verdienen.

Het is nooit verkeerd kritisch te kijken naar de kosten, maar essentiële zaken niet doen omdat ze geld kosten is vooral een teken van falend management en/of falende ICTers die het niet lukt het management te overtuigen / een goede case te schrijven.

Helaas weet ik er alles van, ik moet het ook vaak doen met anderhalve schoenveter. Soms vind ik dat leuk (het maakt je creatief), soms niet. (Het voelt nogal k*t vooral bezig te zijn met brandjes blussen.)

Ná Scaoll. - Don’t Panic.


  • MrNGm
  • Registratie: Augustus 2004
  • Laatst online: 02-03 20:34
unezra schreef op donderdag 3 januari 2019 @ 13:28:
[...]
In dit geval: 100% zeker niet
Mijn insteek hierbij was ook (maar niet geheel duidelijk verwoord) dat @kromme tijd moet krijgen om wat (basis) Linuxvaardigheden op te kunnen bouwen. Je "100% zeker niet" behoeft alsnog wel enige nuance, denk ik. Je rekensom voor het inhuren van een toko versus @kromme zelf dingen laten uitzoeken komt natuurlijk in het voordeel van de toko uit; daarom zou het op de korte termijn financieel onverstandig zijn @kromme dit te laten uitzoeken. Op de lange termijn denk ik dat @kromme juist meer waarde toevoegt aan het bedrijf als ie deze zaken heeft geleerd (immers, blijkbaar heeft niemand anders Linux-ervaring op de zaak) :).

Enfin, vooral niet andermans werk proberen te fixen. Als de baas (naar onze zeer goed geïnformeerde, alwetende mening) onverstandig is, is ie maar lekker onverstandig :w.
..... PRTG gaat vanaf 19.1.48 or later .net 4.7 gebruiken en deze moet geïnstalleerd zijn op je local probe and all computers with a remote probe. Dat is niet zo'n issue maar het heeft ook betrekking op 45 sensoren die 4.7 nodig hebben. Dat gaat dus een rondje langs alle servers worden om 4.7 te installeren. (+reboot)

https://kb.paessler.com/e...version-does-prtg-require

[Voor 11% gewijzigd door HKLM_ op 10-01-2019 10:22]

👩‍🚀 -> Astronauts use Linux because you cant open Windows in space <- 🚀


  • Arfman
  • Registratie: Januari 2000
  • Laatst online: 13:35

Arfman

Drome!

ijdod schreef op donderdag 3 januari 2019 @ 11:52:

Toevoeging voor de lijst: PIM+. Is bij ons eigenlijk door stom toeval op de radar gekomen (komt uit de facilities hoek) en wordt binnenkort aangeschaft. (andere opties waren de usual suspects).
Heb je dit ondertussen al aangeschaft?

DRoME LAN Gaming | iRacing profiel | Kia e-Niro 64kWh | Hyundai Ioniq 28kWh | PV 5.760Wp |


  • ijdod
  • Registratie: April 2000
  • Laatst online: 19:03
Arfman schreef op donderdag 10 januari 2019 @ 11:58:
[...]

Heb je dit ondertussen al aangeschaft?
Nog niet, eea moet nog formeel door het MT bekrachtigd worden ivm budget (maar dat is meer een formaliteit; we hebben de toezegging al). We hebben het echter al dik een half jaar in POC draaien. Hoezo?

[Voor 11% gewijzigd door ijdod op 10-01-2019 12:33]

Root don't mean a thing, if you ain't got that ping...


  • Arfman
  • Registratie: Januari 2000
  • Laatst online: 13:35

Arfman

Drome!

weg

[Voor 95% gewijzigd door Arfman op 22-03-2019 08:15]

DRoME LAN Gaming | iRacing profiel | Kia e-Niro 64kWh | Hyundai Ioniq 28kWh | PV 5.760Wp |


  • powerboat
  • Registratie: December 2003
  • Nu online
HKLM_ schreef op donderdag 3 januari 2019 @ 13:45:
[...]


Nee inderdaad maar dan koop je toch een licentie? ja ze zijn prijzig maar je krijgt er wel wat voor terug. Nu moet je met linux aan de bak waar je geen kaas van hebt gegeten. De tijd die je nu al in een opvolger hebt besteed kost waarschijnlijk meer als een prtg licentie.


[...]


Wat is duur? Als je niks van linux weet er geen tijd hebt om dit te gaan doen weet ik wel wat duurder is..

@unezra ik weet dat zabix perfect voor je is :P net als prtg voor mij 8)
I.p.v. dat je een licentie koopt, steek je het geld in training ;) zo sla je 2 vliegen in 1 klap. PRTG moet ook geleerd worden (tenzij je hier al kennis voor hebt).
powerboat schreef op donderdag 24 januari 2019 @ 10:42:
[...]


I.p.v. dat je een licentie koopt, steek je het geld in training ;) zo sla je 2 vliegen in 1 klap. PRTG moet ook geleerd worden (tenzij je hier al kennis voor hebt).
Ook een optie maar als een licentie voor een bedrijf al duur is dan is een training dat vaak ook. PRTG kan door iedere helpdesk medewerker binnen een uur draaien zijn dus daar hoef je niet echt voor op training. Het meeste werk gaat zitten in de devices toevoegen die je wilt en de notificaties.

[Voor 7% gewijzigd door HKLM_ op 24-01-2019 10:45]

👩‍🚀 -> Astronauts use Linux because you cant open Windows in space <- 🚀


  • powerboat
  • Registratie: December 2003
  • Nu online
HKLM_ schreef op donderdag 24 januari 2019 @ 10:44:
[...]


Ook een optie maar als een licentie voor een bedrijf al duur is dan is een training dat vaak ook. PRTG kan door iedere helpdesk medewerker binnen een uur draaien zijn dus daar hoef je niet echt voor op training. Het meeste werk gaat zitten in de devices toevoegen die je wilt en de notificaties.
Ach ja ... het is maar hoe je het bekijkt en doorrekent.
Een helpdeskmedewerker gaat zo'n pakket ook niet zomaar installeren.

Overigens kun je aan de hand van een aantal tutorials binnen een uur Zabbix ook hebben draaien, zij het niet zo via een appliance (niet aan te bevelen).
powerboat schreef op donderdag 24 januari 2019 @ 10:55:
[...]


Ach ja ... het is maar hoe je het bekijkt en doorrekent.
Een helpdeskmedewerker gaat zo'n pakket ook niet zomaar installeren.

Overigens kun je aan de hand van een aantal tutorials binnen een uur Zabbix ook hebben draaien, zij het niet zo via een appliance (niet aan te bevelen).
Waarom zou een helpdesk medewerker het monitoring pakket niet kunnen installeren? Bij klein / MKB bedrijf zijn dit juist de projecten die je aan deze medewerkers geef als ze nog een beetje ervaring willen / moeten opdoen.

👩‍🚀 -> Astronauts use Linux because you cant open Windows in space <- 🚀


  • CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 16:47

CAPSLOCK2000

zie teletekst pagina 888

In het algemeen: monitoring moet je laten doen door de persoon die verantwoordelijk is voor wat er gemonitored moet worden. Die moet balanceren tussen de eigen (nacht)rust en de beschikbaarheid van de dienstverlening. De afweging tussen te veel of te weinig monitoren.
Heel veel monitoren en ieder uur een alarm geven is net zo problematisch als niet monitoren.
Irritante waarschuwingen waar je niks aan kan doen is dodelijk voor de alertheid. Dan worden die waarschuwingen binnen de kortste keren genegeerd.
Te weinig monitoren is ook niet goed, maar als het fout gaat komt de schuld terecht bij de beheerder die verzuimd heeft om goed te monitoren. Precies zoals je wil.

Als de servicedesk de partij is die gebeld wordt om het op te lossen dan moet je monitoring inderdaad door de servicedesk laten doen. Als de servicedesk niet meer kan doen dan de melding doorzetten naar systeembeheer dan moet je de monitoring door systeembeheer laten doen.

[Voor 17% gewijzigd door CAPSLOCK2000 op 24-01-2019 18:12]

This post is warranted for the full amount you paid me for it.

CAPSLOCK2000 schreef op donderdag 24 januari 2019 @ 18:10:
In het algemeen: monitoring moet je laten doen door de persoon die verantwoordelijk is voor wat er gemonitored moet worden. Die moet balanceren tussen de eigen (nacht)rust en de beschikbaarheid van de dienstverlening. De afweging tussen te veel of te weinig monitoren.
Heel veel monitoren en ieder uur een alarm geven is net zo problematisch als niet monitoren.
Irritante waarschuwingen waar je niks aan kan doen is dodelijk voor de alertheid. Dan worden die waarschuwingen binnen de kortste keren genegeerd.
Te weinig monitoren is ook niet goed, maar als het fout gaat komt de schuld terecht bij de beheerder die verzuimd heeft om goed te monitoren. Precies zoals je wil.

Als de servicedesk de partij is die gebeld wordt om het op te lossen dan moet je monitoring inderdaad door de servicedesk laten doen. Als de servicedesk niet meer kan doen dan de melding doorzetten naar systeembeheer dan moet je de monitoring door systeembeheer laten doen.
In een groot bedrijf zal dat best zo werken inderdaad maar bij een mkb zit dat net ff wat anders. Ik zit met manager,Sd medewerker op 1 kamer en mijn manager en de sd kijken net zo hard mee in de monitoring als ik. Sd medewerker weet wat hij kan oppakken bij alerts en welke hij aan mij moet geven en dan gaat prima zo.

👩‍🚀 -> Astronauts use Linux because you cant open Windows in space <- 🚀


  • CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 16:47

CAPSLOCK2000

zie teletekst pagina 888

Je kan natuurlijk samenwerken, maar de uiteindelijke beslissing moet je neerleggen bij de persoon die problemen krijgt als het fout gaat.
Prima dat de SD dingen oppakt, maar als de SD het een keertje niet doet, wie krijgt dan gedonder? Als de SD-medewerker op z'n kop krijgt, dan mag de SD-medewerker de knoop doorhakken als er twijfel is over het monitoren van het een of het ander.
Als de systeembeheerder op z'n kop krijgt als de SD niet tijdig heeft gerageerd, dan is het de systeembeheerder die het laatste woord heeft.
Als het de manager is die de klappen moet opvangen, dan mag de manager beslissen.\

Uiteraard doe je alles in goed overleg en help je elkaar met het implementeren en uitvoeren.

[Voor 7% gewijzigd door CAPSLOCK2000 op 25-01-2019 11:20]

This post is warranted for the full amount you paid me for it.


  • ijdod
  • Registratie: April 2000
  • Laatst online: 19:03
Arfman schreef op donderdag 24 januari 2019 @ 10:38:
Beetje laat, excuss. Wij zijn van PRTG naar PIM+ overgestapt en het pakket kan minder dan werd beloofd en is veel minder gebruikersvriendelijk.
Zoals? Dat is nog steeds relevant, dan wel iets wat mogelijk nog in te dekken valt. mag vet in een pm

Wij hebben het nu een klein jaar in poc draaien, en waren juist vrij enthousiast over wat het kan, en hoe makkelijk eea te doen bleek. Hij stond oorspronkelijk niet eens op de kaart... Nu komen wij vanuit een zwaar verouderde Nagios omgeving en Solarwinds, dus wellicht dat dit meespeelt. Er zijn daadwerkelijk featurerequests ingewilligd, dus so far so good. Nu zijn wij denk ik met een kleine 50k aansluitingen ook best een ineressante partij om binnen te halen, dus wellicht dat dat helpt.

Root don't mean a thing, if you ain't got that ping...


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

HKLM_ schreef op donderdag 24 januari 2019 @ 10:57:
[...]
Waarom zou een helpdesk medewerker het monitoring pakket niet kunnen installeren? Bij klein / MKB bedrijf zijn dit juist de projecten die je aan deze medewerkers geef als ze nog een beetje ervaring willen / moeten opdoen.
Monitoring goed inrichten is best complex, niet een typische taak die je geeft aan een helpdesk medewerker. Een helpdeskmedewerker weet ook niet *wat* er gemonitord moet worden en heeft in de regel geen rechten op de systemen om dingen als agents te installeren.

In een MKB waar de helpdeskmedewerker ook systeembeheerder is, ja, in een groter bedrijf, nee.
CAPSLOCK2000 schreef op donderdag 24 januari 2019 @ 18:10:
In het algemeen: monitoring moet je laten doen door de persoon die verantwoordelijk is voor wat er gemonitored moet worden. Die moet balanceren tussen de eigen (nacht)rust en de beschikbaarheid van de dienstverlening.
Deels mee eens. In grotere organisaties is het juist logisch en gebruikelijk dat er een afdeling "bewaking" is die monitoren, de eenvoudige dingen zelf aan de hand van werkinstructies oplossen en de lastiger dingen escaleren. Afhankelijk van de urgentie kan die escalatie variëren van een ticket aanmaken met "kijk hier naar" tot iemand midden in de nacht uit zijn bed bellen.
De afweging tussen te veel of te weinig monitoren.
Heel veel monitoren en ieder uur een alarm geven is net zo problematisch als niet monitoren.
Irritante waarschuwingen waar je niks aan kan doen is dodelijk voor de alertheid. Dan worden die waarschuwingen binnen de kortste keren genegeerd.
Te weinig monitoren is ook niet goed, maar als het fout gaat komt de schuld terecht bij de beheerder die verzuimd heeft om goed te monitoren. Precies zoals je wil.
In principe wil je zo goed als álles monitoren, de crux zit hem in het filteren van je alerts. Daar wil je er zo min mogelijk van hebben en alleen relevante. Aan de achterkant however wil je liefst zo veel mogelijk metrics in je systeem pompen zodat je later correlaties kunt leggen of trends kunt zien.

Met een goed ingerichte monitoring suppress je ook specifieke alerts. Een lijn die een keer down gaat boeit niet, gaat die lijn 3x in een uur down of voor langer dan een paar minuten, alert je wél. Dat soort dingen.

Én goed ingerichte monitoring heeft kennis van de infra en ketens. Gaat een coreswitch down, alert 'ie op die coreswitch met hooguit de melding dat er een deel achterliggende infra op zijn gat ligt, maar je wil geen meldingen van al die achterliggende zooi apart. Dan staat je bord vol en ga je andere meldingen elders uit de infra niet meer zien. Terwijl de melding "coreswitch 1 down" genoeg is voor een prio 1.
Als de servicedesk de partij is die gebeld wordt om het op te lossen dan moet je monitoring inderdaad door de servicedesk laten doen. Als de servicedesk niet meer kan doen dan de melding doorzetten naar systeembeheer dan moet je de monitoring door systeembeheer laten doen.
Bij middelgrote organisaties misschien, bij grotere organisaties werkt het zoals boven beschreven en met reden. Er is in die gevallen een afdeling gespecialiseerd in monitoring en dat is ook meteen een 24/7 afdeling. De beheerders liggen te pitten en hebben hooguit piket, de mensen die monitoren zijn letterlijk 24/7 actief. (Of bijvoorbeeld 16 uur per dag, tussen 6 uur 's ochtends en 11 uur 's avonds.)

Ná Scaoll. - Don’t Panic.


  • ijdod
  • Registratie: April 2000
  • Laatst online: 19:03
@unezra Mijn ervaring is dat de mensen de monitoren juist geen 24/7 diensten draaien. Die beheren de monitoringtools, en zorgen dat de meldingen bij de relevante teams terechtkomen. Bij grote bedrijven is dat vaak een NOC, met 3e lijns beheerders in standby.

Root don't mean a thing, if you ain't got that ping...


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

ijdod schreef op zaterdag 26 januari 2019 @ 17:36:
@unezra Mijn ervaring is dat de mensen de monitoren juist geen 24/7 diensten draaien. Die beheren de monitoringtools, en zorgen dat de meldingen bij de relevante teams terechtkomen. Bij grote bedrijven is dat vaak een NOC, met 3e lijns beheerders in standby.
Exact dat NOC is waar ik het over heb.

Het wisselt wat hoe het beestje heet, ik heb ooit op een afdeling gezeten die "Operations Control Room" heette. Monitoring van 7 uur 's ochtends tot 11 uur 's avonds. Precies zoals beschreven. :)

En een NOC of vergelijkbaar iets zal afhankelijk van de wensen van de organisatie, vaker 24/7 draaien.

Ná Scaoll. - Don’t Panic.


  • ijdod
  • Registratie: April 2000
  • Laatst online: 19:03
@unezra Ah, ik las hem verkeerd, als in de afdeling die de monitoring inregelt.

Root don't mean a thing, if you ain't got that ping...


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

ijdod schreef op zaterdag 26 januari 2019 @ 17:58:
@unezra Ah, ik las hem verkeerd, als in de afdeling die de monitoring inregelt.
:)

Ik bedoel dus te zeggen dat bij grotere organisaties, de afdelingen die actief monitoren niet zelden *niet* de afdelingen zijn die de boel inrichten en/of reageren op alerts.

Het word ook vaak compleet uit elkaar getrokken, omdat het allemaal specialistenwerk is.

Tijdje bij een grotere telco gezeten, daar werden externen ingehuurd om de monitoring in te regelen (doorlopend en altijd parallel een nieuwe versie van de inregeling die de lopende versie trailt), die hadden niet te maken met het NOC dat de monitoring gebruikt en de beheerders zitten weer ergens anders.

Of monitoring word ingeregeld door 1 afdeling en diverse afdelingen krijgen hun eigen subset te zien maar hebben daar weer geen invloed op.

Fin, in kleinere organisaties ligt dat logischerwijs weer wat dichter tegen elkaar aan. Ik werk bij een MKB, monitoring hebben we initieel laten inregelen door een extern bedrijf (we hadden er de tijd niet voor), maar dagelijks beheer doen we zelf én we reageren zelf op alerts. Die tool is 100% ons feestje. Niemand anders doet iets met de meldingen. (2 ICTers in het hele bedrijf.)

Wel heeft het bord een mooie functie voor de rest van het bedrijf, alerts zijn zichtbaar, dat vinden de managers (en het bezoek dat ze krijgen), toch wel erg interessant.

Ná Scaoll. - Don’t Panic.


  • Yarisken
  • Registratie: Augustus 2010
  • Laatst online: 13:21
Klopt ik werk voor een groot bedrijf en we hebben dedicated mensen die monitoring opzetten. Dit wordt doorgestuurd automagisch naar de verantwoordelijke teams. Zelf zit ik in 3de lijn dus wij zien er wel op toe dat dit deftig gebeurt zodat we niet te vaak uit bed worden gebeld :-)

  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 12:39
Hebben mensen hier ervaring met Datadog, mij lijkt het wel een goede?

  • Gijs007
  • Registratie: Februari 2008
  • Laatst online: 14:51
Heb met Zabbix "ketenmonitoring" geïmplementeerd.



Hierdoor is in een oogopslag duidelijk door welk element een verstoring wordt veroorzaakt. (krijg een melding van de metric waarvan iets mis is, zoals te zien op de rechter Linux VM). Daarnaast live metrics voor performance en resource gebruik van de essentiële elementen.

Doe helaas geen uitgebreide netwerkmonitoring, aangezien ik geen switches of routers in beheer heb ;)
Enkel een ping met latency en packetloss voldoet voor mij.

Enige nadeel van dit soort schermen zijn:
1. Kost wat tijd om in te stellen.
2. Een complexe omgeving met veel servers wordt snel onoverzichtelijk.

Voor netwerken heb je overigens mogelijkheden om het overzichtelijk te houden. Bijvoorbeeld door een hoog over map te maken van de verschillende sites, waarbij kan worden doorgeklikt naar maps van de individuele site met daarop de individuele routers en switches.

------
Paar vraagje omtrent Zabbix:

1. Hoe voorkomen jullie dat er veel onnodige meldingen binnen komen als de Zabbix server wordt herstart/hervat? (Zabbix server is in mijn situatie een VM, die op pauze gaat tijdens een reboot van het host OS).

Krijg nu een bulk van onnodige meldingen omdat servers "down" zouden zijn geweest (Er kwam geen data binnen, want de Zabbix server was offline..) of van Zabbix processen die meer dan 75% bussy zijn..

2. Dependencies worden soms pas later herkend of worden juist eerder herkend als zijnde opgelost dan het afhankelijke probleem.
Hierdoor worden onnodige mails verstuurd, hoe kan dit worden voorkomen?

3. De Zabbix agent en server service is op Ubuntu niet erg betrouwbaar. Ik moet ze regelmatig handmatig starten na een reboot..

Ze zijn wel ingeschakeld met:
sudo update-rc.d zabbix-agent enable
sudo update-rc.d zabbix-server enable

[Voor 13% gewijzigd door Gijs007 op 27-01-2019 15:39]

AMD Ryzen 9 7950X | NZXT Kraken X63 | GIGABYTE X670E AORUS XTREME | G.Skill Trident Z Neo F5-6000J3038F16GX2-TZ5NR | Inno3D GeForce RTX 4090 iCHILL X3 | Corsair AX860i | 2 x WD Black NVMe SSD SN850 2TB | 1 x Intel Optane 900P 480GB | Corsair iCUE 5000T


  • MrNGm
  • Registratie: Augustus 2004
  • Laatst online: 02-03 20:34
Gijs007 schreef op zondag 27 januari 2019 @ 00:14:
[...]

Heb met Zabbix "ketenmonitoring" geïmplementeerd.

[Afbeelding]
Gaaf!
1. Hoe voorkom jullie dat er veel onnodige meldingen binnen komen als de Zabbix server wordt herstart/hervat? (Zabbix server is in mijn situatie een VM, die op pauze gaat tijdens een reboot van het host OS).
Je hebt iets dat maintenance mode heet.
3. De Zabbix agent en server service is op Ubuntu niet erg betrouwbaar. Ik moet ze regelmatig handmatig starten na een reboot..

Ze zijn wel ingeschakeld met:
sudo update-rc.d zabbix-agent enable
sudo update-rc.d zabbix-server enable
Draai je al een Ubuntu-versie die systemd gebruikt? Indien ja: gebruik systemctl enable ipv update-rc.d.

  • Gijs007
  • Registratie: Februari 2008
  • Laatst online: 14:51
MrNGm schreef op zondag 27 januari 2019 @ 15:13:
[...]


Gaaf!


[...]


Je hebt iets dat maintenance mode heet.


[...]


Draai je al een Ubuntu-versie die systemd gebruikt? Indien ja: gebruik systemctl enable ipv update-rc.d.
Ik draai Ubuntu 18.04 LTS, die gebruikt inderdaad systemd.
Vreemd, ik zie de zabbix-agent en zabbix-server services niet terug als ik op tab druk bij sudo systemctl enable.

Maintenance mode is helaas niet de perfecte optie, aangezien we ook wel eens onverwachte reboots hebben. Ik zit te denken aan een dependency, waarbij ik bijvoorbeeld nodata van de Zabbix server gebruik als trigger of een te grote sprong in de datum en tijd als trigger gebruik.

AMD Ryzen 9 7950X | NZXT Kraken X63 | GIGABYTE X670E AORUS XTREME | G.Skill Trident Z Neo F5-6000J3038F16GX2-TZ5NR | Inno3D GeForce RTX 4090 iCHILL X3 | Corsair AX860i | 2 x WD Black NVMe SSD SN850 2TB | 1 x Intel Optane 900P 480GB | Corsair iCUE 5000T


  • Oogje
  • Registratie: Oktober 2003
  • Niet online
shadowman12 schreef op zaterdag 26 januari 2019 @ 18:11:
Hebben mensen hier ervaring met Datadog, mij lijkt het wel een goede?
Waarom lijkt het jou een goede en tov welk pakket?

Any errors in spelling, tact, or fact are transmission errors.


  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 12:39
Oogje schreef op zondag 27 januari 2019 @ 15:47:
[...]

Waarom lijkt het jou een goede en tov welk pakket?
Niet ten opzichte van een ander pakket, het heeft gewoon veel mooie features, die je bijna nergens anders vindt.

  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Gijs007 schreef op zondag 27 januari 2019 @ 00:14:
[...]

Heb met Zabbix "ketenmonitoring" geïmplementeerd.

[Afbeelding]

Hierdoor is in een oogopslag duidelijk door welk element een verstoring wordt veroorzaakt. (krijg een melding van de metric waarvan iets mis is, zoals te zien op de rechter Linux VM). Daarnaast live metrics voor performance en resource gebruik van de essentiële elementen.
Nice!
Dat wilde ik ook nog een keer doen. :) Het is alleen even afhankelijk van de plannen van volgend jaar of ik het werkelijk nog ga doen, of dat ik de huidige implementatie door laat hobbelen. (Ik wil ook nog naar Zabbix 4, draaien nu nog op 3.2. Ook dat is afhankelijk van of het nog zin heeft. Stel dat we volgend jaar alles gaan outsourcen, ga ik niet dit jaar nog flink sleutelen aan Zabbix. Leuk, leerzaam, maar los van dat vrij nutteloos.)
Paar vraagje omtrent Zabbix:

1. Hoe voorkomen jullie dat er veel onnodige meldingen binnen komen als de Zabbix server wordt herstart/hervat? (Zabbix server is in mijn situatie een VM, die op pauze gaat tijdens een reboot van het host OS).

Krijg nu een bulk van onnodige meldingen omdat servers "down" zouden zijn geweest (Er kwam geen data binnen, want de Zabbix server was offline..) of van Zabbix processen die meer dan 75% bussy zijn..
Niet. Wij updaten en rebooten al onze servers normaliter iedere maand, de Zabbix server en proxies (we hebben 1 master en 5 proxies) doe ik als een van de eerste. Ik weet dat 'ie na een reboot ongeveer 20-30 minuten nodig heeft om weer volledig bij zijn positieven te komen. Het onderhoud duurt normaliter een uur of 3, 4 dus door 'm als een van de eerste te doen weet ik dat mijn data betrouwbaar is tegen de tijd dat het onderhoud is afgerond. :)
3. De Zabbix agent en server service is op Ubuntu niet erg betrouwbaar. Ik moet ze regelmatig handmatig starten na een reboot..

Ze zijn wel ingeschakeld met:
sudo update-rc.d zabbix-agent enable
sudo update-rc.d zabbix-server enable
Herkenbaar, grofweg 1 op de 4x is de autostart kapot. (Alleen de server component overigens, dus bij de master en proxies.) Het is een van de checks die ik daarom op de master en slaves doe als ze gereboot zijn. Ik doe een eenvoudige "ps aux | grep zabb | wc -l" en zie of ik voldoende processen zie. Uit mijn hoofd moeten dat er voor de master in ons geval rond of boven de 100 zijn en voor de proxies iets meer. Zie ik 10 of 20, weet ik dat er iets geklapt is.

Dus voer ik precies die acties uit, reboot en doe weer het "ps aux" riedeltje. Zie ik er dan wel genoeg, heb ik een goed gevoel dat het goed is gegaan.

Sure, ik kan uitzoeken waarom het af en toe mis gaat maar dan ben ik met wat pech uren of dagen aan het speuren terwijl me dit per onderhoud misschien 5 minuten kost. Voor ieder uur dat ik investeer in uitzoeken waarom het af en toe mis gaat, kan ik 12x onderhoud uitvoeren. Ofwel, 1 uur troubleshooten is het equivalent van 1 jaar aan updates en vrij zeker dat het troubleshooten me meer dan 1 uur kost. Dus doe ik het niet. :)

(Die reboot is er overigens om er voor te zorgen dat de tijdelijke fix werkt en dat daarna de Zabbix master en proxies *wel* opkomen bij een al dan niet geplande reboot. Ik wil zeker weten dat ze reboot-proof zijn. Dat werkt. Die fix werkt tenminste tot en met de volgende OS upgrade.)

Ná Scaoll. - Don’t Panic.


  • Kavaa
  • Registratie: November 2009
  • Laatst online: 26-03 07:34
shadowman12 schreef op zondag 27 januari 2019 @ 16:07:
[...]


Niet ten opzichte van een ander pakket, het heeft gewoon veel mooie features, die je bijna nergens anders vindt.
Ook aardig aan de prijs, en volgens mij kan het niet je Routers / Switches monitoren etc.

Het is een beetje het zelfde als New Relic die kan ook je Servers monitoren etc. wel met een Agent. Maar volgens mij niet je Routers, Switches en overige apparatuur.
Dus dan heb je er naar mijn idee nog weinig aan.

Zabbix, Observium, LibreNMS, PRTG etc. kunnen dat wel.

ICTWebSolution - Wi-Fi Problemen? Stuur maar een berichtje! - Wi-Fi Bereik verbeteren?


  • Metalfreak
  • Registratie: April 2003
  • Laatst online: 12:15

Metalfreak

Hoije woh!

Arfman schreef op donderdag 24 januari 2019 @ 10:38:
Beetje laat, excuss. Wij zijn van PRTG naar PIM+ overgestapt en het pakket kan minder dan werd beloofd en is veel minder gebruikersvriendelijk.
Ik ben ook wel benieuwd, de POC die nu draait ziet er namelijk wel goed uit.

Aan mensen die me ipv mijn gebruiken: hebben jullie in het echt ook zo'n spraakgebrek?


  • Arfman
  • Registratie: Januari 2000
  • Laatst online: 13:35

Arfman

Drome!

weg

[Voor 99% gewijzigd door Arfman op 22-03-2019 08:16]

DRoME LAN Gaming | iRacing profiel | Kia e-Niro 64kWh | Hyundai Ioniq 28kWh | PV 5.760Wp |


  • slotjejunior
  • Registratie: Februari 2011
  • Laatst online: 22-03 09:05
Metalfreak schreef op donderdag 14 februari 2019 @ 14:03:
[...]


Ik ben ook wel benieuwd, de POC die nu draait ziet er namelijk wel goed uit.
Vandaag gestart met PIM+. Vanaf 11:00 uur begonnen met alle servers + switches en performance event monitors geïmplementeerd. Uitmuntend pakket! Naar de maan en terug :)
En dat gewoon agentless!

  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Is er iemand die me kort de voordelen en nadelen kan vertellen om met zabbix via SNMP uit te lezen of met de agent?

Keep it calm...en lek mig de zuk


  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 12:39
kromme schreef op dinsdag 16 april 2019 @ 12:39:
Is er iemand die me kort de voordelen en nadelen kan vertellen om met zabbix via SNMP uit te lezen of met de agent?
Zonder te weten hoe je netwerk eruit ziet en wat jouw eisen/wensen is dat echt onmogelijk. Denk aan streng security beleid, of makkelijk poorten kunnen openen.

Maar agent heeft bij mij altijd de voorkeur, kun je gewoon meer uitlezen, SNMP is meestal wat beperkter.

[Voor 12% gewijzigd door Turdie op 16-04-2019 13:31]


  • Hero of Time
  • Registratie: Oktober 2004
  • Laatst online: 26-03 22:02

Hero of Time

Moderator LNX

There is only one Legend

kromme schreef op dinsdag 16 april 2019 @ 12:39:
Is er iemand die me kort de voordelen en nadelen kan vertellen om met zabbix via SNMP uit te lezen of met de agent?
SNMP:
+ Geen agent nodig;
+ Universeel;
- Iets meer configuratie vereist;
- Toegang beperk je met firewall of snmp v3 authenticatie;
- Sommige waarden zijn niet altijd goed te interpreteren;
- Beperkte mogelijkheden.

Agent:
+ Uitgebreide mogelijkheden, o.a. eigen checks maken via scripts e.d.
+ Werkt ook via aparte Zabbix proxy, handig bij bijvoorbeeld DMZ omgeving;
+ Toegang zit in de configuratie verwerkt;
- Installatie vereist;
- Je moet wel onthouden de aparte checks van eigen keys te voorzien die je in de server opgeeft.

Zo even snel uit m'n hoofd. Er zijn veel meer voor- en nadelen. Maar zoals hierboven, beste installeer je gewoon de agent als het kan. De .zip uitpakken en registreren/installeren als service. In de config aangeven wat de server is en klaar.

Commandline FTW | Tweakt met mate


  • kromme
  • Registratie: April 2004
  • Laatst online: 16:36

kromme

Doe hubs slaag in het koffer..

Hero of Time schreef op dinsdag 16 april 2019 @ 13:49:
[...]

SNMP:
+ Geen agent nodig;
+ Universeel;
- Iets meer configuratie vereist;
- Toegang beperk je met firewall of snmp v3 authenticatie;
- Sommige waarden zijn niet altijd goed te interpreteren;
- Beperkte mogelijkheden.

Agent:
+ Uitgebreide mogelijkheden, o.a. eigen checks maken via scripts e.d.
+ Werkt ook via aparte Zabbix proxy, handig bij bijvoorbeeld DMZ omgeving;
+ Toegang zit in de configuratie verwerkt;
- Installatie vereist;
- Je moet wel onthouden de aparte checks van eigen keys te voorzien die je in de server opgeeft.

Zo even snel uit m'n hoofd. Er zijn veel meer voor- en nadelen. Maar zoals hierboven, beste installeer je gewoon de agent als het kan. De .zip uitpakken en registreren/installeren als service. In de config aangeven wat de server is en klaar.
hoe zit het het met netwerkverkeer en SNMP? Er zal veel gepold worden?

Keep it calm...en lek mig de zuk


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Hero of Time schreef op dinsdag 16 april 2019 @ 13:49:
[...]
Agent:
+ Werkt ook via aparte Zabbix proxy, handig bij bijvoorbeeld DMZ omgeving;
Da's geen eigenschap van de Agent.
*Alle* checks werken via de Zabbix proxy, ook snmp.

Ná Scaoll. - Don’t Panic.


  • Hero of Time
  • Registratie: Oktober 2004
  • Laatst online: 26-03 22:02

Hero of Time

Moderator LNX

There is only one Legend

kromme schreef op dinsdag 16 april 2019 @ 20:24:
[...]

hoe zit het het met netwerkverkeer en SNMP? Er zal veel gepold worden?
Voor SNMP is er eerst een discover waarschijnlijk om de ondersteunde OIDs te krijgen. Daarna is het maar net hoe vaak je controleert. Wil je elke seconde weten wat er allemaal op de server gebeurt, of volstaat het dat je sommige items elke minuut ophaalt en andere per uur.

Maar dat heb je met de agent ook. Ik heb 't iig niet gemeten, al kan ik dat wel zo uit m'n Zabbix halen. Denk niet dat het veel is, anders hoor je gebruikers wel klagen dat het netwerk traag is. :P
unezra schreef op dinsdag 16 april 2019 @ 20:34:
[...]

Da's geen eigenschap van de Agent.
*Alle* checks werken via de Zabbix proxy, ook snmp.
Owja, shoot, dat is waar ook idd. De proxy verzameld alles wat de server zou verzamelen. Nooit een proxy ingericht, want niet nodig gehad.

Commandline FTW | Tweakt met mate


  • MrNGm
  • Registratie: Augustus 2004
  • Laatst online: 02-03 20:34
kromme schreef op dinsdag 16 april 2019 @ 12:39:
Is er iemand die me kort de voordelen en nadelen kan vertellen om met zabbix via SNMP uit te lezen of met de agent?
Zoals anderen ook zeiden, het hangt van je situatie af. In mijn omgeving pollen we regelmatig via de agent een kleine 100 servers; dat gaat prima. D'r zitten wat metrics ingebouwd (zie in de documentatie "item types") waardoor je de meeste interessante zaken gelijk kan gaan verzamelen, maar je kan 't ook zelf uitbreiden met UserParameters (dat doen we dan ook waar stock Zabbix niet in kan voorzien).

SNMP heeft een hiërarchische structuur (MIBs) en je moet maar net de juiste OIDs met een friendly name kunnen verbinden. Er zijn wat templates meegeleverd in Zabbix, en je moet denk ik zelf uitzoeken welke dan past bij je situatie. Ik zou niet uit m'n hoofd weten waar 1.2.51.25.21.2.1 naar refereert (als 't al ergens naar refereert). De Zabbix agent heeft (tenzij je het zelf via een UserParameter anders doet) human-readable keys.

Voor de "standaard" netwerkdevices (router, switches) gebruiken we SNMP, de meeste hosts kunnen een Zabbix agent draaien, dus daar draait dan de agent.

Nog een caveat die ik vandaag tegenkwam in Zabbix: bij item preprocessing kan je ten hoogste 10 capture groups in een reguliere expressie gebruiken. 8)7 Uiteindelijk had ik niet alle 15 capture groups nodig, maar geven die capture groups wel overall betere leesbaarheid.

  • Ingegno
  • Registratie: Oktober 2015
  • Laatst online: 13-03 18:48
Wat Hero of Time eigenlijk ook aangeeft: SNMP is universeel. Voor bepaalde apparatuur kun je zelfs niks anders. Denk aan UPS/PDU/NAS/Switches/Industrieel etc.

Doe zelf omwille hiervan meer met SNMP, voor de centrale omgevingen bestaande uit servers/clients e.d. gebruik ik meestal ook SNMP. Langzaam wel over op Agent vanwege Microsoft die geen heil meer ziet in SNMP en meer wilt via de CIM.

Acties:
  • 0Henk 'm!

  • vincedd
  • Registratie: Oktober 2008
  • Laatst online: 13:34
Wij gebruiken voor de monitoring van onze pdu's en de temparaturen in de cold aisle's power iq.

Acties:
  • 0Henk 'm!

  • winux
  • Registratie: April 2003
  • Laatst online: 16:50
Heeft er iemand ervaring met Maintenance Windows binnen PRTG.
Heb een schema ingesteld dat er tussen bepaalde tijd 's nachts een Maintenance Window ingesteld staat.
Met als doel, dat wanneer er tijdens dat tijdsbestek een error zou komen, deze niet gemaild wordt.
Echter worden (wat opzich logisch is) er dan ook geen gegevens vastgelegd, welke wel handig zijn voor hisoritsch waardes.
Iemand hier al tegen aan gelopen?

  • eagle00789
  • Registratie: November 2005
  • Laatst online: 25-03 15:28

eagle00789

Est. November 2005

Ik hoop dat iemand mij kan helpen. ik heb een discussie met een collega over het verschil tussen een alert en een warning als het gaat over sysops (Monitoring)
Ik zeg:
  • Warning: een apparaat gaat een mankement vertonen waardoor het gewenst is nu een actie te vertonen
  • Alert: Een apparaat heeft een mankement waardoor actie verplicht is.
Een voorbeeld van mijn bewering:
Een device met een redundante voeding waarvan 1 voeding uitvalt: alert
Een device waarvan de schijf net onder de threshold is gevallen: Warning
Een device is geheel onbereikbaar: Alert
  • Warning: een apparaat gaat een mankement vertonen waardoor het gewenst is nu een actie te vertonen
  • Alert: Een apparaat heeft een mankement waardoor actie verplicht is.
(ja dit is identiek aan dat wat ik beweer, echter interpreteert hij het anders)
Een voorbeeld van zijn bewering:
Een device met een redundante voeding waarvan 1 voeding uitvalt: Warning
Een device waarvan de schijf net onder de threshold is gevallen: Warning
Een device is geheel onbereikbaar: Alert

Je ziet, we hebben beide 2 verschillende opvattingen.
Nu wil ik graag eens van de community weten, wat denken zij dat de betere interpretatie is? (Andere opvattingen zijn natuurlijk ook welkom)

  • Oogje
  • Registratie: Oktober 2003
  • Niet online
Wat mij betreft ligt het eraan welke acties aan een alert/warning hangen.
Voorbeeldje: Hier is een Alert een melding die 24/7 op je mobiel binnenkomt, je wil niet wakker worden voor een device waar 1 van de 2 voedingen uitvalt, dan wil je dus een warning die je de volgende ochtend kan oppakken.

Any errors in spelling, tact, or fact are transmission errors.


  • eagle00789
  • Registratie: November 2005
  • Laatst online: 25-03 15:28

eagle00789

Est. November 2005

Oogje schreef op woensdag 12 juni 2019 @ 09:34:
Wat mij betreft ligt het eraan welke acties aan een alert/warning hangen.
Voorbeeldje: Hier is een Alert een melding die 24/7 op je mobiel binnenkomt, je wil niet wakker worden voor een device waar 1 van de 2 voedingen uitvalt, dan wil je dus een warning die je de volgende ochtend kan oppakken.
Het probleem in het monitoringsysteem is dat beide voedingen apart worden gemonitord vie allebei 1 sensor. De sensoren weten van elkaar geen status en het systeem laat ze niet aan elkaar koppelen.
Hierdoor wil je dus van beide voedingen altijd een alert hebben. Als je ze aan elkaar kunt koppelen, dan kun je dit wel realizeren.
We kunnen wel custom sensoren maken die dit scenario wel aankunnen.
Misschien is dat een alternatief voor mijn collega.

  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 24-03 19:26
eagle00789 schreef op woensdag 12 juni 2019 @ 13:11:
[...]

Het probleem in het monitoringsysteem is dat beide voedingen apart worden gemonitord vie allebei 1 sensor. De sensoren weten van elkaar geen status en het systeem laat ze niet aan elkaar koppelen.
Hierdoor wil je dus van beide voedingen altijd een alert hebben. Als je ze aan elkaar kunt koppelen, dan kun je dit wel realizeren.
We kunnen wel custom sensoren maken die dit scenario wel aankunnen.
Misschien is dat een alternatief voor mijn collega.
Beetje onnodig; als 1 voeding kapot is doet het apparaat het nog; bij 2 zal de ping ook wel uitvallen, en daar zet je dan wel een alert op.

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

eagle00789 schreef op woensdag 12 juni 2019 @ 07:36:
Ik hoop dat iemand mij kan helpen. ik heb een discussie met een collega over het verschil tussen een alert en een warning als het gaat over sysops (Monitoring)
In mijn beleving gebruik je 2 termen die alleen indirect iets elkaar te maken hebben.

- Een alert is *alles* dat iets in je monitoring systeem triggert (Zabbix noemt dat een trigger)
- Een warning is een severity van een alert


Kijk je naar Zabbix, heb je de volgende severities:
- Not classified
- Information
- Warning
- Average
- High
- Disaster

Zie:
https://www.zabbix.com/do.../config/triggers/severity

Hun beschrijving zegt daarover dit:


Ik vertaal het even naar Zabbix terminologie (severities van triggers) en wat ik er van vind.
Ik zeg:
  • Warning: een apparaat gaat een mankement vertonen waardoor het gewenst is nu een actie te vertonen
  • Alert: Een apparaat heeft een mankement waardoor actie verplicht is.
Een voorbeeld van mijn bewering:
Een device met een redundante voeding waarvan 1 voeding uitvalt: alert
Een device waarvan de schijf net onder de threshold is gevallen: Warning
Een device is geheel onbereikbaar: Alert
- "Een device met een redundante voeding waarvan 1 voeding uitvalt: alert" --> High. Actie is noodzakelijk, zeker binnen 24 uur want je redundancy is aangetast maar je hoeft er in de regel niet voor uit je bed gebeld te worden.
- "Een device waarvan de schijf net onder de threshold is gevallen: Warning" --> Warning, afhankelijk van je thresholds. (Wij hanteren in de regel 4 tresholds die beginnen op Warning, daarna Average, daarna High. Disaster is "disk 100% vol".
- "Een device is geheel onbereikbaar: Alert" --> Disaster (lijkt me geen verdere uitleg voor nodig, hiervoor moet je je bed uit gebeld worden *mits* het een mission critical systeem is. Niet kritieke systemen kunnen best een dag, soms dagen wachten. Daar zou je dus ook de severity van kunnen aanpassen of je werkproces.)
• Warning: een apparaat gaat een mankement vertonen waardoor het gewenst is nu een actie te vertonen
• Alert: Een apparaat heeft een mankement waardoor actie verplicht is.
[/list]
(ja dit is identiek aan dat wat ik beweer, echter interpreteert hij het anders)
Een voorbeeld van zijn bewering:
Een device met een redundante voeding waarvan 1 voeding uitvalt: Warning
Een device waarvan de schijf net onder de threshold is gevallen: Warning
Een device is geheel onbereikbaar: Alert

Je ziet, we hebben beide 2 verschillende opvattingen.
Nu wil ik graag eens van de community weten, wat denken zij dat de betere interpretatie is? (Andere opvattingen zijn natuurlijk ook welkom)
Ik denk dat het belangrijk is eerst de juiste terminologie te gebruiken hiervoor en niet te spreken over warnings en alerts, omdat dat compleet verschillende dingen binnen eenzelfde context (monitoring) zijn. Jullie monitoringsysteem zal denk ik ook niet de termen "warning" en "alert" gebruiken voor iets dat severities zijn.

Ná Scaoll. - Don’t Panic.


  • eagle00789
  • Registratie: November 2005
  • Laatst online: 25-03 15:28

eagle00789

Est. November 2005

unezra schreef op donderdag 13 juni 2019 @ 08:41:
[...]


In mijn beleving gebruik je 2 termen die alleen indirect iets elkaar te maken hebben.

- Een alert is *alles* dat iets in je monitoring systeem triggert (Zabbix noemt dat een trigger)
- Een warning is een severity van een alert


[...]


Ik denk dat het belangrijk is eerst de juiste terminologie te gebruiken hiervoor en niet te spreken over warnings en alerts, omdat dat compleet verschillende dingen binnen eenzelfde context (monitoring) zijn. Jullie monitoringsysteem zal denk ik ook niet de termen "warning" en "alert" gebruiken voor iets dat severities zijn.
Je hebt geheel gelijk, maar dat is mijn collega schuld die deze continu zo gebruikt en ik het langzaam overneem van hem op deze manier.
De juiste terminologie voor ons monitoring pakket is als volgt:
StateCritical PriorityDescription
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_failed.pngFailed1The service is not functioning at the required level.
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_warning.pngWarning2The service is functioning but not at an optimal level. For example, the service thresholds could be set up to indicate a Warning state when a service is not meeting its SLA.
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_normal.pngNormal3The service is sending valid data and functioning at an optimal level according to the specified thresholds.
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_misconfigured.pngMisconfigured4There is a setup error in the service thresholds. For example, if there is a gap between the threshold values and the service, the service changes to the Misconfigured state.
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_stale.pngStale Data5The central server has not received an update during the specified time period and the data is out-of-date or unavailable. This occurs if the agent does not send an update or the connection between the Agent and the central server is down. The status of a service can change from the No Data to the Stale Data state if the data was not received during the expected period. For example, a local service can change to the Stale Data state if there is a delay in installing the appropriate agent on the device. Local services of a device can change from the No Data state to the Stale Data state if there is a delay in installing the appropriate agent on the device.
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_nodata.pngNo Data6The service has not yet sent any data. All newly added services start in the No Data state and can take several minutes before sending any data. The No Data state is displayed if the state of the service cannot be read or if the service changes to Indeterminate.
https://secure.n-able.com/webhelp/NC_12-0-1_en/Content/Resources/Images/status_disconnected.png7 The device is not connected to the network. This occurs when a device experiences a 'friendly' shut down or during a scheduled downtime. If a service is disabled, then its status changes to the Disconnected state.

Het probleem zit hem er dus in dat de beide voedingen separaat gemonitord worden en dus niet van elkaar weten in het monitoring pakket of er al een andere service in warning state gaat. Hierdoor heb je dus de keuze om voor beide voedingen alleen een warning te kiezen of voor beide een failed.
Wel kan ik dus een custom service aanmaken zodat ik beide voedingen via 1 service monitor waar ik dan wel de logica aan kan hangen dat ze het van elkaar weten.

Ik hoop dat ik het zo iets duidelijker heb gemaakt voor je. (excuses voor de verkeerde terminologie)

  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

eagle00789 schreef op donderdag 13 juni 2019 @ 11:06:
[...]

Je hebt geheel gelijk, maar dat is mijn collega schuld die deze continu zo gebruikt en ik het langzaam overneem van hem op deze manier.
De juiste terminologie voor ons monitoring pakket is als volgt:
StateCritical PriorityDescription
[Afbeelding]Failed1The service is not functioning at the required level.
[Afbeelding]Warning2The service is functioning but not at an optimal level. For example, the service thresholds could be set up to indicate a Warning state when a service is not meeting its SLA.
[Afbeelding]Normal3The service is sending valid data and functioning at an optimal level according to the specified thresholds.
[Afbeelding]Misconfigured4There is a setup error in the service thresholds. For example, if there is a gap between the threshold values and the service, the service changes to the Misconfigured state.
[Afbeelding]Stale Data5The central server has not received an update during the specified time period and the data is out-of-date or unavailable. This occurs if the agent does not send an update or the connection between the Agent and the central server is down. The status of a service can change from the No Data to the Stale Data state if the data was not received during the expected period. For example, a local service can change to the Stale Data state if there is a delay in installing the appropriate agent on the device. Local services of a device can change from the No Data state to the Stale Data state if there is a delay in installing the appropriate agent on the device.
[Afbeelding]No Data6The service has not yet sent any data. All newly added services start in the No Data state and can take several minutes before sending any data. The No Data state is displayed if the state of the service cannot be read or if the service changes to Indeterminate.
[Afbeelding]7 The device is not connected to the network. This occurs when a device experiences a 'friendly' shut down or during a scheduled downtime. If a service is disabled, then its status changes to the Disconnected state.
Top! Dat ziet er inderdaad een stuk logischer uit. :) Tijd om je collega op de voeden dus. 8)
Het probleem zit hem er dus in dat de beide voedingen separaat gemonitord worden en dus niet van elkaar weten in het monitoring pakket of er al een andere service in warning state gaat. Hierdoor heb je dus de keuze om voor beide voedingen alleen een warning te kiezen of voor beide een failed.
Wel kan ik dus een custom service aanmaken zodat ik beide voedingen via 1 service monitor waar ik dan wel de logica aan kan hangen dat ze het van elkaar weten.

Ik hoop dat ik het zo iets duidelijker heb gemaakt voor je. (excuses voor de verkeerde terminologie)
Ik zou het zo doen:
- Voor beiden een Warning (Niet alleen bij uitval, maar ook bij andere issues met die voeding, ze kunnen dacht ik vaak ook partial failen. Dat heb ik gisteren gemerkt met een fan. De fan zelf geeft een warning in Zabbix, maar draait gewoon door. Hij is dus niet helemaal stuk maar ILO vind wel dat er iets mis is, dus geeft 'ie alsnog een warning af.)
- Een failed wanneer beiden een warning geven ("event correlation" is meestal de term hiervoor)
- Sowieso zorgen dat je een failed hebt op het apparaat waar die voedingen in zitten (beide voedingen down betekend 100% dat je apparaat weg is, maar dat kun je dus niet meer uit die PSU's halen, die monitoring valt dan immers helemaal weg).

Zijn beiden 100% kapot / uitgevallen, zul je geen warning krijgen op de PSU's, het apparaat staat immers uit, maar bij een partial failed (die zeker een warning rechtvaardigd), wil je absoluut meteen een failed hebben. (Wij zouden dat als "Disaster" in Zabbix classificeren, that is, als we aan event correlation zouden doen. Doen we alleen niet.)

De failed op het apparaat zelf is evident. Apparaat stuk. Die moet er óók zijn, je wil niet alleen triggeren op je PSU's.

Ná Scaoll. - Don’t Panic.


Acties:
  • +1Henk 'm!

  • Equator
  • Registratie: April 2001
  • Laatst online: 16:07

Equator

Crew Council

#whisky #barista

Ik heb de Monitoring posts uit het Sysops topic even naar dit topic verplaatst :)

Vragen/opmerkingen
Privacy is something you can sell, but you can't buy back!


  • Yariva
  • Registratie: November 2012
  • Laatst online: 17:50

Yariva

Power to the people!

eagle00789 schreef op donderdag 13 juni 2019 @ 11:06:
[...]

Je hebt geheel gelijk, maar dat is mijn collega schuld die deze continu zo gebruikt en ik het langzaam overneem van hem op deze manier.
De juiste terminologie voor ons monitoring pakket is als volgt:
StateCritical PriorityDescription
[Afbeelding]Failed1The service is not functioning at the required level.
[Afbeelding]Warning2The service is functioning but not at an optimal level. For example, the service thresholds could be set up to indicate a Warning state when a service is not meeting its SLA.
[Afbeelding]Normal3The service is sending valid data and functioning at an optimal level according to the specified thresholds.
[Afbeelding]Misconfigured4There is a setup error in the service thresholds. For example, if there is a gap between the threshold values and the service, the service changes to the Misconfigured state.
[Afbeelding]Stale Data5The central server has not received an update during the specified time period and the data is out-of-date or unavailable. This occurs if the agent does not send an update or the connection between the Agent and the central server is down. The status of a service can change from the No Data to the Stale Data state if the data was not received during the expected period. For example, a local service can change to the Stale Data state if there is a delay in installing the appropriate agent on the device. Local services of a device can change from the No Data state to the Stale Data state if there is a delay in installing the appropriate agent on the device.
[Afbeelding]No Data6The service has not yet sent any data. All newly added services start in the No Data state and can take several minutes before sending any data. The No Data state is displayed if the state of the service cannot be read or if the service changes to Indeterminate.
[Afbeelding]7 The device is not connected to the network. This occurs when a device experiences a 'friendly' shut down or during a scheduled downtime. If a service is disabled, then its status changes to the Disconnected state.

Het probleem zit hem er dus in dat de beide voedingen separaat gemonitord worden en dus niet van elkaar weten in het monitoring pakket of er al een andere service in warning state gaat. Hierdoor heb je dus de keuze om voor beide voedingen alleen een warning te kiezen of voor beide een failed.
Wel kan ik dus een custom service aanmaken zodat ik beide voedingen via 1 service monitor waar ik dan wel de logica aan kan hangen dat ze het van elkaar weten.

Ik hoop dat ik het zo iets duidelijker heb gemaakt voor je. (excuses voor de verkeerde terminologie)
Om de boel nog even lastiger te maken.. Mochten je servers een HA paar zijn dan kan je jezelf ook afvragen of het uitmaakt dat 1 server kapot gaat. Wil je om 3 uur s'nachts worden wakker gebeld voor zo'n melding terwijl de 2de bak het alweer keurig heeft overgenomen?

Uiteraard is dat afhankelijk van de omgeving waar je in terecht komt. Maar bijvoorbeeld bij ons (met Zabbix) hebben wij de alerts als volgt:

- Informational: mogen vanzelf sprekend zijn. Dit zijn interfaces die iemand enabled bijvoorbeeld.
- Warning: Een interface dat up / down gaat. Een processor die wat hoger begint te draaien.
- Average: Hier komen de PSU's van jou binnen. Deze foutmelding is wat belangrijker dan een warning.
- High: Iets is onbereikbaar maar de service heeft (nog) geen impact
- Disaster: Service impacting. Een HA cluster valt uit, een VIP op de loadbalancer is down etc.

Mensen zijn gelijk, maar sommige zijn gelijker dan andere | Humans need not apply


  • unezra
  • Registratie: Maart 2001
  • Laatst online: 07:45

unezra

Ceci n'est pas un sous-titre.

Overigens wel een ongelooflijk nadeel van Zabbix:
Het is niet multi-master (ook niet multi-proxy in de zin van HA proxies).

Wil je Zabbix zelf HA maken, moet je dat doen op je infra of op OS-niveau, Zabbix zelf kan het niet.

Het is een prima pakket, maar daar kan het toch nog iets leren van de grote (en gruwelijk dure) zuiver commerciële pakketten van HP en IBM. (Alleen zijn die weer dusdanig duur, dat ik me afvraag wat voor organisatiegrootte je anno 2019 nodig hebt om ze te rechtvaardigen.)

Ná Scaoll. - Don’t Panic.


  • burne
  • Registratie: Maart 2000
  • Niet online

burne

Mine! Waah!

unezra schreef op vrijdag 14 juni 2019 @ 20:48:
Overigens wel een ongelooflijk nadeel van Zabbix:
Het is niet multi-master (ook niet multi-proxy in de zin van HA proxies).

Wil je Zabbix zelf HA maken, moet je dat doen op je infra of op OS-niveau, Zabbix zelf kan het niet.
Wij hebben nagios vervangen door shinken en thruk, en dat is triviaal HA te maken. En met de juiste skin lijkt het nog net (oude) nagios ook.

I don't like facts. They have a liberal bias.


  • True
  • Registratie: April 2011
  • Niet online

True

Dislecticus

Yariva schreef op vrijdag 14 juni 2019 @ 16:40:
Om de boel nog even lastiger te maken.. Mochten je servers een HA paar zijn dan kan je jezelf ook afvragen of het uitmaakt dat 1 server kapot gaat. Wil je om 3 uur s'nachts worden wakker gebeld voor zo'n melding terwijl de 2de bak het alweer keurig heeft overgenomen?
Ik denk dat dit ook compleet ligt aan de oplossing, ik vertrouw niet blindelings op HA failover bijvoorbeeld, als ik geen accurate applicatietests heb wil ik zelf wel even om 3u 's nachts kijken. Liever dan dat ik om 9u 's ochtends op werk met een high zit omdat de failover goed gegaan is maar de applicaties niet of half draaien voor inmiddels al een paar uur.

Acties:
  • +1Henk 'm!

  • Freeaqingme
  • Registratie: April 2006
  • Laatst online: 16:16
True schreef op zaterdag 15 juni 2019 @ 00:38:
[...]


Ik denk dat dit ook compleet ligt aan de oplossing, ik vertrouw niet blindelings op HA failover bijvoorbeeld, als ik geen accurate applicatietests heb wil ik zelf wel even om 3u 's nachts kijken. Liever dan dat ik om 9u 's ochtends op werk met een high zit omdat de failover goed gegaan is maar de applicaties niet of half draaien voor inmiddels al een paar uur.
Zeg even dat 't om web servers gaat. Dan monitor je primair gewoon de website zelf natuurlijk of die het (nog) doet. Als dan 1 van je 3 web servers er uit ligt maakt dat niet uit, maar als 2 van de 3 web servers er uit liggen wil je dat vermoedelijk wel direct weten om 3 AM.

No trees were harmed in creating this message. However, a large number of electrons were terribly inconvenienced.



Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee