• ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Het is een veel terugkerend onderwerp op GoT: Hoe zorg je als systeem- of netwerkbeheerder ervoor, dat je op de hoogte bent van alles wat er gebeurt op je netwerk? Monitoringsystemen zorgen ervoor dat er geen probleem meer aan je aandacht ontsnapt. Eén probleem: welk systeem kies je? Er is een groot aantal van zulke systemen, zowel open-source als betaald. Eén van de meest populaire systemen is Nagios.

Wat is Nagios :?
Nagios is géén monitoringsysteem. Nagios is een 'scheduling and notifications framework'. Dit houdt in dat Nagios van zichzelf geen enkele controle kan uitvoeren. Wel kan Nagios scripts met controles plannen, en een notificatie versturen als de uitkomst van een script wel of niet aan een vooropgestelde waarde voldoet.

Wat zijn de voor- en nadelen :?
De voordelen van de benadering van de makers van Nagios, zijn legio. Door de modulaire opzet is alles mogelijk, zolang het is te scripten. Nagios zorgt vervolgens voor het plannen van de scripts, en het notificeren als dat nodig is. Dit is ook gelijk een nadeel: out-of-the-box kan Nagios vrij weinig, er moet eerst in de configs gedoken worden en eventueel wat gescript worden voor het systeem daadwerkelijk gebruikt kan worden. Hierdoor is de leercurve vrij steil. Als je echter eenmaal in de materie zit, zijn de mogelijkheden eindeloos: je kunt allerlei verschillende systemen controleren, zowel via SNMP als door middel van remote checks. Zo kan er gecontroleerd worden op vrije schijfruimte, processorload, netwerkload, lopende services of processen, etc. Alarmeren kan, door de modulaire opzet, ook op alle denkbare manieren. Via een mail, SMS, semafoon, net send commando, RSS berichten, IM-berichten, etc.

Waar vind ik meer info :?
Begin eens met het lezen van de documentatie op http://www.nagios.org. Eventueel kun je een kant-en-klare VMWare Image downloaden om mee te spelen. Ook op 'ouderwets' papier is genoeg te vinden: Bol.com biedt ondere andere dit boek, waar ik veel informatie uit heb kunnen halen.
Als je op zoek bent naar scripts voor het monitoren van bepaalde zaken, kun je terecht op http://www.nagiosexchange.org. Hier worden scripts voor allerhande systemen uitgewisseld. Ook imagepacks voor het opleuken van de grafische interface vindt je hier.

Waarom dit topic :?
Er is op GoT weinig te vinden over Nagios. Zoeken op Nagios levert een hoop topics op waarin het pakket wordt aanbevolen, maar echte hands-on ervaringen ontbreken. Daarnaast bleek ondere andere uit Systeembeheerders en hun problemen - deel 21 dat er behoefte was aan de mogelijkheid om scripts uit te wisselen en ervaringen te delen. Vandaar dit topic: laat weten of en hoe je Nagios gebruikt, waarom en wat voor checks je uitvoert. Geef tips met betrekking tot de configuratie, of geef feedback op wat anderen in te brengen hebben.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
TS Trapt af :)

Ik ben Nagios in gaan zetten als eerste échte monitoringsysteem binnen ons bedrijf. Wij zijn een middelgroot automatiseringsbedrijf, die de volledige IT voor onze klanten in het MKB verzorgen.
Op dit moment monitort mijn Nagios zo'n 126 services op een stuk of 27 hosts, aangezien ik eerst 'klein' aan het testen ben. Op de hosts, momenteel met name windows-servers, controleer ik op dit moment op vrije schijfruimte, processorload, geheugengebruik, etc. Daarnaast controleer ik de status van Exchange Services, of een Information Store ook daadwerklijk gemount is, controleer ik of de processen van de Virusscanner (on access scanner etc.) aktief zijn, en bij een enkele klant of de blackberry services nog draaien. Alarmeren gebeurt op dit moment nog uitlsuitend per mail, maar ik ga binnenkort testen met alarmering via SMS via Mollie. Hier is een script voor te vinden op nagiosexchange, die via een HTTP-Api de SMS kan versturen. Daarnaast ga ik deze week nog SNMP implementeren om onze Cisco routers in de gaten te houden.
Volgende stap is monitoren van onze backend (aantallen mails in de queue, bereikbaarheid van webservices). Als alles naar wens draait, ga ik het spul verhuizen van de testbak waar het nu opstaat, naar een virtuele installatie op onze ESX doos.

[Voor 97% gewijzigd door ralpje op 19-07-2008 23:17]

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • rimpeldinky
  • Registratie: Mei 2002
  • Laatst online: 27-06 10:30
ik ben op de zaak nu ook aan het testen met nagios, we gebruiken nu HPSIM en Open-audit.

- hpsim vanwege de mail-als-er-iets-down-gaat functie (welke veels te veel false positives geeft waardoor we meldingen al beginnen te negeren)
- openaudit omdat deze 2maaldaags alle workstations controleert op schijfruimte, ingelogde user en geinstalleerde applicaties

we hebben nu behoefte aan meer informatie van onze 25 servers, het is wat moeilijk om elke ochtend van alle machines met de hand de schijfruimte te checken, logs te controleren etc. in de praktijk gebeurt dit dus niet of een server per dag.

ik heb er nu (naast de localhost) 1 server (onze testmachine, win2k3) en een workstation instaan (mijn eigen workstation) de scripts monitoren op dit moment:

host alive (ping)
cpu (max 80)
mem (max 80)
hdd (max 90%)
process: (explorer.exe)

ik wil het deze week uit gaan breiden naar een 10tal niet-prio servers (aantal spares etc) en dan wil ik gaan experimenteren met andere scripts (exchange store, status van onze mailmarshal server etc)

wat ik me nog afvraag, moet ik echt voor elke server elke service aangeven? of kan ik bij een service check meerdere hostnames opgeven?

dus moet het zo:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
define service{
    use         generic-service
    host_name           winserver
    service_description CPU Load
    check_command       check_nt!CPULOAD!-l 5,80,90
    }

define service{
    use         generic-service
    host_name           winserver1
    service_description CPU Load
    check_command       check_nt!CPULOAD!-l 5,80,90
    }

of kan ik wegkomen met:

code:
1
2
3
4
5
6
define service{
    use         generic-service
    host_name           winserver, winserver1
    service_description CPU Load
    check_command       check_nt!CPULOAD!-l 5,80,90
    }

*burp*


  • Robbels
  • Registratie: September 2004
  • Laatst online: 08-06 23:04
http://www.nl.bol.com/is-...005984521&Section=BOOK_EN

bij deze de link voor versie 3 van Nagios.
Ik wil deze tool ook gaan opzetten als eerste voor onze grootste klant +- 100 computers in totaal met Cisco apparatuur. Vervolgens als dit lekker draait wil ik het gaan uitrollen als tool waarmee we onze klanten koppelen aan 1 centrale Nagios server op deze manier kunnen we ineens Proactief gaan werken ipv plijsters plakken!

Bedankt voor dit topic ik ga dit zeker kunnen gebruiken en zal het braaf volgen.

  • rimpeldinky
  • Registratie: Mei 2002
  • Laatst online: 27-06 10:30
Robbels schreef op maandag 21 juli 2008 @ 09:03:
http://www.nl.bol.com/is-...005984521&Section=BOOK_EN

bij deze de link voor versie 3 van Nagios.
Ik wil deze tool ook gaan opzetten als eerste voor onze grootste klant +- 100 computers in totaal met Cisco apparatuur. Vervolgens als dit lekker draait wil ik het gaan uitrollen als tool waarmee we onze klanten koppelen aan 1 centrale Nagios server op deze manier kunnen we ineens Proactief gaan werken ipv plijsters plakken!

Bedankt voor dit topic ik ga dit zeker kunnen gebruiken en zal het braaf volgen.
bij comcol is de versie 3 een euro goedkoper zag ik :+ zat er net naar te kijken inderdaad :)

*burp*


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
rimpeldinky schreef op maandag 21 juli 2008 @ 08:53:
of kan ik wegkomen met:

code:
1
2
3
4
5
6
define service{
    use         generic-service
    host_name           winserver, winserver1
    service_description CPU Load
    check_command       check_nt!CPULOAD!-l 5,80,90
    }
Dit kan.
Ik maak per klant een folder, met daarin een windows.cfg, switch.cfg en linux.cfg.
In de windows.cfg specificeer ik verschillende servers (hostnames), en vervolgens geef ik per service aan welke host daarin meegenomen wordt.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • rimpeldinky
  • Registratie: Mei 2002
  • Laatst online: 27-06 10:30
Dat is mooi meegenomen, wij willen het hier intern gaan gebruiken, 1 klant dus maar. (misschien toch dat boek maar bestellen, kan goed van pas komen)

*burp*


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Alleen moet je er even om denken dat je hostnames scheidt met een komma zonder spatie, bedenk ik me net. Ging ik de eerste keer ook mee in de fout, waarna ik tien minuten aan het zoeken ben geweest wat het probleem was :)

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • rimpeldinky
  • Registratie: Mei 2002
  • Laatst online: 27-06 10:30
wat is volgens iedereen hier de beste manier om het op multiple servers "tegelijk" te deployen (en dan bedoel ik de algemene services welke standaard in check_nt zitten)

ik pak de zip uit, vervang de ini door een door mij aangepaste (alles zit er in alleen is uitgecomment) uncomment het nodige en pas uiteindelijk de cfg op de nagios bak aan, dit lijkt mij de beste manier?

*burp*


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Ik heb één standaard INI, die ik overal inzet. Dus ik kopiëer die map naar de betreffende server, doe ff de service installeren en starten, ga vervolgens de config op de nagios bak zelf aanpassen. That's it.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

Hier nog een tevreden Nagios gebruiker, zowel op 't werk als de hobbyplek.
Op het werk heb ik er zelf weinig mee te maken, maar weet dat het draait voor monitoring op verschillende bij klanten.
Op de hobbyplek heb ik het zelf van scratch geinstalleerd en geconfigureerd, had het nog nooit zelf gebruikt of gezien en de 'steile leercurve' in de topicstart kan ik dan ook beamen.
Zeker omdat ik ook niet zo'n sterke Linux gebruiker ben/was.
In het begin zoek je jezelf het schompes naar wat je waar hoe ergens in moet zetten om iets voor elkaar te krijgen. Maar na eenmaal overal de vinger op gelegd te hebben, begint het mooi te worden en ga je extra wensen krijgen.

Momenteel check ik 9 Hosts waarvan 3 Virtueel (VMWare), in totaal 74 services.
2 Hosts zijn linux servers, waarvan 1 de VMWare server is.
1 Host staat op een andere lokatie en word via internet gechecked, is de tekst-tv server (kabelkrant).
En 1 van de hosts is onze website, waar ik standaard dingen als ping, dns en e-mail op check.
Alle windows hosts worden met NSClient++ gechecked.
Standaard dingen als CPU load, mem en diskspace uiteraard.
Maar omdat de hobbyplek in dit geval een lokale omroep betreft een paar specifieke dingen gemaakt:

1. Stilte detectie
Via check_tcp word aan een windows applicatie die elders aktief is gevraagd of de audio (aangeboden op de line-in van de geluidskaart) nog naar wens is.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
//template:
define service{
        name                            priority-service
        use                             generic-service
        max_check_attempts              2 
        normal_check_interval           1
        retry_check_interval            1
        register                        0
        contact_groups                  admins,admins-sms
        notification_interval           120
        }

//real service:
define service{
        use                             priority-service
        host_name                       vm-apps01
        servicegroups                   diversen
        service_description             Stiltedetectie
        check_command                   check_tcp!192.168.0.20!4749!"Audio status OK"!crit
        notifications_enabled           0
        }

Ik heb hier een priority-service gemaakt die na 2 checks (met 1 minuut pauze ertussen) al naar de hard critical state gaat, ik krijg dus een notificatie (per mail en SMS (zie hieronder) als het 2 minuten of langer stil is.
De betreffende windows app die de werkelijke controle uitvoerd, kan ik helaas niet met jullie delen.

2. SMS notificatie
Voor sommige checks wil ik direct op de hoogte worden gebracht, zoals stilte detectie. Stilte op de radio is fataal, dus moet er meteen actie worden ondernomen en dat mag niet afhankelijk zijn van het feit of ik toevallig m'n mailbox open heb staan of toevallig op hetzelfde moment ook een internet/e-mail storing is.
Ik stuur niet via Mollie aangezien daar een internet verbinding voor nodig is, is single point of faillure.
Met een Dynalink ISDN modem word de SMS gestuurd, met behulp van sms_client rechtstreeks naar de SMS Centrale van KPN. Hier is de single point of faillure de ISDN lijn, maar aangezien er ook altijd een e-mail word gestuurd, moeten er 2 dingen uitvallen wil deze melding helemaal niet bij mij aankomen.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
// commands:
define command{
        command_name    notify-service-by-sms
        command_line    /usr/bin/sms_client -q $CONTACTPAGER$ '[$NOTIFICATIONTYPE$]: $SERVICEDESC$ is $SERVICESTATE$ $NOTIFICATIONCOMMENT$'
        }

define command{
        command_name    notify-host-by-sms
        command_line    /usr/bin/sms_client -q $CONTACTPAGER$ '[$NOTIFICATIONTYPE$]: $HOSTNAME$ is $HOSTSTATE$ $NOTIFICATIONCOMMENT$'
        }

// contact:
define contact{
        contact_name                    remco-sms
        use                             generic-contact
        alias                           Remco_k (sms)
        service_notification_period     24x7
        host_notification_period        24x7
        service_notification_options    u,c,r,f ; Warning Unknown Critical Recovered Flapping
        host_notification_options       d,u,r,f ; Down Recovered
        service_notification_commands   notify-service-by-sms
        host_notification_commands      notify-host-by-sms
        pager                           0612345678
        }


3. File checks
Ik doe diverse checks op file age en size, o.a. op de nieuws file (die elk uur word gedownload) en diverse herhaling bestanden.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
//command:
define command{
        command_name    check_file_age
        command_line    $USER1$/check_file_age -w $ARG1$ -c $ARG2$ -W $ARG3$ -C $ARG4$ -f $ARG5$
        }
//service:
define service{
        use                             local-service
        host_name                       playout
        service_description             Nieuws mp3
        servicegroups                   filechecks
        check_command                   check_file_age!4000!7200!2700000!2000000!/<path>/NovumNieuws/nieuws.mp3
       }

define service{
        use                             local-service
        host_name                       playout
        servicegroups                   filechecks
        service_description             H Woensdag-13
        check_command                   check_file_age!691200!777600!40000000!30000000!/<path>/herhaling/Woensdag-13.mp3
       }

Zo word ik op de hoogte gebracht mocht het download script van het nieuws of het copy script van de herhalingen onverhoopt falen.
Eveneens check ik hiermee backup scripts die de database van de website, tekst-tv en playout backuppen.

4. Check e-mail
Omdat binnenkomde e-mail (nieuws) voor onze redactie belangrijk is en onze webhoster een paar keer ernstige mail storingen heeft gehad, controleer ik met check_email_loop of de e-mail bezorging naar wens is.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
// command:
define command{
        command_name    check_email_loop
        command_line    $USER1$/check_email_loop.pl -from=nagios@vulmaarin.nl -to=check_mail@vulmaarin.nl -pophost=pop3.vulmaarin.nl -popuser=check_mail -passwd=***** -smtphost=localhost -lostwarn=3 -lostcrit=5 -pendwarn=5 -pendcrit=10 -maxmsg=20 -statfile=/<path>/check_email_loop.stat
        }

// service:
define service{
       use                     generic-service
       host_name               www.vulmaarin.nl
       servicegroups           diversen
       service_description     E-Mail loop
       check_command           check_email_loop
       retry_check_interval    10
       contact_groups          admins,admins-sms
       }

Notificatie per e-mail en sms, omdat e-mail wellicht helemaal niet werkt als er een storing is. :+
Werkt als volgt: Nagios start deze check elke 10 minuten, check_email_loop stuurt elke keer 1 e-mail naar de alleen daarvoor bestemde pop3 box, en onthoud de unieke code die hij mee heeft gegeven. Gelijkertijd kijkt hij in de pop3 box om te kijken of de vorige e-mail aan is gekomen, zo ja, dan is het goed, zo nee, dan is er nog een e-mail pending. Boven de 5 pending komt er een warning, boven de 10 een critical. Komt een later verstuurde e-mail eerder aan dan een eerder verstuurde e-mail, dan word de eerder verstuurde e-mail als lost aangemerkt, totdat deze alsnog binnenkomt. Bij 3 lost warning, bij 5 lost critical.
Maar omdat dit een geisoleerde mailbox betreft en we nu alleen maar weten dat de email wel werkt,maar nog steeds niet weten of de nieuws pop3 box het doet, doe ik ook hetvolgende:

5. Nieuws popbox check
Ik laat al het nieuws doorsturen naar een 2e geisolerde mailbox. Met check_pop3_minlimit controleer ik of er elke X uur minimaal een e-mail binnen is gekomen. (En dit is het enige punt waarop spam z'n toegevoegde waarde laat zien).
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
//command:
define command{
        command_name    check_pop3_minlimit
        command_line    $USER1$/check_pop3_minlimit.pl -u $ARG1$ -p $ARG2$ -h $ARG3$ -w $ARG4$ -c $ARG5$ $ARG6$
        }
//template:
define service{
        name                            mailbox-service
        use                             generic-service
        check_period                    24x7
        max_check_attempts              4
        normal_check_interval           360
        retry_check_interval            2
        contact_groups                  admins
        notification_options            w,u,c,r,f
        notification_interval           120        
        register                        0
        }

//service:
define service{
       use                     mailbox-service
       host_name               www.vulmaarin.nl
       servicegroups           diversen
       service_description     nieuws@vulmaarin.nl
       check_command           check_pop3_minlimit!nieuwsusername!password!www.vulmaarin.nl!0!0!-d
       }

Komt er nu 4 uur lang niets binnen, dan is dat reden voor een critical state.

6. Webcam check
Met check_http_result roep ik een PHP scriptje op wat de status terug geeft van de size en leeftijd van de webcam JPG. Normaal geeft hij 'Webcam status [OK]' en indien te oud of te klein, 'Webcam status [FAIL]'
code:
1
2
3
4
5
6
7
define service{
        use                     generic-service
       host_name               www.vulmaarin.nl
       servicegroups           onlinemediachecks
       service_description     Webcam jpg
       check_command           check_http_result!www.vulmaarin.nl!http://www.vulmaarin.nl/pathto/nagioswebcamcheck.php!"Webcam status [OK]"
        }


7. Netcast check
Programmamakers willen hun live gepresenteerde programma's ook weleens thuis luisteren en aangezien wij ze toch allemaal automatisch opnemen, kunnen we ze net zo goed publiceren naar een besloten gedeelte van onze website. Dat publiceren kan echter foutgaan en ook dat word gecontroleerd middels een soortgelijke contructie als de webcam check.
code:
1
2
3
4
5
6
7
define service{
        use                     generic-service
       host_name               www.vulmaarin.nl
       servicegroups           onlinemediachecks
       service_description     Netcast status
       check_command           check_http_result!www.vulmaarin.nl!http://www.vulmaarin.nl/pathtonetcast/nagiosnetcastcheck.php!"Netcast file status [OK]"
        }

nagiosnetcastcheck.php controleerd of meerdere bestanden bestaan in een bepaalde map, met een bepaalde size.

Ik had ook een check gemaakt die de shoutcast stream checked op 'up' state, maar die kan ik effe niet meer vinden... Kennelijk een keer verprutst ergens tijdens de leercurve. :P
Mocht ik die nog terugvinden of opnieuw maken, dan post ik 'm hier.
Is in ieder geval eveneens iets met check_http.
Edit: Inmiddels gedaan, zie: remco_k in "[Nagios] Ervaringen, scripts en tips"

Edit:
En as we speak gaat de check e-mail loop naar warning en straks richting error:
"WARNING: 0 mails on POP3, 0 mail(s) came back, 7 pending, 0 lost."

En de oorzaak is ook bekend:
bverwijs in "KPN ADSL email problemen"

[Voor 3% gewijzigd door remco_k op 01-08-2008 21:17]

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • paella
  • Registratie: Juni 2001
  • Laatst online: 22:21
Ik gebruik het ook, met alle checks hier al genoemd, maar zag hier nog niet de SSL-certificaat verloop-check genoemd.

[Voor 8% gewijzigd door paella op 21-07-2008 14:40]

No production networks were harmed during this posting


  • LoneWolf
  • Registratie: Oktober 1999
  • Laatst online: 19:09

LoneWolf

Just a Byte

ben er eens mee begonnen nagios is nieuw voor mij, het is inderdaad aardig (uit)zoekwerk.
Zabbix heb ik ook geinstalleerd, dat is wel makkelijker lijkt het.

Life is to short to mess with it... Mijn V&A


  • Robbels
  • Registratie: September 2004
  • Laatst online: 08-06 23:04
Nagios geinstalleerd nu mag het uitzoekwerk beginnen.
Ubuntu server met Nagios en 1 plugin zoals de manual beschrijft. Kortom hij monitort zichzelf nu al.

nu verder naar de windows machines.

  • -Skyhawk-
  • Registratie: Augustus 2001
  • Niet online
Hier nog een nagios gebruiker. Ik gebruik het nu ongeveer een maand.
Alleerst heb ik nagios geinstalleerd in combinatie met centreon.
Een soort schil om nagios heen zodat je de hardware en de services kunt toevoegen.
Alleen qua forum support viel dat mij erg tegen. En wat ik tegen kwam was vooral Frans. En als het Engels was, dan was het niet wat ik zocht.

Nu werk ik met nagios in combinatie met nagvis.
Met nagvis kun je een map, achtergrond omgeving tonen waardoor je snel kunt zien welke server waar er uit ligt. Deze gegevens haalt hij uit een sql database waar nagios de gegevens inzet aan de hand met een NDOUtils plugin.
NDOUtils allows you to export current and historical data from one or more Nagios instances to a MySQL database. Several community addons use this as one of their data sources.
Tevens is het me gelukt om een old skool nokio 6310i via een datakabel te connecten met nagios in combinatie met gnokii. Deze is alleen actief ingesteld na 18:00.
Maar dit is alleen voor de belangrijkste webservers.

De rest van de meldingen krijgen we overdag en savonds op de mail.

Om de webservers te monitoren gebruik ik het tooltje NSClient++. Deze heb ik als service geinstalleerd en de port open gezet en alleen voor een bepaald ip adres. Tevens voor de communicatie tussen Nagios en NSClient kun je een password instellen.

Wat mij nu nog leuk lijkt om er aan toe te voegen is PNP.
Daarmee kun je performance data omzetten naar grafieken.


Centreon
http://www.centreon.com/
Screenshots Nagvis
http://www.nagvis.org/screenshots
NSClient++
http://trac.nakednuns.org/nscp/
PNP Screenshots
http://www.pnp4nagios.org/pnp/screenshots

Meer plugin info.
http://www.nagios.org/download/addons/

Alleen wat mij nu nog dwars zit zijn de vele false meldingen. Dat er niet gecommuniceerd kan worden met de NSClient, en dat er timeouts zijn etc. Terwijl er in werkelijkheid niks aan de hand is. Ik heb al met de time checks zitte te spelen maar het heeft nog niet geholpen.
Iemand daar meer ervaring mee?

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Ik monitor dmv check_snmp_win.pl een aantal services.

We gebruiken het om een 55 (klanten)servers en 95 services te controleren. Een hoop servers alleen dmv pingen, een hoop anderen door algemene SBS-services, Exchange, Backup Exec, SQL server etc te controleren.

Een van de servers heeft (o.a.) check_command check_win!"MSSQL$BKUPEXEC", maar daar plakt Nagios om een of andere reden een extra $ achter? 'Status Information: "MSSQL$BKUPEXEC$" not active : CRITICAL'

Andere services met een $-teken erin gaan wel goed (nadat ik het command aangepast heb met -r erbij zodat hij geen regexp gebruikt maar gewoon letterlijk de servicenaam controleert). Iemand enig idee?

Edit: Ok, het ligt niet zozeer aan de $ in de naam, het is de laatste van de services in die check. Zet ik er iets anders neer (Met alleen AZ, az of spatie in de naam) dan gaat het ook fout 8)7
Edit2: :| Er moet dus een even aantal services met een $ in de naam gecontroleerd worden, anders zet hij er zelf nog een $ achteraan :| Hoe gaan we dat nu weer oplossen :P

Edit3: 1 item dubbel controleren en het aantal processen met 1 verlagen dmv -N did the trick...

Verder nog iets: hoe zorg ik dat ik niet overspoeld wordt door mail als onze internetverbinding eruit ligt waardoor hij de servers niet kan benaderen? Ik heb al ingesteld dat er pas mail komt als het na een 2e check (een minuut later) nog steeds niet werkt, maar er blijven een heleboel false negatives komen als er een keer onderhoud is aan de internetlijn (zoals gisterenavond).

[Voor 17% gewijzigd door Paul op 24-07-2008 17:14]

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Heb je parents ingesteld? Je zou een ping naar je public ip kunnen doen, en vervolgens voor alle klantlocaties die host als parent opgeven. Als je parent dan eruit ligt, zijn de andere services niet 'down' maar 'unavailable', en krijg je ook geen alarm.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • Mike2k
  • Registratie: Mei 2002
  • Laatst online: 30-06 12:23

Mike2k

Zone grote vuurbal jonge! BAM!

Als je nou met nagios wil beginnen maar niet precies waar, kijk dan eens naar groundwork.
http://www.groundworkopensource.com/

Het is in de core nagios met een door hun gebouwde web interface eromheen.
Er zitten ook allerlei voor geschreven checks in enzo voor bij NRPE, WMI, SSH enz...

Werkt heel goed moet ik zeggen...

You definitely rate about a 9.0 on my weird-shit-o-meter
Chuck Norris doesn't dial the wrong number. You answer the wrong phone.


Anoniem: 57365

Wat is Nagios :?
Nagios is géén monitoringsysteem. Nagios is een 'scheduling and notifications framework'. Dit houdt in dat Nagios van zichzelf geen enkele controle kan uitvoeren. Wel kan Nagios scripts met controles plannen, en een notificatie versturen als de uitkomst van een script wel of niet aan een vooropgestelde waarde voldoet.
Tja dit is ongeveer de definitie van elk monitoring systeem. Niets kan default iets, maar moet geconfigureerd worden.

Ik heb intussen ook met alle grote pakketten (hpov, tivoli, hardware tools: ibm director, dell open manage it, hpsim) en diverse kleinere (bijv. nagios/netsaint, gensys, hostmonitor) gewerkt en geef mij maar mom, juist omdat ik niet hoef te bedenken wat er allemaal geconfigureerd moet worden, maar wel de mogelijkheid heb om dat te doen.
overigens hoeft de ene tool de andere niet uit te sluiten. Zo draai ik nu mom, alle hardware tools (vnl voor inventory, mom geeft de hardware alerts wel) en hostmonitor (specifieke testen op bijv. oracle databases) samen.

ik heb intussen al 2 grote nagios omgevingen overgezet naar mom met opzienbarende resultaten. Veel relatief makkelijk te verhelpen problemen komen naar boven, waardoor de algehele stabiliteit van de omgeving omhoog gaat.

Heb je echter veel niet windows systemen, dan is mom/opsmgr misschien nog niet het beste idee, maar daar gaat ook verandering in komen.

[Voor 25% gewijzigd door Anoniem: 57365 op 24-07-2008 17:33]


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
Ik heb Nagios ook draaiende sinds een week of 2/3 op Fedora 9. Op zich draait het allemaal prima en ik ben er nog volop mee aan het testen en puzzelen hoe alles werkt.

Nu loop ik bijvoorbeeld tegen het probleem aan dat ik een simpele website zoals bijvoorbeeld www.nu.nl wil checken. Wat voor script gebruik je hiervoor?

Ik heb in /usr/local/nagios/etc/objects/ een nieuw bestand aangemaakt, genaamd http.cfg. In nagios.cfg heb ik hier ook een verwijzing naar gemaakt. In dit bestand (http.cfg) heb ik het volgende gedefinieerd:

(niet letten op verkeerde uitlijning e.d.)
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
define host{
                  use                     http-host
                  host_name          NUsite
                  address              62.69.179.208
                  }

define hostgroup{
                  hostgroup_name     http-hosts
                  alias                      Http Hosts
                  }

define service{
                  use                        generic-service
                  hostgroup_name     http-hosts
                  service_description  HTTP
                  check_command    check_http -w 5 -c 10 -h http://www.nu.nl
                  }


Ik krijg echter bij het controleren van de cfg files (command: /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg) 1 error, namelijk:
Error: Service check command 'check_http -w 5 -c 10 -h http://www.nu.nl' specified in service 'HTTP' for host "NUsite' not defined anywhere!

Waar doe ik iets verkeerd? heeft iemand anders misschien een werkend voorbeeld?

bij voorbaat dank!

  • Roamor
  • Registratie: Mei 2004
  • Niet online
Fastex schreef op donderdag 24 juli 2008 @ 17:09:
Als je nou met nagios wil beginnen maar niet precies waar, kijk dan eens naar groundwork.
http://www.groundworkopensource.com/

Het is in de core nagios met een door hun gebouwde web interface eromheen.
Er zitten ook allerlei voor geschreven checks in enzo voor bij NRPE, WMI, SSH enz...

Werkt heel goed moet ik zeggen...
Die gebruiken wij ook, en dan de kant-en-klare VM: http://www.groundworkopen...ity/downloads/vmware.html

Nog druk in de opstartfase overigens, maar we komen er wel. :)

  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

DVRIES schreef op vrijdag 01 augustus 2008 @ 10:45:
Waar doe ik iets verkeerd? heeft iemand anders misschien een werkend voorbeeld?
De foutmelding:
Error: Service check command 'check_http -w 5 -c 10 -h http://www.nu.nl' specified in service 'HTTP' for host "NUsite' not defined anywhere!
Zegt precies waar het op staat.
Je vergeet om een command te definen in commands.cfg (of waar dan ook):
code:
1
2
3
4
5
# 'check_http' command definition
define command{
        command_name    check_http
        command_line    $USER1$/check_http -I $HOSTADDRESS$ $ARG1$
}

Daarna is dit genoeg:
code:
1
2
3
4
5
define service{
        ...
        check_command                   check_http
        ...
}

[Voor 18% gewijzigd door remco_k op 01-08-2008 13:49]

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
remco_k, bedankt voor je input.

Ik heb het een en ander inderdaad gewijzigd en volgens mij controleert hij de url nu ook inderdaad maar ik loop tegen het probleem aan dat ik de server achter een proxy en diverse firewalls heb staan die best wel goed zijn afgesloten. Ik heb proxy gegevens, zou je dit ergens mee kunnen geven bij de check?


Het is namelijk zo dat er hier gebruik wordt gemaakt van een applicatie die zijn gegevens van en naar een externe url stuurt. Ik wilde dus die website monitoren wanneer deze down gaat, vandaar deze check.

[Voor 23% gewijzigd door DVRIES op 01-08-2008 15:09]


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Hmpz. Ik heb ff een vaag probleempje.

Ik probeer nagios via Mollie een SMS te laten versturen bij een alert.
Ik heb het standaard script voor mollie gepakt, en in de /libexec dir gezet.
Als ik vervolgens vanuit die dir
code:
1
./notify_sms -n NUMMER -m MELDING -s BEDRIJF -u USER -p PASS

Doe, waarbij nummer, melding, bedrijf, user en pass onze gegevens zijn, krijg ik netjes een SMS-je binnen. So far so good.

Vervolgens maak in commands.cfg een command definition:
code:
1
2
3
4
5
# 'notify-host-by-mollie' command definition
define command{
        command_name    notify-host-by-mollie
        command_line    $USER1$/notify_sms -n $CONTACTPAGER$ - m "$NOTIFCATIONTYPE$: $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$" -s BEDRIJF -u USER -p PASS
}


Vervolgens vul ik bij de templates.cfg in het template van de generic_contact de net aangemaakte command toe:
code:
1
host_notification_commands      notify-host-by-email,notify-host-by-mollie      ; send host notifications via email


In templates.cfg geef ik mijn contact, die generic_contact gebruitk als template, een 'pager' nummer.

Ik herstart nagios, en krijg geen foutmelding. Toch krijg ik geen alert via SMS bij een host-notification...
Kort gezegd: het script werk, want als ik hem handmatig uitvoer (met dezelfde paramaters als in de commands.cfg) gaat het goed.

Het ljikt er dus op dat ik iets fout doe in het aanmaken van de command. Ik zie in de logfiles wel dat de notificatie verstuurd wordt, maar ik kan geen logfiles vinden hierover. Waar moet ik zoeken?

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

DVRIES schreef op vrijdag 01 augustus 2008 @ 15:07:
Ik heb proxy gegevens, zou je dit ergens mee kunnen geven bij de check?
Check de help van check_http, in de libexec dir:
code:
1
2
3
4
5
6
7
./check_http -?
Usage: check_http -H <vhost> | -I <IP-address> [-u <uri>] [-p <port>]
       [-w <warn time>] [-c <critical time>] [-t <timeout>] [-L]
       [-a auth] [-f <ok | warn | critcal | follow>] [-e <expect>]
       [-s string] [-l] [-r <regex> | -R <case-insensitive regex>] [-P string]
       [-m <min_pg_size>:<max_pg_size>] [-4|-6] [-N] [-M <age>] [-A string]
       [-k string] [-S] [-C <age>] [-T <content-type>]

Of kijk hier even: http://nagiosplugins.org/man/check_http
Zo te zien geen specifieke proxy ondersteuning. Effe zoeken naar een check_http achtige plugin die dat wel heeft op nagiosexchange.org?
Edit:
Of beter nog, google, eerste hit: http://osdir.com/ml/netwo...ser/2003-01/msg00224.html
Toch wel proxy ondersteuning als ik het zo snel even zie.
ralpje schreef op vrijdag 01 augustus 2008 @ 16:53:
Ik probeer nagios via Mollie een SMS te laten versturen bij een alert.
Ik heb het standaard script voor mollie gepakt, en in de /libexec dir gezet.
Als ik vervolgens vanuit die dir
code:
1
./notify_sms -n NUMMER -m MELDING -s BEDRIJF -u USER -p PASS

Doe, waarbij nummer, melding, bedrijf, user en pass onze gegevens zijn, krijg ik netjes een SMS-je binnen. So far so good.
...
Ik herstart nagios, en krijg geen foutmelding. Toch krijg ik geen alert via SMS bij een host-notification...
Kort gezegd: het script werk, want als ik hem handmatig uitvoer (met dezelfde paramaters als in de commands.cfg) gaat het goed.
Ik gok op de bijna klassieke fout: als welke user voer je als test ./notify_sms uit?
Vast en zeker niet als de user nagios gok ik? ;)
doe 's:
code:
1
2
su nagios
./notify_sms -n NUMMER -m MELDING -s BEDRIJF -u USER -p PASS

Ik gok dat het dan niet werkt omdat de user nagios (te) beperkte rechten heeft.
In je /var/log messages vind je misschien meer info over het probleem.

Dergelijke user problemen ben ik ook vaak tegenaan gelopen. Onlangs nog toen ik SMART van de HD* en SD* devices wilde checken met nagios. (nadat mijn VMWare server op mysterieuze wijze down was gegaan, inmiddels meer dan een week geleden en toch geen enkel probleem vertoond nu.)

[Voor 12% gewijzigd door remco_k op 01-08-2008 21:06]

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

remco_k schreef op maandag 21 juli 2008 @ 13:48:
Ik had ook een check gemaakt die de shoutcast stream checked op 'up' state, maar die kan ik effe niet meer vinden... Kennelijk een keer verprutst ergens tijdens de leercurve. :P
Mocht ik die nog terugvinden of opnieuw maken, dan post ik 'm hier.
Is in ieder geval eveneens iets met check_http.
En zojuist heb ik de shoutchast check opnieuw gemaakt:

commands.cfg:
code:
1
2
3
4
5
# 'check_shoutcast' command definition
define command{
        command_name    check_shoutcast
        command_line    $USER1$/check_http -H $ARG1$ -I $ARG2$ -p $ARG3$ -A "Mozilla/4.0" -s "Server is currently up" -w 10 -c 20
        }

De -A (String to be sent in http header as "User Agent") is een essentiele toevoeging, omdat de shoutcast server je als een streamclient gaat zien als je dit niet doet. Dan word er dus audio naar check_http gestreamd en daar kan hij niets mee. Door "Mozilla/4.0" als user agent mee te geven kom je op de shoutcast webpagina terecht en kan je checken op de string "Server is currently up".
Wat vanzelfsprekend een critical word als check_http deze string niet tegenkomt op de website, wat dan impliceerd dat de stream down is.

De service zelf:
code:
1
2
3
4
5
6
define service{
       use                     generic-service
       host_name               <hostname>
       service_description     Shoutcast status
       check_command           check_shoutcast!<url-zonder-poortnummer>!<ipnummer-van-voorgaande-url>!<port>
        }

[Voor 4% gewijzigd door remco_k op 01-08-2008 21:16]

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
remco_k schreef op vrijdag 01 augustus 2008 @ 20:15:
[...]
Ik gok op de bijna klassieke fout: als welke user voer je als test ./notify_sms uit?
Vast en zeker niet als de user nagios gok ik? ;)
doe 's:
code:
1
2
su nagios
./notify_sms -n NUMMER -m MELDING -s BEDRIJF -u USER -p PASS

Ik gok dat het dan niet werkt omdat de user nagios (te) beperkte rechten heeft.
In je /var/log messages vind je misschien meer info over het probleem.
Ik testte het inderdaad als root, maar ook met een su nagios komt m'n test sms-je gewoon aan.
Als ik /var/log messages controleer, zie ik gewoon de notificatie staan, en verder geen foutmelding:
code:
1
Aug  1 16:31:27 monitoring nagios: HOST NOTIFICATION: ralph;dw01;CUSTOM (UP);notify-host-by-mollie;PING OK - Packet loss = 0%, RTA = 16.05 ms;Ralph Eckhard;blaat


Wel leuk om te zien hoe je Nagios bij Radio Stad Montfoort inzet trouwens, geeft mij ook weer wat leuks om me op te richten ;)

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

ralpje schreef op vrijdag 01 augustus 2008 @ 22:49:
[...]
Ik testte het inderdaad als root, maar ook met een su nagios komt m'n test sms-je gewoon aan.
Als ik /var/log messages controleer, zie ik gewoon de notificatie staan, en verder geen foutmelding:
code:
1
Aug  1 16:31:27 monitoring nagios: HOST NOTIFICATION: ralph;dw01;CUSTOM (UP);notify-host-by-mollie;PING OK - Packet loss = 0%, RTA = 16.05 ms;Ralph Eckhard;blaat
En als je als user nagios het script aanroept vanuit een ander pad met het volledige pad ervoor?
(zoals nagios dat doet)
Zoiets:
code:
1
./usr/local/nagios/libexec/stuur_ralpje_nu_een_sms
Wel leuk om te zien hoe je Nagios bij Radio Stad Montfoort inzet trouwens, geeft mij ook weer wat leuks om me op te richten ;)
Yep, ben het ook uit noodzaak gaan doen.
Steeds vaker merkte ik dat ik niet op tijd zelf achter storingen kwam die al een tijdje liepen. (Ik heb ook een leven met vrouw en 2 kinderen, en werk en nog andere hobbies...)
Meestal had een storing dan al effect op de uitzendingen en dat moeten we niet hebben.
Om een voorbeeld te geven: het is me een keer overkomen dat het nieuws een volle dag niet meer werd bijgewerkt (computer die dat download->dood), dus de hele dag hetzelfde nieuws beginnent met "Goedemorgen".
Je zou denken dat programmamakers dat doorhebben, maar die staan dan buiten een peuk te roken dus horen dat hele nieuws niet. :)
Toen me dat was overkomen was ik het zat. Nagios checked de file size en age van het nieuws.
Zodra die ouder word dan 2 uur (even extra marge voor een nietszeggend foutje) dan volgt er een SMS en e-mail notificatie.
Ook 'herhalings' bestanden worden gechecked door nagios en nog heel veel ander materiaal waar ik niet zelf dagelijks naar wil kijken of het nog wel werkt.
Het voelt nu een stuk geruster sins nagios de allerbelangrijkste zaken per SMS stuurt en de minder belangrijke zaken (die wel aandacht vereisen, maar niet direct) per mail stuurt.

Je mag weleens komen kijken... :)

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
remco_k schreef op zaterdag 02 augustus 2008 @ 16:24:
[...]
Je mag weleens komen kijken... :)
offtopic:
Voorlopig ff druk bezig met overgang naar ander play-out systeem hier :)


Ik zal zo 'ns kijken wat 'ie vanuit een ander pad doet, da's nog wel een goeie tip, thnx.

Edit: ook vanuit een ander pad (en gewoon ingelogd als Nagios) geen probleem. Ik ga 'ns kijken of ik dat scriptje al z'n output naar een logfiletje kan laten schrijven ofzo.

[Voor 20% gewijzigd door ralpje op 02-08-2008 20:12]

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

ralpje schreef op zaterdag 02 augustus 2008 @ 20:09:
offtopic:
Voorlopig ff druk bezig met overgang naar ander play-out systeem hier :)
offtopic:
Ah, gefeliciteerd... (neem ik aan). Dat kan inderdaad wat tijd vergen.

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
remco_k, nogmaals dank voor je toelichting en uitleg.

Ik heb vrijwel de hele tijd de nagios handleiding (pdf) open staan en probeer ook zoveel mogelijk via google en irc dingen uit te zoeken maar soms loop je tegen dingen aan waar je gewoon niet uitkomt. vandaar :D

Als ik bijvoorbeeld kijk naar die site die je als voorbeeld gaf.

Die jongen spreekt over de volgende command line:
check_http -H http://www.cnn.com -I proxyserveradress -p 8080

Wanneer ik dat aanpas in mijn http.cfg geeft nagios (bij config files vergelijken) gelijk de melding weer dat het nergens defined is.

Hoe zit het nu precies?

Nagios.cfg -> hoofdconfig file waarin je ook naar andere .cfg bestanden verwijst zoals ik doe met http.cfg.
bijvoorbeeld:
code:
1
cfg_file=/usr/local/nagios/etc/objects/http.cfg


commands.cfg -> hierin definieer je het commando, bijvoorbeeld:
code:
1
2
3
4
5
# &#8216;check_http&#8217; command definition
define command{
    command_name    check_http
    command_line        $USER1$/check_http &#8211;I $HOSTADRESS$ $ARG1$
    }


Vervolgens geef je dus in je eigen .cfg file (in mijn geval http.cfg) op:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# defining the host 
define host{
    Use     http-host
    host_name   Google
    address     66.249.91.103
    }
# defining the http-hosts group
Define hostgroup{
    Hostgroup_name  http-hosts
    alias           Http Hosts
    }
# defining the service
define service{
    use         generic-services
    hostgroup_name  http-hosts
    service_description HTTP
    check_command   check_http
    }


De host die ik gedefinieerd heb wordt verwezen naar http-host die in de templates.cfg staat.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Define host{
    name            http-host
    use         generic-host
    check_period        24x7
    check_interval      1
    retry_interval      1
    max_check_attempts  10
    check_command   check-host-alive
    notification_period 24x7
    notification_interval   30
    notification_options    d, r
    contact_groups      admins
    hostgroups      http-hosts
    register            0
    }


Waar voeg ik nu additionele opties (check_http -H http://www.cnn.com -I proxyserveradress -p 8080) toe aan mijn http_check command? in de http.cfg file? want zodra ik dat doe geeft hij gelijk een error dat het niet gedefinieerd is (zoals het voorbeeld hierboven).

Heb ik de links tussen de cfg files nog niet in de gaten of waar ga ik verkeerd.

bvd

Dennis.

EDIT
overigens, ik lees dat jij ook gebruik maakt van NSClient++. Deze geeft de informatie uitstekend door aan de server maar het programma crashed regelmatig. Telkens op CheckSystem.dll . Ik draai op alle clients een Windows XP Pro OS. Heb jij enig idee waarom deze crashed?

Ik heb dit programma trouwens in het register toegevoegd onder /windows/current version/run

[Voor 7% gewijzigd door DVRIES op 04-08-2008 10:25]


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

DVRIES schreef op maandag 04 augustus 2008 @ 10:22:
...
check_http -H http://www.cnn.com -I proxyserveradress -p 8080
commands.cfg -> hierin definieer je het commando, bijvoorbeeld:
code:
1
2
3
4
5
# &#8216;check_http&#8217; command definition
define command{
    command_name         check_http
    command_line         $USER1$/check_http &#8211;I $HOSTADRESS$ $ARG1$
    }
$HOSTADRESS$ is met 2 D's: $HOSTADDRESS$
Verder define je een command eventueel ook met de parameters die jij nodig denkt te hebben:
code:
1
2
3
4
5
# check_http command definition
define command{
    command_name         check_http
    command_line         $USER1$/check_http -H $HOSTADDRESS$ -I $ARG1$ -p $ARG2$
    }
Vervolgens geef je dus in je eigen .cfg file (in mijn geval http.cfg) op:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# defining the host 
define host{
    Use     http-host
    host_name   Google
    address     66.249.91.103
    }
# defining the http-hosts group
Define hostgroup{
    Hostgroup_name  http-hosts
    alias           Http Hosts
    }
# defining the service
define service{
    use         generic-services
    hostgroup_name  http-hosts
    service_description HTTP
    check_command   check_http
    }


De host die ik gedefinieerd heb wordt verwezen naar http-host die in de templates.cfg staat.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Define host{
    name            http-host
    use         generic-host
    check_period        24x7
    check_interval      1
    retry_interval      1
    max_check_attempts  10
    check_command   check-host-alive
    notification_period 24x7
    notification_interval   30
    notification_options    d, r
    contact_groups      admins
    hostgroups      http-hosts
    register            0
    }


Waar voeg ik nu additionele opties (check_http -H http://www.cnn.com -I proxyserveradress -p 8080) toe aan mijn http_check command? in de http.cfg file? want zodra ik dat doe geeft hij gelijk een error dat het niet gedefinieerd is (zoals het voorbeeld hierboven).

Heb ik de links tussen de cfg files nog niet in de gaten of waar ga ik verkeerd.
Klopt, want je had de parameters niet (goed) gedefineerd in de command.cfg file.
Parameters geef je dan als volgt op:
In mijn check_http command definition is $ARG1$ de -I en $ARG2$ de -p.
In jouw http.cfg kan je dan zeggen:
code:
1
2
3
4
5
6
define service{
    use         generic-services
    hostgroup_name  http-hosts
    service_description HTTP
    check_command   check_http!proxyserveradress!8080
    }

Parameters worden dus met een ! gescheiden, waar 'proxyserveradress' dus op de plek van $ARG1$ komt (de -I) en '8080' op de plek van $ARG2$ komt (de -p).
Ik zou overigens niet aan willen raden om dit specifieke command te maken met de naam check_http, maar b.v. met de naam check_http_via_proxy. Duidelijkheid gaat voor alles.

De manier waarop nu check_http_via_proxy is gedefineerd zorgt voor flexibiliteit omdat je per service zelfs een andere proxy server mee kan geven aan de check. Maar ja, als je proxyserver dan een keer wijzigd, moet je het weer op 10-tallen plekken aan gaan zitten passen.
Het kan ook zonder parameters met je proxyserver maar op 1 plek, in de command definition zelf:
code:
1
2
3
4
5
# check_http command definition
define command{
    command_name         check_http_via_proxy
    command_line         $USER1$/check_http -H $HOSTADDRESS$ -I proxyserver -p 8080
    }

In jouw http.cfg kan je dan zeggen:
code:
1
2
3
4
5
6
define service{
    use         generic-services
    hostgroup_name  http-hosts
    service_description HTTP
    check_command    check_http_via_proxy
    }
EDIT
overigens, ik lees dat jij ook gebruik maakt van NSClient++. Deze geeft de informatie uitstekend door aan de server maar het programma crashed regelmatig. Telkens op CheckSystem.dll . Ik draai op alle clients een Windows XP Pro OS. Heb jij enig idee waarom deze crashed?

Ik heb dit programma trouwens in het register toegevoegd onder /windows/current version/run
Ik heb nog -nooit- een gecrashde NSClient++ gehad en er draaien er een stuk of 5 hier waarvan 1 op een WinXP Pro, de rest W2K Pro.
Ik denk dat je hem niet goed hebt geinstalleerd, want ik heb nog nooit een registry key hoeven aanmaken. NSClient word geinstalleerd als service, die op autostart staat en moet kunnen interacten met het buroblad. Misschien moet je daar de installatie handleiding even voor bekijken wat je fout hebt gedaan.

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
remco_k, superbedankt voor de gedetailleerde uitleg.

Ik heb de check nu draaien (zonder vergelijkingsfouten in de config file) maar krijg responses dat de host down is. Ik ben er inmiddels achter dat de beheerder van ons netwerk hier (een derde partij) ICMP ping commando's heeft disabled op de firewall. Ik kan dus niet checken of een host up is aan de hand van een ping opdracht. Ik zal eens nadenken hoe ik dit op ga vangen. Ik heb al iets gelezen over een php script/pagina maken die je telkens opvraagd. Het volgende probleem is dan dat onze webservers ook weer door een andere partij beheerd worden...Ik zal me hier eens in verdiepen.

Wat betreft die NSClient++, ik heb het een en ander opgezocht en het blijkt dat het met de laatste "nightly build" beter zou moeten gaan. Ik heb nu dus een nighlty build versie op de clients draaien, ben benieuwd hoe dat gaat.

Nogmaals bedankt, het is me nu een stuk duidelijker geworden hoe de link ligt tussen config files.

Dennis.

  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
Volgende issue; geluid.

In Nagios v3 werkt het geluid niet meer in de webbrowser. Dit komt doordat Nagios een verkeerde MIME type aanroept (application/wav). Dit MIME type is nergens te downloaden en kan het geluid dus niet af worden gespeeld. Deze verwijzing dient te worden gewijzigd in bijvoorbeeld application/x-wave.

Ik heb een workaround geinstalleerd in FireFox(3) namelijk:
http://code.google.com/p/nagioschecker/

Hiermee kun je onderin de werkbalk van FF de status zien van je Nagios server en deze geeft ook een geluidsalarm af wanneer er zich een probleem voordoet.

Werkt op zich prima maar ik wil toch graag dat Nagios zelf geliud gaat maken omdat ik op sommige clients geen FF heb staan maar wel IE.

Daarvoor is er door iemand een patch geschreven die op de volgende pagina te verkrijgen is:

http://thread.gmane.org/g...ios.devel/5391/focus=5401

Nu komt het, ik ben dus vrij nieuw met Linux(Fedora 9) en Nagios (v3) e.d. en heb dus geen flauw idee hoe ik zo'n patch uitvoer of dien te compilen etc. Ik heb er al een aantal google searches op los gelaten maar kon geen duidelijk antwoord vinden.

Daarom is mijn vraag: is er hier iemand die hetzelfde probleem heeft als ik en deze heeft opgelost dankzij deze patch? (of als je gewoon weet hoe je een patch installeerd is het ook prima :) )

Een rechtstreekse link naar de patch (text/x-diff file):
http://cache.gmane.org//g...nagios/devel/5401-001.bin

Alle hulp is welkom, bvd!

Dennis.

  • renrom
  • Registratie: Augustus 2008
  • Laatst online: 11-06 16:02
Ik gebruik al een paar jaar nagios en nu in combinatie met pnp wat erg leuke informatie geeft

(http://www.pnp4nagios.org/pnp/start)

Inmiddels houden wij er ongeveer 270 servers mee in de gaten en plusminus 500 services.

Voor wat betreft het geluid, je kan heel simpel de tac.c (in de cgi directory) source aanpassen, zodanig dat zowel IE als FF het alarm afspeelt, heb dat zelf ook moeten doen.

EDIT:

Zoek in de (source) naar de regel die begint met (ben even te lui om de regel op te zoeken) :

printf("<object type=\"application

en maak daar van :

printf("<object type=\"application/x-mplayer2\" height=\"-\" width=\"0\">");

en compileer het opnieuw en het geluid doet het weer.

[Voor 27% gewijzigd door renrom op 08-08-2008 19:10]


  • DutchTSE
  • Registratie: Februari 2003
  • Niet online
edit:
Heb de 2 scripts samen gevoegd, lost ook het probleem op :)

[Voor 93% gewijzigd door DutchTSE op 18-08-2008 08:28]


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
renrom schreef op vrijdag 08 augustus 2008 @ 18:56:
Ik gebruik al een paar jaar nagios en nu in combinatie met pnp wat erg leuke informatie geeft

(http://www.pnp4nagios.org/pnp/start)

Inmiddels houden wij er ongeveer 270 servers mee in de gaten en plusminus 500 services.

Voor wat betreft het geluid, je kan heel simpel de tac.c (in de cgi directory) source aanpassen, zodanig dat zowel IE als FF het alarm afspeelt, heb dat zelf ook moeten doen.

EDIT:

Zoek in de (source) naar de regel die begint met (ben even te lui om de regel op te zoeken) :

printf("<object type=\"application

en maak daar van :

printf("<object type=\"application/x-mplayer2\" height=\"-\" width=\"0\">");

en compileer het opnieuw en het geluid doet het weer.
Sorry voor de late reactie, vakantie e.d.

Wat betreft het geluid, daar komt dus het probleem om de hoek kijken dat ik dus een newb ben op Linux gebied (zoals ik al aangaf :) ) ik zou eventueel die source code nog wel met een editor (welke adviseer je overigens?) aan kunnen passen maar dan opnieuw compileren e.d. dan houdt het voor mij op.... zou je mij hiermee op weg kunnen helpen?

Ik heb ondertussen pnp4nagios ook geinstalleerd en deels draaien. Het ziet er goed uit alleen geeft hij bij mij alleen per host de ping response tijden weer... waar kan ik opgeven dat hij ook een overzicht maakt van mijn cpu load, memory, etc?

De handleiding die aangeboden word op pnp4nagios.org is namelijk niet heel erg uitgebreid en duidelijk..


Afwachtende op je reactie.

  • paella
  • Registratie: Juni 2001
  • Laatst online: 22:21
Ik gebruik het (windows) tooltje ntray, die checkt gewoon de website en toetert verder lokaal. werkt prima.

No production networks were harmed during this posting


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
paella schreef op woensdag 20 augustus 2008 @ 15:28:
Ik gebruik het (windows) tooltje ntray, die checkt gewoon de website en toetert verder lokaal. werkt prima.
Ook handig inderdaad :D ik had al een andere workaround: http://code.google.com/p/nagioschecker/

deze kun je integreren in Firefox. Het is alleen echter zo dat ik ook op een willekeurige desktop de nagios webpagina wil kunnen openen en dus niet telkens op alle pc's hier een 3rd party tool wil installeren ;-)

  • Fragbeestje
  • Registratie: Maart 2002
  • Laatst online: 08:55
Ik gebruik hier sinds enkele maanden ook Nagios. Ben er ontzettend tevreden over want nu kan ik op voorhand al actie ondernemen ipv achteraf de boel te repareren.
2 Linux servers, 14 Windows servers, 8 printers en 12 switches worden er mee in de gaten gehouden.

Op de windows bakken gebruik ik ook NSClient++, en voor het overgrote deel zijn de standaard checks wel voldoende.
Echter op 1 bak heb ik het probleem dat er soms 2 instanties van een proces actief worden waar ik dus ook een alert voor wil genereren, want er mag er maar 1 draaien.
Ik heb al wat zitten rondneuzen in de check_nt manual en op nagiosexchange, maar ik geraak er niet uit.

Wat ik in de toekomst er nog aan wil toevoegen is een sensatronics senturion om de temperatuur van het serverhok in de gaten te houden zodat ie automatisch sms'jes kan bombarderen als de temperatuur te hoog oploopt. Kan er een andere tempsensor voor gebruiken ook, maar deze ziet er gewoon gelikt uit :9~

Mijn iRacing Profiel dus niet dat van jou, Jubby


  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Ik heb vroeger nog Nagios opgezet, zonder veel problemen.

Ik heb nu echter Nagios geïnstalleerd op een Ubuntu server, en ik ervaar ongelofelijk vreemd gedrag ...
Ik heb de quickstart guide vanop de site gevolgd (niet ge-apt-get).

Ik krijg echter bij elke klik andere resultaten.
Als ik gewoon de install doe en enkel de contactgegevens instel, dan krijg ik al vreemd gedrag.
Als ik naar Nagios surft, en ik klik op de pagina 'Service Detail', dan krijg ik initieel de volgende boodschap te zien:
code:
1
It appears as though you do not have permission to view information for any of the services you requested...


Ok lijkt een configuratieprobleem (alhoewel ik nog niks veranderd heb, gewoon de install scripts gedraaid). MAAARRRR... Als ik dan nog enkele keren klik op die 'Service Details' link, dan krijg ik plots wél de pagina te zien die ik verwacht. Bij de volgende klik weer niet. Enkele klikken later weer wél... Etc etc etc ...

Hetzelfde gedrag kreeg ik ook toen ik Nagios voor de eerste keer geïnstalleerd had (nu al paar keer opnieuw geprobeerd): alles netjes geconfigureerd, maar de 'Service Detail' pagina die overeen kwam met mijn instellingen zag ik maar heel nu en dan. De meeste keren kreeg ik de pagina te zien waarbij enkele checks niet gelukt waren en de checks ook slechts enkele uren geleden uitgevoerd waren. Bij elke klik kreeg ik andere resultaten ...

Zwaar gefrustreerd over Nagios...

Maar ik heb nu net de oplossing gevonden: blijkbaar draaiden er nog 2 andere nagios instanties met andere instellingen, en waren die aan het vechten om elk 'hun' pagina te tonen ...

Nu lijkt alles ok! Oef!

@Edit:

Vraagje wat ik nog niet gevonden heb:
Als je notification time enkel op overdag staat, en er gaat 's nachts een service down, wordt je dan 's ochtends gewaarschuwd? (Maw, als de issue nog steeds niet resolved is als de notification period weer ingaat, krijg je dan een notification?)

[Voor 8% gewijzigd door DieterVDW op 27-08-2008 18:11]


  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Heeft iemand nog tips voor het aanpassen van de webinterface?

Door het gebouw heen hangen hier 3 schermen die de hele dag status.cgi weergeven met de service problems. Dit was redelijk lelijk, maar met de Nuvola-skin ziet het er wat beter uit.

De basis is echter nog hetzelfde Ga je de bron bekijken dan is het een grote table-soup met her en der wat CSS. Stel ik bijvoorbeeld TABLE.infoBox op display: block; dan zie je de tabel niet meer, maar de inhoud ervan nog wel |:( Tevens staat dat ding in een table (zonder class oid) in een tr van 33% breed, dus de host status details of de service status details centreren is er niet bij.

Want: status.cgi is een gecompileerd iets, waardoor ik er dus niet fatsoenlijk in kan editten

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Ja de Nagios webinterface is behoorlijk afschuwelijk...

Ze hadden die CGI beter XML laten uitspuwen, en dan een mooie stylesheet en wat javascript eye-candy.
Zou erg lekker kunnen zijn... Jammer!

  • WoodY1121
  • Registratie: Oktober 2008
  • Laatst online: 16:01
Ik ben nu op stage ook bezig om nagios uit te rollen en het werkt naar behoren.
Maar ik heb een aantal vragen waar ik nog mee zit, en waar ik bij www.meulie.net niet echt antwoord op krijg:

1. NSclient++ is dat veilig genoeg voor monitoring van de servers van de klanten als het alleen beschermt is met een wachtwoord?

2. Ik wil dan per klant een apart "Hostgroup" maken voor de monitoring, welke files moet ik daarvoor gebruiken.
Zodat je bij "Host Detail" niet alleen windows-server krijgt, maar bijvoorbeeld "klant naam" en dan servers
wie er gemonitoort wordt

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Voor dat 2e moet je dan 'Hostgroup Overview' geruiken, 'Host Detail' kan bij mijn weten niet groeperen, ook al omdat een host in meerdere groepen kan zitten.

In welk bestand je dat doet moet je zelf weten, zolang je dat bestand (of de directory) maar include via nagios.cfg :) Wat voor jullie de makkelijkste / overzichtelijkste structuur is moet je zelf weten.

Wij hebben iig
/etc/nagios
+ objects
+ + templates (met daarin een custom commands.cfg, timeperiods.cfg etc)
+ + sbs (met daarin per klant een .cfg)
+ + urls (met daarin per website de we monitoren een .cfg)
+ + los (losse dingetjes die we ook monitoren maar geen groep vormen)

En dan in nagios.conf:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# Command definitions
cfg_file=/etc/nagios/commands.cfg

# Templates first:
cfg_dir=/etc/nagios/objects/templates

# Contacts:
cfg_file=/etc/nagios/objects/contacts.cfg
cfg_file=/etc/nagios/objects/contactgroups.cfg

# What to monitor:
cfg_dir=/etc/nagios/objects/urls
cfg_dir=/etc/nagios/objects/sbs
cfg_dir=/etc/nagios/objects/los

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • WoodY1121
  • Registratie: Oktober 2008
  • Laatst online: 16:01
Paul Nieuwkamp schreef op woensdag 15 oktober 2008 @ 12:51:
Voor dat 2e moet je dan 'Hostgroup Overview' geruiken, 'Host Detail' kan bij mijn weten niet groeperen, ook al omdat een host in meerdere groepen kan zitten.

In welk bestand je dat doet moet je zelf weten, zolang je dat bestand (of de directory) maar include via nagios.cfg :) Wat voor jullie de makkelijkste / overzichtelijkste structuur is moet je zelf weten.

Wij hebben iig
/etc/nagios
+ objects
+ + templates (met daarin een custom commands.cfg, timeperiods.cfg etc)
+ + sbs (met daarin per klant een .cfg)
+ + urls (met daarin per website de we monitoren een .cfg)
+ + los (losse dingetjes die we ook monitoren maar geen groep vormen)

En dan in nagios.conf:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# Command definitions
cfg_file=/etc/nagios/commands.cfg

# Templates first:
cfg_dir=/etc/nagios/objects/templates

# Contacts:
cfg_file=/etc/nagios/objects/contacts.cfg
cfg_file=/etc/nagios/objects/contactgroups.cfg

# What to monitor:
cfg_dir=/etc/nagios/objects/urls
cfg_dir=/etc/nagios/objects/sbs
cfg_dir=/etc/nagios/objects/los
bij map 'sbs' welke .cfg zet je er in?

  • DutchTSE
  • Registratie: Februari 2003
  • Niet online
WoodY1121 schreef op woensdag 15 oktober 2008 @ 11:47:
Ik ben nu op stage ook bezig om nagios uit te rollen en het werkt naar behoren.
Maar ik heb een aantal vragen waar ik nog mee zit, en waar ik bij www.meulie.net niet echt antwoord op krijg:

1. NSclient++ is dat veilig genoeg voor monitoring van de servers van de klanten als het alleen beschermt is met een wachtwoord?

2. Ik wil dan per klant een apart "Hostgroup" maken voor de monitoring, welke files moet ik daarvoor gebruiken.
Zodat je bij "Host Detail" niet alleen windows-server krijgt, maar bijvoorbeeld "klant naam" en dan servers
wie er gemonitoort wordt
1. indien je nagios server hetzelfde IP houd kun je in nsclient aangeven dat hij alleen naar *nagios IP* moet antwoorden.
2. de file hostgroups.cfg (in je etc directory)

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
WoodY1121 schreef op woensdag 15 oktober 2008 @ 13:28:
bij map 'sbs' welke .cfg zet je er in?
Hoezo? cfg_dir zegt "Lees alle .cfg-bestanden die in die dir staan".

De setup is niet perfect (moeten nog met dependencies aan de gang en zo) maar de huidige template .cfg bevat dit:
code:
1
2
3
4
5
6
7
define host{
        use             sbs-host
        host_name       ${hostname}
        alias           ${alias}
        address         ${ipadres of hostname}
        hostgroups      ${komma delimited lijst}
}
met als hostgroups dingen als sbs_exchange, sbs_avg7, sbs_avg8, sbs_backupexec, sbs_mssql_2000 en sbs_mssql_2005

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • WoodY1121
  • Registratie: Oktober 2008
  • Laatst online: 16:01
Hmm... volgens mij denk ik er moeilijker over dan dat het is...

Ik ga uit van jou situatie:

Ik maak in /etc/nagios een map met objects
In objects maak ik 2 mappen, genaamd: templates en servers (want site en los maken wij geen gebruik van)
In de map templates, kan ik als ik het goed bedenk de .cfgs wie nagios gebruikt kopieren naar deze map
In de map servers moet ik dan een klant.cfg aan maken? of kan ik windows.cfg renamen naar klant.cfg?

En dan in nagios.cfg moet ik dat include? maar moet ik dat onderaan het nieuw typen?

Ik hoop dat ik qua gedachten gang een beetje op de goeie richting zit.

  • WoodY1121
  • Registratie: Oktober 2008
  • Laatst online: 16:01
WoodY1121 schreef op woensdag 15 oktober 2008 @ 14:14:
Hmm... volgens mij denk ik er moeilijker over dan dat het is...

Ik ga uit van jou situatie:

Ik maak in /etc/nagios een map met objects
In objects maak ik 2 mappen, genaamd: templates en servers (want site en los maken wij geen gebruik van)
In de map templates, kan ik als ik het goed bedenk de .cfgs wie nagios gebruikt kopieren naar deze map
In de map servers moet ik dan een klant.cfg aan maken? of kan ik windows.cfg renamen naar klant.cfg?

En dan in nagios.cfg moet ik dat include? maar moet ik dat onderaan het nieuw typen?

Ik hoop dat ik qua gedachten gang een beetje op de goeie richting zit.
Heb dit maar eens geprobeerd, maar dit wil ook niet baten, krijg steeds weer de foutmelding dat alles duplicate is, ik denk omdat ik alle standaard .cfg's van nagios heb gekopieerd.

Of moet dat niks uit maken?

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Je denkt inderdaad veeeeel moeilijker dan dat het is :)

Kijk in nagios.cfg eens welke cfg_file en cfg_dir items er in staan. Die files (die genoemd staan achter cfg_file) en alle .cfg-bestanden in die dirs die genoemd staan achter een cfg_dir worden allemaal gelezen door Nagios om te bepalen wat hij moet doen.

Het staat je echt 100% vrij om dat in te delen zoals jij dat wilt. Als jij alles in 1 bestand wilt zetten dan voeg je een cfg_file=/etc/nagios/alles.cfg regel toe aan nagios.cfg en dump je in alles.cfg al je contacts, contactgroups, timedingen, commands, hosts, services, groups etc.

In de default configs staan al een aantal commands die erg nuttig kunnen zijn en waar je mee kunt beginnen, maar je moet nog vrij veel zelf doen.

Ik zou willen zeggen, als je niet uit de Nagios config komt kun je (of eigenlijk kan dat sowieso wel :) Ik weet alleen niet wat dat met huidige painstakingly in elkaar gezette configs doet) NagiosQL gebruiken, dan heb je een grafische interface om Nagios in te stellen, maar dan moet je dus weer andere dingen zien te configureren (Apache, MySQL etc etc).

Ik heb bij het opzetten van Nagios deze howto gevolgd: http://www.maxsworld.org/index.php/how-tos/nagios
Die gaat behoorlijk duidelijk in op de dingen die je zelf nog moet doen aan de configuratie.

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • WoodY1121
  • Registratie: Oktober 2008
  • Laatst online: 16:01
Paul Nieuwkamp schreef op donderdag 16 oktober 2008 @ 10:31:
Je denkt inderdaad veeeeel moeilijker dan dat het is :)

Kijk in nagios.cfg eens welke cfg_file en cfg_dir items er in staan. Die files (die genoemd staan achter cfg_file) en alle .cfg-bestanden in die dirs die genoemd staan achter een cfg_dir worden allemaal gelezen door Nagios om te bepalen wat hij moet doen.

Het staat je echt 100% vrij om dat in te delen zoals jij dat wilt. Als jij alles in 1 bestand wilt zetten dan voeg je een cfg_file=/etc/nagios/alles.cfg regel toe aan nagios.cfg en dump je in alles.cfg al je contacts, contactgroups, timedingen, commands, hosts, services, groups etc.

In de default configs staan al een aantal commands die erg nuttig kunnen zijn en waar je mee kunt beginnen, maar je moet nog vrij veel zelf doen.

Ik zou willen zeggen, als je niet uit de Nagios config komt kun je (of eigenlijk kan dat sowieso wel :) Ik weet alleen niet wat dat met huidige painstakingly in elkaar gezette configs doet) NagiosQL gebruiken, dan heb je een grafische interface om Nagios in te stellen, maar dan moet je dus weer andere dingen zien te configureren (Apache, MySQL etc etc).

Ik heb bij het opzetten van Nagios deze howto gevolgd: http://www.maxsworld.org/index.php/how-tos/nagios
Die gaat behoorlijk duidelijk in op de dingen die je zelf nog moet doen aan de configuratie.
Bedankt voor de tip!, die site is handig

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Paul Nieuwkamp schreef op dinsdag 14 oktober 2008 @ 15:26:
Heeft iemand nog tips voor het aanpassen van de webinterface?
Ik ben er wel uit. We bekijken met name de Service Problems pagina (die hangt her en der ook op 22" fullscreen zonder menu door het gebouw heen), en ik heb met name een hoop 'zooi' verwijderd.

Ik heb onderaan de status.css de volgende styles gezet:
Cascading Stylesheet:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
.infoBox { display: none; }
.infoBoxTitle { display: none; }
.linkBox { display: none; }
.filter { display: none; }
.filterTitle { display: none; }

.hostTotals { display: none; }
.hostTotalsUP { display: none; }
.hostTotalsDOWN { display: none; }
.hostTotalsUNREACHABLE { display: none; }
.hostTotalsPENDING { display: none; }
.hostTotalsPROBLEMS { display: none; }

.serviceTotals { display: none; }
.serviceTotalsOK { display: none; }
.serviceTotalsWARNING { display: none; }
.serviceTotalsUNKNOWN { display: none; }
.serviceTotalsCRITICAL { display: none; }
.serviceTotalsPENDING { display: none; }
.serviceTotalsPROBLEMS { display: none; }

TABLE.status { position: relative; top: -45px; }
.statusTitle { display: none; }
.itemTotalsTitle { display: none; }

Nu zijn dus alleen de table header en eventuele problemen zichtbaar :)

Verder heb ik aan de services icoontjes gehangen (plaatjes in de {html}/images/logos/ dir zetten)
Met de volgende code doe je dat:
code:
1
2
3
4
5
define serviceextinfo{
        hostgroup               sbs_general_en_standalone,sbs_general_en,sbs_general_nl
        service_description     Algemene processen
        icon_image              sbs_services.gif
}

Service description is ook echt de omschrijving, niet de naam ervan. Tevens moeten alle hosts in een hostgroup ook daadwerkelijk die service hebben, anders komt daar weer een foutmelding van. Je kunt helaas niet hostgroup als je alle Excahnge-processen een icoontje wilt geven 'alles' opgeven als hostgroup en dit dan dmv de service filteren.

Nu aan BODY.status nog een achtergrondplaatje knopen of zo en ik vind het mooi genoeg :P

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • WoodY1121
  • Registratie: Oktober 2008
  • Laatst online: 16:01
Heb het voor elkaar om een andere hostgroup aan te maken.
maar dan wil ik er nog 1 maken, ik voer alles in, maar dan komt de server wie er in komt te staan in de eerste hostgroup wie ik heb gemaakt en in de 2de, hoe kun je dit voorkomen?, want ze zijn niet allebei member van de 2 hostgroup

*************opgelost**************************

Heb even een nieuw host template aangemaakt in hosts.cfg, en dan de hostgroups een andere naam gegeven

[Voor 21% gewijzigd door WoodY1121 op 16-10-2008 14:45]


  • serienummer
  • Registratie: November 2006
  • Laatst online: 06-03 19:28
Die nagios Mozilla plugin werkt alleen als je de statusmap.cgi ook werkend hebt. en dat is in nagios 3.0.3 een latig probleem...
Jammer ik had hem graag willen hebben.

Ik krijg de foutmelding:
The requested URL /nagios/cgi-bin/statusmap.cgi was not found on this server.

misschien iemand een idee?

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Bestaat http://(server)/nagios/cgi-bin/status.cgi wel? Dan zou http://(server)/nagios/cgi-bin/statusmap.cgi ook moeten bestaan.

Mogelijk de verkeerde URL ingevuld?

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • saleattweak
  • Registratie: April 2006
  • Laatst online: 23-05-2019
Ik weet niet of ik deze vraag hier kan stellen maar zijn er ook gebruikers welke nagios hebben draaien met snmp trap's en de mibs van Compaq/HP ?

Ik heb namelijk een probleempje met snmptt welke de conversie doet van een trap, deze levert namelijk bij disk problemen bv alleen de status op en de informatie om welke disk het betreft negeert hij gewoon. Kortom ik mis gewoon een stukje omschrijving/informatie bij de trap conversie die snmptt doet.

Iemand hier die daar ervaring mee heeft en enig idee heeft hoe ik snmptt wel zo ver krijg dat hij deze ook meelevert aan zijn output ?

  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Wellicht niet de info die je zoekt, maar ik haal de info met nrpe uit de hpacucli.exe (de Array Configuration Utility Command Line) via een simpel scriptje van nagiosexchange.org. Daar krijg ik wél de extra info.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • saleattweak
  • Registratie: April 2006
  • Laatst online: 23-05-2019
ralpje schreef op vrijdag 17 oktober 2008 @ 17:09:
Wellicht niet de info die je zoekt, maar ik haal de info met nrpe uit de hpacucli.exe (de Array Configuration Utility Command Line) via een simpel scriptje van nagiosexchange.org. Daar krijg ik wél de extra info.
Nee helaas, ik wil perse snmp traps in nagios schieten, dit geeft mij de mogelijkheid om de standaard meegeleverde tools van hp te gebruiken op de servers van hp (hpasm (debian) en hp insight manager ? voor windows). En natuurlijk later uitbreiden met andere apparatuur (ups/switch etc). Ik wil graag zo veel mogelijk hardware onafhankelijk zijn dus als ik een dell/fsc/sun of wat dan ook neer zet wil ik geen scripjes hoeven te maken welke de juiste info gaan opleveren. Hun eigen tools installeren om snmp traps te versturen is een stuk minder tijdrovend aangezien ik dan al een nagios server heb staan waar ik op eenvoudige wijze alleen de desbetreffende mib moet toevoegen.

De array configuration/disk was slechts een voorbeeld. Aangezien de snmp trap wel op de nagios machine aankomt maar bij de afhandeling informatie verliest denk ik dat ik wat verkeerd doe alleen heb ik nu nog even geen idee wat ? Iemand een idee ?

  • Tomsworld
  • Registratie: Maart 2001
  • Niet online

Tomsworld

officieel ele fan :*

WoodY1121 schreef op woensdag 15 oktober 2008 @ 11:47:
Ik ben nu op stage ook bezig om nagios uit te rollen en het werkt naar behoren.
Maar ik heb een aantal vragen waar ik nog mee zit, en waar ik bij www.meulie.net niet echt antwoord op krijg:

1. NSclient++ is dat veilig genoeg voor monitoring van de servers van de klanten als het alleen beschermt is met een wachtwoord?
Misschien een tip: je hebt ook nc_net die wat recenter is en wat meer mogelijkheden heeft voor windows servers.

Hij is wel syntax compatibel met check_nt

http://shatterit.com/nc_net/

"De kans dat een snee brood op een nieuw tapijt valt met de beboterde zijde onderaan, is recht evenredig met de prijs van het tapijt"


  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • serienummer
  • Registratie: November 2006
  • Laatst online: 06-03 19:28
Paul Nieuwkamp schreef op vrijdag 17 oktober 2008 @ 14:49:
Bestaat http://(server)/nagios/cgi-bin/status.cgi wel? Dan zou http://(server)/nagios/cgi-bin/statusmap.cgi ook moeten bestaan.

Mogelijk de verkeerde URL ingevuld?
Ja die bestaat wel..
Ik ben vandaag over gegaan naar nagios versie 3.0.4 (Release date 15 oktober)

Ik heb 2 locaties
/usr/local/nagios/sbin/status.cgi
/usr/lib/nagios/cgi/status.cgi
Maar beide accepteert hij niet. helaas.

Als ik naar de file toe ga via de mozilla pluging geeft hij :
The requested URL /nagios/sbin/status.cgi was not found on this server.

edit: Ik heb ergens een link gevonden die ik moest invoeren. En nu heb ik rechts onder staan (N Geen probleem)

"http://192.168.1.2/nagios/cgi-bin/status.cgi?hoststatustypes=13&servicestatustypes=29&style=hostdetail&noheader=yes

Als ik de optie "ga naar hosts" van de mozilla plugin ga dan staat er geen hosts is.
Mogelijk komt er alleen iets te staan als er een probleem voor doet..
Dit ga ik morgen even testen...

bedankt paul voor je hulp

[Voor 23% gewijzigd door serienummer op 18-10-2008 20:14]


  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Je haalt 2 dingen door elkaar: de locatie op het filesystem, en de locatie via de browser :)

Als je naar http://192.168.1.2/nagios/ gaat (met een browser, geen idee wat die 'mozilla plugin' is :) ) kom je in de webinterface van Nagios, en daar kun je alles zien, ook als er geen problemen zijn :)

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • serienummer
  • Registratie: November 2006
  • Laatst online: 06-03 19:28
Paul Nieuwkamp schreef op zondag 19 oktober 2008 @ 14:45:
Je haalt 2 dingen door elkaar: de locatie op het filesystem, en de locatie via de browser :)

Als je naar http://192.168.1.2/nagios/ gaat (met een browser, geen idee wat die 'mozilla plugin' is :) ) kom je in de webinterface van Nagios, en daar kun je alles zien, ook als er geen problemen zijn :)
Paul,

mijn excuses. ik zat niet op te letten. ;)

De mozilla plugin is een tooltje dat in contact staat met Nagios.
Mocht je aan het surfen zijn, en er doet een probleem zich voor in je netwerk dan krijg je dat te zien in je beeld.
Best handig Ik kijk niet altijd naar de Host Status Details. Hij maakt ook geluid ook als je wild
https://addons.mozilla.org/nl/firefox/addon/3607 :)

Verder werkt het prima als ik naar (http://192.168.1.2/nagios/) zeer mooi programma om je netwerk te monitoren..
We hebben ongeveer 213 switches. dan maakt nagios het redelijk overzichtelijk :9

[Voor 4% gewijzigd door serienummer op 20-10-2008 07:48]


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
Hoi!

Ik ben ook, net als Remco_K, bezig gegaan om een oude Nokia 6021 aan te sluiten op mijn Nagios server (fedora core9). Handmatig via een shell kan ik prima een sms versturen, zowel als root als nagios user.

Ik heb in commands.cfg een nieuw command gedefinieerd, namelijk:
code:
1
2
3
4
5
6
7
8
9
define command{
command_name    notify-by-sms
command line        /usr/bin/gnokii -q $CONTACTPAGERS$ '$NOTIFICATIONTYPE$: $HOSTNAME$: $SERVICEDESC$ is $SERVICESTATE$ ($OUTPUT$)' 
}

define command{
command_name    host-notify-by-sms
command line        /usr/bin/gnokii -q $CONTACTPAGERS$ '$NOTIFICATIONTYPE$: $HOSTNAME$ is $HOSTSTATE$ ($OUTPUT$)' 
}


in contacts.cfg het volgende:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
define contact{
contact_name                            testuser
use                                           generic-contact
alias                                          test user
service_notification_period           24x7
host_notification_period               24x7
service_notification_options         u,c,r,f
host_notification_options             d,u,r,f
service_notification_commands    notify-by-sms
host_notification_commands        host-notify-by-sms
pager                                         06123456789
}

define contactgroup{
contactgroup_name     admins
alias                           Nagios Administrators
members                    nagiosadmin,testuser
}


De emails komen wel gewoon binnen maar ik ontvang nog geen SMSjes via nagios... iemand enig idee waar ik iets fout doe?

bvd.

DVRIES.

  • paella
  • Registratie: Juni 2001
  • Laatst online: 22:21
permissies probleem? Heb je logs gecheckd?

No production networks were harmed during this posting


  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
paella schreef op dinsdag 25 november 2008 @ 19:26:
permissies probleem? Heb je logs gecheckd?
permissies zijn in orde. Beide users (root & nagios) mogen en kunnen sms'en. Dit heb ik al getest.

In de log file zie ik dat de notify-by-sms netjes wordt aangeroepen maar ik zie nergens terug dat dit ook daadwerkelijk verzonden is, of juist niet....

EDIT

Ik heb al ontdekt dat ik de verkeerde parameters gebruik, volgens nagios.log kon hij het script niet vinden.
Ik heb dit nu gewijzigd in:
command_line echo "NOTIFICATIONTYPE$: $HOSTNAME$: $SERVICEDESC$ ($OUTPUT$)" | gnokii --sendsms $CONTACTPAGER$

nu zegt nagios.log dat de contactpersoon wordt aangeroepen maar ik ontvang nog steeds geen sms en volgens de nagios.log zijn er ook geen errors meer....

[Voor 34% gewijzigd door DVRIES op 26-11-2008 14:57]


  • EquiNox
  • Registratie: Januari 2000
  • Laatst online: 13:35

EquiNox

Speed plz.

DVRIES schreef op woensdag 06 augustus 2008 @ 15:57:
Volgende issue; geluid.

In Nagios v3 werkt het geluid niet meer in de webbrowser. Dit komt doordat Nagios een verkeerde MIME type aanroept (application/wav). Dit MIME type is nergens te downloaden en kan het geluid dus niet af worden gespeeld. Deze verwijzing dient te worden gewijzigd in bijvoorbeeld application/x-wave.
Dit probleem is in versie 3.0.6 eindelijk aangepakt.

Werkt weer out-of-the-box, dus niet meer boel patchen.

  • EquiNox
  • Registratie: Januari 2000
  • Laatst online: 13:35

EquiNox

Speed plz.

Ik zit zelf nog met het volgende :

Ik wil graag de statussen van RAID arrays op mijn Windows2003 bakken monitoren, zowel hardware (Dell, HP, Acer) als Windows Software Raid. Dit kan (uiteraard) op verschillende manieren.

Wat is het beste :

- NRPE (nsclient++)
- NC_NET
- SNMP

En hoe krijg ik dit normaal voor elkaar? Heb al wat plugins geprobeerd van nagiosexchange.org, maar kom niet echt verder :(

Als iemand een goede turorial hiervoor weet, zou ik zeer dankbaar zijn.

[Voor 17% gewijzigd door EquiNox op 03-12-2008 14:55]


  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Ik heb op alle Dells OMSA staan, en als je in Windows de SNMP-service installeert kun je die uitlezen.

Beetje brak geschreven plugin, ik had geen zin in een mooie help en een time-out en zo :P maar deze gebruik ik hier @ work:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#!/bin/bash

if [ $# -ne 1 ]; then
        echo "UNKNOWN: Invalid command line arguments. Use $0 (hostname)"
        exit 3
fi

# OID: *1
# Returnvalues: *2

OID=1.3.6.1.4.1.674.10892.1.200.10.1.2.1
returnvalue=`/usr/bin/snmpget -Oaqv -v2c -c public -t 30 $1 $OID`

case $returnvalue in
        1|2)
                echo "UNKNOWN: Unknown status"
                exit 3
        ;;
        3)
                echo "OK: No problems detected"
                exit 0
        ;;
        4)
                echo "WARNING: Non-critical error"
                exit 1
        ;;
        5|6)
                echo "ERROR: Failure detected"
                exit 2
        ;;
esac

echo "UNKNOWN: Invalid status"
exit 3
*1: http://support.dell.com/s...html/snmpc4.htm#wp1042733
*2 http://support.dell.com/s...html/snmpaa.htm#wp1045330

Sterretjes omdat het anders te breed wordt (en nu zijn het linkjes :P)

Dit laat alles zien dat door OMSA gedetecteerd wordt, waaronder dus (als het goed is) de raid-arrays. Het laat niet zien _wat_ de melding is, maar inloggen op OMSA is zo gedaan natuurlijk.

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
EquiNox schreef op woensdag 03 december 2008 @ 14:49:
Ik zit zelf nog met het volgende :

Ik wil graag de statussen van RAID arrays op mijn Windows2003 bakken monitoren, zowel hardware (Dell, HP, Acer) als Windows Software Raid. Dit kan (uiteraard) op verschillende manieren.

Wat is het beste :

- NRPE (nsclient++)
- NC_NET
- SNMP

En hoe krijg ik dit normaal voor elkaar? Heb al wat plugins geprobeerd van nagiosexchange.org, maar kom niet echt verder :(

Als iemand een goede turorial hiervoor weet, zou ik zeer dankbaar zijn.
Ik gebruik op m'n HP machines NSClient++, met een script van NagiosExchange (check_smartarray.vbs). Werkt als een zonnetje:
***** Nagios *****

Notification Type: RECOVERY

Service: Raid Status
Host: Domain Controller Klant
Address: 172.16.135.20
State: OK

Date/Time: Tue Dec 2 18:30:26 CET 2008

Additional Info:

OK - Smart Array E200i in Slot 0 OK/OK/OK (LD 1: OK [(1:1 OK) (1:2 OK) (1:3 OK)], LD 2: OK [(1:6 OK) (1:7 OK) (1:8 OK)])
Ding geeft dus netjes aan wat de status is van de logische disken en de bijbehorende fysieke disken. Gaat uiteraard een 'critical' warning geven op het moment dat een array degraded is, of een hotspare actief is.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • StarWing
  • Registratie: Januari 2003
  • Laatst online: 09:23

StarWing

Huh ?!?

ralpje schreef op woensdag 03 december 2008 @ 15:24:
[...]


Ik gebruik op m'n HP machines NSClient++, met een script van NagiosExchange (check_smartarray.vbs). Werkt als een zonnetje:


[...]

Ding geeft dus netjes aan wat de status is van de logische disken en de bijbehorende fysieke disken. Gaat uiteraard een 'critical' warning geven op het moment dat een array degraded is, of een hotspare actief is.
Moet je daarvoor de HP manamgent tools geinstalleerd hebben staan om met NSclient++ te kunnen uitlezen ?

Page intentionally left blank.


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
StarWing schreef op woensdag 03 december 2008 @ 15:50:
[...]


Moet je daarvoor de HP manamgent tools geinstalleerd hebben staan om met NSclient++ te kunnen uitlezen ?
Ja, hij gebruikt de HP Smart Array Controler CLI om de output te genereren.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • EquiNox
  • Registratie: Januari 2000
  • Laatst online: 13:35

EquiNox

Speed plz.

Hoe koppel je dat .vbs script aan je NSClient++? Gebruik je NRPE hiervoor?

(sorry voor de n00b vragen, maar ik kan redelijk veel met Nagios (ik monitor nu reeds 37 hosts), alleen het hele plugin/scripting verhaal is even een stap hoger. Ik rpobeer erachter te komen wat de beste manier is om het implementeren).

[Voor 61% gewijzigd door EquiNox op 03-12-2008 17:04]


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Ik heb in objects.cfg een check_raid aangemaakt:
# 'check_raid' command definition
define command{
command_name check_raid
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c check_raid
}
Die roept dus inderdaad check_nrpe aan, met als command check_raid.
In m'n nsc.ini (op de te monitoren server dus) geef ik aan wat check_raid moet doen:
check_raid=cscript.exe //T:30 //NoLogo scripts\check_smartarray.vbs --hpacucli "C:\Program Files\Compaq\Hpacucli\Bin"
De file check_smartarray.vbs in de scripts directory wordt hier dus aangeroepen, met als lokatie van de HP Array Configuration Utility CLI C:\Program Files\Compaq\Hpacucli\Bin. Dit is de standaard lokatie van deze utility als je hem vanuit je smartstart CD laat meeinstalleren. De VBS file is gewoon het standaard script van NagiosExchange. In het script wordt de output van de HPACUCLI geparst naar een voor Nagios begrijpelijk output, met de juiste exit codes (warning, critical, OK).

Door het op deze manier op te zetten, hoef ik bij nieuw te monitoren klanten enkel de standaard NSCLient++ directory die ik heb te kopieren naar de server, de service te installeren / starten, en vervolgens in de config van die klant alleen de check_raid als check op die server mee te geven. De rest gaat automagisch :)

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Net gezien dat er een nieuwe versie van NagiosQL uit is, ik kende deze tool nog niet.
Handig? Ik heb deze geprobeerd te installeren, maar ik kreeg 1 of andere vage error
+ geen zin om mijn configfiles helemaal te reorganiseren (wat blijkbaar nodig is).

  • DVRIES
  • Registratie: September 2007
  • Laatst online: 15-06 10:26
DVRIES schreef op woensdag 26 november 2008 @ 13:36:
[...]

permissies zijn in orde. Beide users (root & nagios) mogen en kunnen sms'en. Dit heb ik al getest.

In de log file zie ik dat de notify-by-sms netjes wordt aangeroepen maar ik zie nergens terug dat dit ook daadwerkelijk verzonden is, of juist niet....

EDIT

Ik heb al ontdekt dat ik de verkeerde parameters gebruik, volgens nagios.log kon hij het script niet vinden.
Ik heb dit nu gewijzigd in:
command_line echo "NOTIFICATIONTYPE$: $HOSTNAME$: $SERVICEDESC$ ($OUTPUT$)" | gnokii --sendsms $CONTACTPAGER$

nu zegt nagios.log dat de contactpersoon wordt aangeroepen maar ik ontvang nog steeds geen sms en volgens de nagios.log zijn er ook geen errors meer....
Ik heb de laatste Nagios versie 3.0.6 van 1 december geinstalleerd en nu verstuurd Nagios netjes smsjes :D

  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Vraagje:
Ik heb Nagios gekoppeld aan een SMS-service, maar helaas loopt het aantal SMS'jes nogal flink op ...
Is het op een bepaalde manier mogelijk om ervoor te zorgen dat voor bepaalde soorten events enkel een mail verstuurd wordt, en bij 'ernstiger' events een SMS?
Ik wil desnoods wel per service of host gaan aangeven of een SMS nodig is bij een event van die service.

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf / Backend developer

DieterVDW schreef op maandag 15 december 2008 @ 09:52:
Vraagje:
Ik heb Nagios gekoppeld aan een SMS-service, maar helaas loopt het aantal SMS'jes nogal flink op ...
Is het op een bepaalde manier mogelijk om ervoor te zorgen dat voor bepaalde soorten events enkel een mail verstuurd wordt, en bij 'ernstiger' events een SMS?
Ik wil desnoods wel per service of host gaan aangeven of een SMS nodig is bij een event van die service.
Je kan per host/service aangeven welke contactpersonen er genotified moeten worden. Bij de contactpersonen heb je dan staan welke notificatie commands uitgevoerd worden.

Ik heb zelf dan ook voor elk contactpersoon twee entries gemaakt in mijn config, waarbij slechts bij eentje ook de SMS mogelijkheid staat. Geen idee of het eenvoudiger te doen is, maar dit werkt perfect voor mij :)

  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

Ik heb wat raars waar ik even de vinger niet op kan leggen.
Het versturen van SMSjes heeft prima gewerkt. Tot een even geleden, ik kan niet precies vaststellen wanneer het niet meer werkte. (Laatste SMS ontvangen op 28 Nov. daarna niet meer, had er op 14 dec. weer 1 moeten krijgen maar die kwam dus nooit).

Even uitgezocht waar het misgaat. En wat blijkt? Ik gebruik deze SMS centrale: 0653151515
Als ik die vanuit de lokatie bel (ISDN modem) waar nagios draait, krijg ik [Busy]. Hetzelfde geld voor 0653141414.
Als ik een ander ISDN inbelnummer draai (b.v. die van een internet provider) dan krijg ik een [Connect]. Het ISDN modem wat ik gebruik werkt dus nog prima.
Als ik vanaf elke andere lokatie het betreffende nummer (0653151515) met een telefoon draai, krijg ik gewoon een modempje aan de lijn. Raar maar waar.
Ik heb op de lokatie waar Nagios staat nog niet met een gewone telefoon geprobeerd te draaien. Vanavond ben ik daar even en probeer ik dat.

Ik kan me voorlopig 2 oorzaken bedenken:
1. 0653151515 (en 141414) ondersteunen sinds kort geen ISDN dial in meer
2. KPN vind mij op die lokatie niet lief en zegt gewoon in gesprek te zijn.

Iemand ideetje hierover?
In het geval van 1: That sucks!
Als 2: klanten service van KPN bellen ofzo? Ik zie me al aankomen, er is natuurlijk geen enkele pipo daar die dat gaat snappen.

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

remco_k schreef op dinsdag 16 december 2008 @ 13:13:
Ik kan me voorlopig 2 oorzaken bedenken:
1. 0653151515 (en 141414) ondersteunen sinds kort geen ISDN dial in meer
2. KPN vind mij op die lokatie niet lief en zegt gewoon in gesprek te zijn.
Update:
Het is dus optie 1...
KPN heeft blijkbaar ISDN dial-in uitgeschakeld voor die nummers.
Een kennis van me heeft zo'n officieel test-toestel wat met allerlei protocollen naar buiten kan bellen.
Bellen naar deze nummers met het 'analoge' protocol over ISDN werkt. Bellen middels ISDN krijgt ook hij geen contact. Zelfde op een ander adres.

KPN wil mij pesten zeker. Nou moet ik weer ergens een analoog modempje regelen en een analoog poortje op de telefooncentrale opsnorren. (of een ISDN modem wat analoog kan emuleren...)

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • Demoterror
  • Registratie: Mei 2005
  • Laatst online: 19-10-2020

Demoterror

Mascotte @ Skullcrusher

Goedemorgen mede Nagios gebruikers.

Ik zit met een nogal irritant probleem, namelijk het volgende:

Er draaien hier nogal bedrijfs kritieke processen in een VMware omgeving waarvan elke avond automatisch een back-up word gemaakt.
Dit back-up proces duurt ongeveer een uur.
Nou het probleem waar ik tegen aan loop.

Tijdens het uitvoeren van deze back-up loopt Nagios helemaal vol met foutmeldingen, ondanks dat het geplanned staat als "Downtime".

Ik krijg hiervan niet direct meldingen in het Nagios hoofdoverzicht maar bij Alert History staan de meldingen er wel bij, ondanks dat het staat ingesteld als Downtime.

Het vervelende hiervan is dat er tijdens dit procces dus wel een log word gemaakt, wat het nogal lastig maakt om een goed overzicht te houden over mijn logs en eventuele oorzaken hiervan.
Helemaal omdat de host word gezien als "Down" tijdens dit uur terwijl dit toch echt niet het geval is, medewerkers kunnen gewoon verder werken alleen het proces zal wat trager zijn.

Is er een mogelijkheid om binnen Nagios een verschil te laten zien tussen Unreachable en Down?
Of eventueel een onderscheid te laten maken tussen meldingen die van het back-up procces komen en "echte" meldingen? Het mag natuurlijk ook niet zo zijn dat er geen meldingen worden verstuurd als de host tijdens het back-up uur toch echt down gaat.
Kan een beetje moeilijk verkopen hier dat ze een uur stil lagen omdat ik een hekel aan "nep" meldingen heb :D
(Ook meerdere vestigingen/landen werken op dit proces met dus ook verschillende tijdzones plus daarbij de thuiswerkers nog eens)

Ter referentie een deel van een log van gisteravond, mocht dit eventueel helpen bij het inzicht geven in de situatie.
21-12-2008 19:51:15 Service Alert SAPPRO CPU Load OK HARD CPU Load 0% (5 min average)
21-12-2008 19:15:25 Host Alert SAPPRO N/A UP SOFT PING OK - Packet loss = 0%, RTA = 1.04 ms
21-12-2008 19:14:15 Host Alert SAPPRO N/A DOWN SOFT CRITICAL - Host Unreachable (192.168.10.4)
21-12-2008 19:11:45 Service Alert SAPPRO Diskspace D: [DATA] OK SOFT d:\ - total: 100.00 Gb - used: 66.83 Gb (67%) - free 33.17 Gb (33%)
21-12-2008 19:11:25 Service Alert SAPPRO CPU Load WARNING HARD CPU Load 84% (5 min average)
21-12-2008 19:09:55 Service Alert SAPPRO Diskspace D: [DATA] CRITICAL SOFT CRITICAL - Socket timeout after 10 seconds
21-12-2008 19:09:15 Service Alert SAPPRO CPU Load WARNING SOFT CPU Load 86% (5 min average)
21-12-2008 19:08:35 Host Alert SAPPRO N/A UP SOFT PING OK - Packet loss = 0%, RTA = 0.35 ms
21-12-2008 19:08:05 Host Alert SAPPRO N/A DOWN SOFT CRITICAL - Host Unreachable (192.168.10.4)
21-12-2008 19:07:55 Service Alert SAPPRO Diskspace D: [DATA] CRITICAL SOFT CRITICAL - Socket timeout after 10 seconds
Eventuele oplossingen en/of reply's op deze post worden zeer gewaardeerd.

Hate us when you see us, fear us when you dont.


  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

Ik weet niet hoe je hebt gescheduled als downtime, maar ik deed het in het verleden als volgt:

In timeperiods.cfg:
code:
1
2
3
4
5
6
7
8
9
10
11
define timeperiod{
        timeperiod_name 24x7-315am
        alias           24 Hours A Day, 7 Days A Week, not 3:15 am
        sunday          00:00-03:10,03:20-24:00
        monday          00:00-03:10,03:20-24:00
        tuesday         00:00-03:10,03:20-24:00
        wednesday       00:00-03:10,03:20-24:00
        thursday        00:00-03:10,03:20-24:00
        friday          00:00-03:10,03:20-24:00
        saturday        00:00-03:10,03:20-24:00
}


In de config van de host
code:
1
2
3
4
5
6
7
define host{
        use             windows-server
        host_name       spare_playout
        alias           Spare_playout
        address         192.168.X.X
        check_period    24x7-315am
}


Met andere woorden: elke dag tussen 03:10 en 03:20 mag de host down zijn zonder dat Nagios gaat klagen. Of hij dan niet in zijn eigen log klaagt, dat weet ik niet.
Ik had dit gemaakt omdat deze machine tot enige tijd geleden 's nachts om 03:15 herstart werd.
Als ik het me nog goed herinner worden de checks ook helemaal niet uitgevoerd buiten de gedefinieerde check_period. Dus dat zou je probleem moeten oplossen.

[Voor 7% gewijzigd door remco_k op 22-12-2008 09:54. Reden: Edit: code tags gemaakt]

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Yup, check_period is your friend. Zoals de naam al zegt wordt er alleen in die periode gekeken.

Wij gebruiken iets soortgelijks voor wat processen die voor de backup gestopt moeten worden, en erna weer gestart. Gedurende de backup-window controleren we die processen dus niet. (als ze niet gestopt worden is er op dat moment toch niemand aanwezig om het te verhelpen :P en zien we dat vanzelf aan de mail die de backup stuurt).

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • Demoterror
  • Registratie: Mei 2005
  • Laatst online: 19-10-2020

Demoterror

Mascotte @ Skullcrusher

remco_k schreef op maandag 22 december 2008 @ 09:50:
Ik weet niet hoe je hebt gescheduled als downtime, maar ik deed het in het verleden als volgt:
Bedankt voor je reactie.
Ik zal eens even gaan spelen met de timeperiods voor de checks, momenteel staat de Downtime namelijk geplanned via de Nagios Interface.

Zover ik begrijp zou jou oplossing ook moeten voorkomen dat de meldingen in de logs verschijnen, aangezien er in de specifieke tijdsperiode gewoon geen checks worden uitgevoerd.
Echter is dit dan ook wel weer direct de keer zijde van het verhaal, er worden een uur geen checks uitgevoerd.

Mocht er tijdens (of door) de back-up procedure iets fout gaan met de server duurt het dus tot 20:00 voordat Nagios hierover meldingen naar buiten gaat gooien.

Zou dit eventueel op te lossen zijn door een nieuwe service aan te maken voor puur het pingen van de server?
De server blijft gewoon up, het proces blijft gewoon draaien dus er zal zover ik kan zien geen reden zijn voor deze check om te falen ondanks dat het back-up procces vrolijk zijn werk doet.

Hate us when you see us, fear us when you dont.


  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf / Backend developer

Demoterror schreef op maandag 22 december 2008 @ 10:12:
Zou dit eventueel op te lossen zijn door een nieuwe service aan te maken voor puur het pingen van de server?
De server blijft gewoon up, het proces blijft gewoon draaien dus er zal zover ik kan zien geen reden zijn voor deze check om te falen ondanks dat het back-up procces vrolijk zijn werk doet.
Je kan per service een andere check_period instellen, dus ja: dat kan :)

  • Demoterror
  • Registratie: Mei 2005
  • Laatst online: 19-10-2020

Demoterror

Mascotte @ Skullcrusher

Nou mooi, maar eens even kijken of ik het voor elkaar kan krijgen :)

Bedankt zover, ik laat wel van me horen of/hoe het me gelukt is.

Edit om dubbelpost te voorkomen.

Nah na wat stoeien ben ik helaas vrij weinig verder gekomen.
Je geeft aan dat je per host de check_period definieerd, wat dus als resultaat zou hebben dat die specifieke host het aangeroepen template gebruikt.

En nu mijn (waarschijnlijk hele domme) vraag, in welke .cfg defineer je dit?

Ik heb nadat ik een nieuwe check_period aan timeperiod.cfg heb toegevoegd het volgende aangepast in Windows.cfg:
code:
1
2
3
4
5
6
7
define host{
use                     winsows-server
host_name              SAPPRO
alias                     SAPPRO
address                 192.168.10.4
check_period             24x7sappro
}


Echter, bij poging tot een nagios restart vliegen de errors me om de oren, ok was te verwachten want zo makkelijk zou het wel niet zijn.

Nou het probleem (en waarschijnlijk ook de oorzaak);
De andere hosts die in windows.cfg zijn gedefinieerd gebruiken geen 1 van allen een check_period in hun benaming, deze halen ze allemaal (lijkt me) vanuit de generic-service/windows-server template.

Dus heb ik een nieuwe template aangemaakt in template.cfg, met daarbij de check_period 24x7sappro.

Nog steeds krijg ik leuke config errors.

Als laatste poging maar een nieuwe hostgroup aangemaakt in windows.cfg met daarin alleen SAPPRO als host welke weer gebruik maakt van mijn nieuwe template, nog steeds geen resultaat.

Om heel eerlijk te zijn, ik heb geen enkel idee wat ik fout doe, dat ik iets fout doe begrijp ik zelf ook maar ik heb geen idee waar ik de oorzaak van mijn leuke config errors moet zoeken.

In de nagios logs zijn geen configuratie errors terug te vinden.

Zover ik kan zien staat alles gewoon goed dus ik begin er een beetje radeloos van te worden :?
(Ook slim bedacht om dit nog eventjes snel voor de kerstvakantie te willen doen trouwens >.>)

[Voor 87% gewijzigd door Demoterror op 22-12-2008 12:36]

Hate us when you see us, fear us when you dont.


  • StarWing
  • Registratie: Januari 2003
  • Laatst online: 09:23

StarWing

Huh ?!?

ralpje schreef op woensdag 03 december 2008 @ 15:24:
[...]


Ik gebruik op m'n HP machines NSClient++, met een script van NagiosExchange (check_smartarray.vbs). Werkt als een zonnetje:)
/linux newbie modus
Ik heb ondertussen een werkende nagios, die enkele switched controleerd via ping,
Nu heb ik hier een nieuwe DL360 die ik wil gaan monitoren met nagios.

Hoe/Waar installeer je zo een custom script in nagios (vb smartarray.vbs) ? Bij de meeste scripts zit maar een beknopte of geen handleiding bij.
:help:

Page intentionally left blank.


  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf / Backend developer

Demoterror schreef op maandag 22 december 2008 @ 10:20:
Echter, bij poging tot een nagios restart vliegen de errors me om de oren, ok was te verwachten want zo makkelijk zou het wel niet zijn.
Wat voor error krijg je dan?

  • remco_k
  • Registratie: April 2002
  • Laatst online: 22:42

remco_k

een cassettebandje was genoeg

Demoterror schreef op maandag 22 december 2008 @ 10:20:
...
Echter, bij poging tot een nagios restart vliegen de errors me om de oren, ok was te verwachten want zo makkelijk zou het wel niet zijn.
...
Nog steeds krijg ik leuke config errors.
Sja, zo schiet het niet echt op. Wij kunnen niet raden wat voor errors dat zijn, dus kunnen we je ook niet vertellen wat er zoal mis is met je config, volgens Nagios.

Check je configuratie eens op de manier die in de handleiding wordt vermeld:
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

De output daarvan geeft doorgaans doorslaggevende info over wat je zoal fout hebt gedaan.
Los die fouten op of als dat niet lukt, post dan de output van de config check even hier.

Alles kan stuk.
Goedkoop SHOUTcast stream hosting? Snel online, geen setup kosten. www.digiplay.nl


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
StarWing schreef op maandag 22 december 2008 @ 14:48:
[...]


/linux newbie modus
Ik heb ondertussen een werkende nagios, die enkele switched controleerd via ping,
Nu heb ik hier een nieuwe DL360 die ik wil gaan monitoren met nagios.

Hoe/Waar installeer je zo een custom script in nagios (vb smartarray.vbs) ? Bij de meeste scripts zit maar een beknopte of geen handleiding bij.
:help:
ralpje in "[Nagios] Ervaringen, scripts en tips"

:)

De VBS (die je kant en klaar van nagiosexchange haalt) plaats je in je scripts folder van je nsclient++, en in je cfg's doe je bovenstaande dingen toevoegen.

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • StarWing
  • Registratie: Januari 2003
  • Laatst online: 09:23

StarWing

Huh ?!?

Tis gelukt :)

Nog iemand een idee hoe ik check_snmp kan installeren ?

[Voor 183% gewijzigd door StarWing op 23-12-2008 14:03]

Page intentionally left blank.


  • serienummer
  • Registratie: November 2006
  • Laatst online: 06-03 19:28
Hoi,

Vraag, Op de begin pagina staat dat je een kant en klare versie van nagios met OS kan downloaden.
En dat zit er een link bij maar waar ik ook zoen ik kan de ddownload link niet vinden.
Heeft iemand deze al wel gevonden?

  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
StarWing schreef op maandag 22 december 2008 @ 16:08:
Nog iemand een idee hoe ik check_snmp kan installeren ?
In de plugins-directory van Nagios zetten en een command aanmaken :P

Voor check_snmp_storage.pl:
code:
1
2
3
4
define command {
        command_name check_diskspace_win
        command_line $USER1$/check_snmp_storage.pl -H $HOSTADDRESS$ -2 -C public -t 60 -S 1,0,3 -w 80% -c 90% -m ^$ARG1$
}

De rest van de check_snmp-scripts werken ongeveer gelijk. Als je het script uitvoert zonder opties krijg je te zien wat je er mee kunt, en anders staat er op de website van die dingen ( http://nagios.manubulon.com/ ) ook uitleg.

Verder moet je te-monitoren-object natuurlijk wel SNMP draaien en benaderbaar zijn voor je Nagios-machine ;)

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock


  • StarWing
  • Registratie: Januari 2003
  • Laatst online: 09:23

StarWing

Huh ?!?

Blijkbaar miste ik nog een aantal dependencies waardoor de check_snmp niet mee gecompileerd werd, ondertussen up & running :-)

Page intentionally left blank.


  • Darkstar
  • Registratie: September 2007
  • Laatst online: 07-11-2019
serienummer schreef op woensdag 24 december 2008 @ 10:45:
Hoi,

Vraag, Op de begin pagina staat dat je een kant en klare versie van nagios met OS kan downloaden.
En dat zit er een link bij maar waar ik ook zoen ik kan de ddownload link niet vinden.
Heeft iemand deze al wel gevonden?
Deze is blijkbaar niet meer beschikbaar. Ik heb na wat googelen nog andere VMware images gevonden, maar steeds met oudere distro's als basis. Ik heb dan zelf maar Ubuntu 8.04 voorzien van Nagios. Op de website van Nagios staat trouwens een handige 'quickstart guide' met beschrijvingen voor Ubuntu, Fedora en OpenSuse Linkje

 MacBook Pro | iPhone 6 64GB Space Gray | iPad (2017) | Apple Watch series 0 - Some people just need a high five... in the face... with a chair


  • serienummer
  • Registratie: November 2006
  • Laatst online: 06-03 19:28
Hoi D4rkt4r,
Ik heb nagios draaien op fedroa core 4 samen met Cacti (CactiEZ).
Dus het werkt allemaal wel maar ik dacht als ik deze nu download heb ik misschien een nieuwere versie php en SQL. Dan hoef ik niet meer alle losse modules te installeren zoals Json enz. dat zit al bij SQL 5.2.
Lilac (http://www.lilacplatform.com/) werkt ook met een hogere versie PHP dan die je bij de cacti installatie mee krijgt (Helaas) Updaten is geen optie. is erg moeilijk en werkt vaak niet + gebrek aan kennis.

Alvast bedankt voor het zoeken.

PS. Lilac is een handig tooltje voor het maken van configuratie files voor Nagios alles in een gui gegoten.

  • StarWing
  • Registratie: Januari 2003
  • Laatst online: 09:23

StarWing

Huh ?!?

Iemand een idee hoe ik Nagios kan vertellen dat hij 2 smtp servers moet gebruiken ?

vb workhours: interne exchange server
niet workhours: mailserver van de ISP

Page intentionally left blank.


  • ralpje
  • Registratie: November 2003
  • Laatst online: 21:54
Wedervraag: waarom zou je dat willen?

Freelance (Microsoft) Cloud Consultant & Microsoft Certified Trainer


  • Paul
  • Registratie: September 2000
  • Laatst online: 10:27
Nagios an sich gebruikt geen SMTP-server, maar net wat er op je machine voor MTA draait. Daartegen moet je dus vertellen welke smarthost hij moet gebruiken.

Ik gok dat je eerder bedoelt dat je overdag een mail wilt naar starwing@work en 's avonds naar starwing@home of zo?

"Your life is yours alone. Rise up and live it." - Richard Rahl
Rhàshan - Aditu Sunlock

Pagina: 1 2 3 4 Laatste



Nintendo Switch (OLED model) Apple iPhone SE (2022) LG G1 Google Pixel 6 Call of Duty: Vanguard Samsung Galaxy S22 Garmin fēnix 7 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2022 Hosting door True

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee