Korte situatieschets.
Wij zijn een relatief vlug groeiend bedrijf waarbij onze focus momenteel aan het verschuiven is van super kleine omgevingen (1 server met 2 VM's, firewall, switch, AP en klaar..) naar de ietwat complexere omgevingen. (meerdere SAN, vSphere clusters, ..).
Momenteel gebruiken we AutoTask AEM (Datto) voor het monitoren van endpoints voornamelijk. Resultaat is dat we frequent issues tegenkomen met hardware, waar onze monitoring totaal niet op inspeelt. (het is mogelijk, maar laten we momenteel aannemen je beter niets gebruikt dan AEM
)
We vangen dit nu op door on-site bij grotere omgevingen een LibreNMS omgeving op te zetten in combinatie met simpelweg SNMP V3 op alle apparatuur.
Dit is allemaal voorbereid in onze templates die aangepast worden per site. Alsook een chef install script opgezet met een bevriend bedrijf voor LibreNMS zelf.
Maar, dit is natuurlijk niet centraal. En voor onze interne helpdesk allemaal Chinees
.
De zoektocht :
Sinds enkele jaren zijn we dus reeds op zoek naar een monitoring platform. Welke meer specifiek gericht is op het monitoren van hardware. We leveren geen software (tenzij je een RDS omgeving mee telt), dus specifek "is deze webservice actief" maakt ons weinig uit. (I know.. cru).
Dat VM1 down gaat, of cluster X zijn datastore 2 kwijt geraakt is wel interessant.
In de afgelopen jaren via Zabbix (spartaans opgezet), Pulseway, N-Able uiteindelijk terecht geraakt bij AutoTask met voornamelijk veel beloftes. Waarbij begin dit jaar de knoop doorgehakt is geweest om eindelijk eens iets meer gericht op onze noden te gaan zoeken.
Wat? Daar wringt het schoentje..
Leave it to the pro's young Padawan..
Er zijn intussen 2 professionele monitoring firma's gepasseerd.
Waarbij firma 1 de deadlines 3 maand overschreven heeft, met weinig resultaat. Voor het mooie bedrag van xuzq krijgen we een Prometheus omgeving in een docker omgeving, die een niet ingestelde Grafana van data voorziet van een Synology sensor voor temperatuur. En interface stats voor 3 switches. Super!
1 jaar sensor data bijhouden werd bij de setup al 10 dagen. En veel andere zaken beloofd waren bleken volgens de installateur al niet mogelijk. (laat staan CentOS als OS keuze ons wat wrevel gaf).
Firma 2 heeft na intern onderzoek, aangegeven onze noden te complex zijn om voor een haalbaar bedrag op te zetten. (AutoTask AEM kost ons momenteel zo'n 5.4K / jaar om een idee te geven).
En gaf bedrijf 1 aan als alternatief. (oh boy..).
Dus kom ik even mijn melk halen bij Tweakers.
Waar waren we naartoe op zoek?
We hebben site 2 site tunnels lopen momenteel voor een test project met PRTG voor alle omgevingen met minstens 1 recente server. (we houden intern een PRE-NAT IPSEC lijst bij hiervoor, netwerk technische zaken is hetgeen we wel doen
).
On-site agents zijn ook mogelijk voor de grotere omgevingen. Een kleine omgeving wensen we geen agent on-site te moeten hebben.
Dit was een van de hoofd redenen Prometheus ons aangeraden werd.
Daar konden we eventueel een PI of alternatief gaan plaatsen. Zodanig wanneer een klant "monitoring" koopt, hij ook fysisch een doosje ziet. (klinkt dom, maar ja.. het werkt zo wel).
We zijn geen devs. En hoewel de toekomst in netwerking ook wel wat scripting word. Heb ik geen zin, noch tijd om zelf een project op te zetten.
Daarmee we externe firma's ingehuurd hebben. Die er dus blijkbaar ook weinig van bakken.. of ik ben onrealistisch.
De bedoeling was we een werkende basis omgevingen hadden. Waarbij we aan de hand van een aantal sites een template konden bouwen voor alle resterende omgevingen.
Wat we monitoren, dashboard en dergelijke passen we zelf aan naar ervaring. Dit werd niet verwacht van de installateurs.
Er volgt nog een meeting de 6de met monitoring firma 1. Gezien we onze factuur resoluut weigeren voor hetgeen opgeleverd is. En dat ongeveer de helft van onze wensen niet mogelijk blijken na aanvang van het project. Het typische het kan allemaal tot de offerte getekend is..
Er is in ons pand ook een DevOps bedrijf aanwezig met OpenSource kennis. Welke momenteel Icinga gebruikt voor zijn datacenter omgeving te monitoren. En op de planning Icinga2 staan heeft voor een een klanten omgeving.
Maar in hoeverre dit schaalbaar is naar iets wij wensen is nog niet onderzocht.
Om even de opmerking voor te zijn. PRTG was onze tijdelijke nood oplossing. We wensen niet voor 10k+ / jaar een oplossing. We verkopen deze monitoring momenteel (te goedkoop) door naar onze klanten.
En zelfs klanten die niet betalen, wensen we op te nemen in een soort basis vorm van opvolging.
Een "prijzig" OS project aan de hand van setup uren, waarbij opvolging intern kan gebeuren geniet de voorkeur. 1 maal de zure appel bij wijze van spreken.
Ter info. Zowel cloud based als intern gehost is ons eigen DC was aanvaardbaar.
Leuk verhaal. Time is money.. En wat is nu je vraag?
Ik heb nagenoeg elke recente "welke monitoring" topic gelezen op reddit en co.
Ik wil niet de voordelen en nadelen per oplossing. Welke beter zijn data kan wegschrijven in de betere back-end. En HA scaled zonder veel problemen.
Simpel. Ik zoek wat ervaringen met gelijkaardige omgevingen. Ik zoek concrete info & feedback.
Is onze setup zo apart dat bedrijven die monitoring oplossingen bieden zich hierop vastbijten?
Hebben we toevallig wat minder geluk hierin met de gevonden firma's?
Is dit iets consultants wel vaker opzetten?
Wat gebruiken jullie, specifiek waarom die oplossing? En is dit in-house opgezet, of door een externe firma?
Welke oplossing leunen er het beste aan voor onze eisen. Dit laatste is blijkbaar serieus overschat geweest.
En ik als niet OpenSource DevOps ..
mijn excuses voor de blok tekst vermoedelijk vol fouten.
Ik gooi dit even onder Non-Windows.. leek me het beste. Verplaats indien nodig.
Wij zijn een relatief vlug groeiend bedrijf waarbij onze focus momenteel aan het verschuiven is van super kleine omgevingen (1 server met 2 VM's, firewall, switch, AP en klaar..) naar de ietwat complexere omgevingen. (meerdere SAN, vSphere clusters, ..).
Momenteel gebruiken we AutoTask AEM (Datto) voor het monitoren van endpoints voornamelijk. Resultaat is dat we frequent issues tegenkomen met hardware, waar onze monitoring totaal niet op inspeelt. (het is mogelijk, maar laten we momenteel aannemen je beter niets gebruikt dan AEM
We vangen dit nu op door on-site bij grotere omgevingen een LibreNMS omgeving op te zetten in combinatie met simpelweg SNMP V3 op alle apparatuur.
Dit is allemaal voorbereid in onze templates die aangepast worden per site. Alsook een chef install script opgezet met een bevriend bedrijf voor LibreNMS zelf.
Maar, dit is natuurlijk niet centraal. En voor onze interne helpdesk allemaal Chinees
De zoektocht :
Sinds enkele jaren zijn we dus reeds op zoek naar een monitoring platform. Welke meer specifiek gericht is op het monitoren van hardware. We leveren geen software (tenzij je een RDS omgeving mee telt), dus specifek "is deze webservice actief" maakt ons weinig uit. (I know.. cru).
Dat VM1 down gaat, of cluster X zijn datastore 2 kwijt geraakt is wel interessant.
In de afgelopen jaren via Zabbix (spartaans opgezet), Pulseway, N-Able uiteindelijk terecht geraakt bij AutoTask met voornamelijk veel beloftes. Waarbij begin dit jaar de knoop doorgehakt is geweest om eindelijk eens iets meer gericht op onze noden te gaan zoeken.
Wat? Daar wringt het schoentje..
Leave it to the pro's young Padawan..
Er zijn intussen 2 professionele monitoring firma's gepasseerd.
Waarbij firma 1 de deadlines 3 maand overschreven heeft, met weinig resultaat. Voor het mooie bedrag van xuzq krijgen we een Prometheus omgeving in een docker omgeving, die een niet ingestelde Grafana van data voorziet van een Synology sensor voor temperatuur. En interface stats voor 3 switches. Super!
1 jaar sensor data bijhouden werd bij de setup al 10 dagen. En veel andere zaken beloofd waren bleken volgens de installateur al niet mogelijk. (laat staan CentOS als OS keuze ons wat wrevel gaf).
Firma 2 heeft na intern onderzoek, aangegeven onze noden te complex zijn om voor een haalbaar bedrag op te zetten. (AutoTask AEM kost ons momenteel zo'n 5.4K / jaar om een idee te geven).
En gaf bedrijf 1 aan als alternatief. (oh boy..).
Dus kom ik even mijn melk halen bij Tweakers.
Waar waren we naartoe op zoek?
- 1 centraal platform voor voornamelijk hardware & hypervisor monitoring.
- Multi tenant. Sommige eindklanten wensen toegang tot dit platform voor hun apparatuur.
- rapporten waar mogelijk. email (ons ticket systeem maakt tickets uit mails al, geen issue).
- Geen volwaardig RMM nodig. (maintenance windows, OS beheer, etc zijn allemaal niet nodig).
- HPE servers. ILO 4 en 5. (de algemene status, disk info, raid status, temp info, .)
- Switch beheer. ( de klassiekers, throughput & errors. beetje scaling. Config beheer .. gohja, bonus?).
- Firewall beheer. ( hierboven + temp & mem use. We gebruiken een FreeBSD gebaseerd systeem. SNMP is mogelijk. IPSEC /. OpenVPN tunnel status zou super zijn.. maar weeral bonus die complex zal zijn).
- communicatie is encrypted. Los van of data over een tunnel gaat of niet. (niet optioneel).
- In de toekomst mogelijke andere zaken. Integratie van Veeam back-up jobs bv. zodanig we 1 portaal hebben voor alles..
- Push of pull maakt mij niet uit. Ik wil wel data over langere periode kunnen bijhouden. Specifiek voor zaken te kunnen inschatten zoals data verbruik. En mogelijks disk failure bv. (latency omhoog + andere errors = disk gaat falen)
We hebben site 2 site tunnels lopen momenteel voor een test project met PRTG voor alle omgevingen met minstens 1 recente server. (we houden intern een PRE-NAT IPSEC lijst bij hiervoor, netwerk technische zaken is hetgeen we wel doen
On-site agents zijn ook mogelijk voor de grotere omgevingen. Een kleine omgeving wensen we geen agent on-site te moeten hebben.
Dit was een van de hoofd redenen Prometheus ons aangeraden werd.
Daar konden we eventueel een PI of alternatief gaan plaatsen. Zodanig wanneer een klant "monitoring" koopt, hij ook fysisch een doosje ziet. (klinkt dom, maar ja.. het werkt zo wel).
We zijn geen devs. En hoewel de toekomst in netwerking ook wel wat scripting word. Heb ik geen zin, noch tijd om zelf een project op te zetten.
Daarmee we externe firma's ingehuurd hebben. Die er dus blijkbaar ook weinig van bakken.. of ik ben onrealistisch.

De bedoeling was we een werkende basis omgevingen hadden. Waarbij we aan de hand van een aantal sites een template konden bouwen voor alle resterende omgevingen.
Wat we monitoren, dashboard en dergelijke passen we zelf aan naar ervaring. Dit werd niet verwacht van de installateurs.
Er volgt nog een meeting de 6de met monitoring firma 1. Gezien we onze factuur resoluut weigeren voor hetgeen opgeleverd is. En dat ongeveer de helft van onze wensen niet mogelijk blijken na aanvang van het project. Het typische het kan allemaal tot de offerte getekend is..
Er is in ons pand ook een DevOps bedrijf aanwezig met OpenSource kennis. Welke momenteel Icinga gebruikt voor zijn datacenter omgeving te monitoren. En op de planning Icinga2 staan heeft voor een een klanten omgeving.
Maar in hoeverre dit schaalbaar is naar iets wij wensen is nog niet onderzocht.
Om even de opmerking voor te zijn. PRTG was onze tijdelijke nood oplossing. We wensen niet voor 10k+ / jaar een oplossing. We verkopen deze monitoring momenteel (te goedkoop) door naar onze klanten.
En zelfs klanten die niet betalen, wensen we op te nemen in een soort basis vorm van opvolging.
Een "prijzig" OS project aan de hand van setup uren, waarbij opvolging intern kan gebeuren geniet de voorkeur. 1 maal de zure appel bij wijze van spreken.
Ter info. Zowel cloud based als intern gehost is ons eigen DC was aanvaardbaar.
Leuk verhaal. Time is money.. En wat is nu je vraag?
Ik heb nagenoeg elke recente "welke monitoring" topic gelezen op reddit en co.
Ik wil niet de voordelen en nadelen per oplossing. Welke beter zijn data kan wegschrijven in de betere back-end. En HA scaled zonder veel problemen.
Simpel. Ik zoek wat ervaringen met gelijkaardige omgevingen. Ik zoek concrete info & feedback.
Is onze setup zo apart dat bedrijven die monitoring oplossingen bieden zich hierop vastbijten?
Hebben we toevallig wat minder geluk hierin met de gevonden firma's?
Is dit iets consultants wel vaker opzetten?
Wat gebruiken jullie, specifiek waarom die oplossing? En is dit in-house opgezet, of door een externe firma?
Welke oplossing leunen er het beste aan voor onze eisen. Dit laatste is blijkbaar serieus overschat geweest.
En ik als niet OpenSource DevOps ..

mijn excuses voor de blok tekst vermoedelijk vol fouten.
Ik gooi dit even onder Non-Windows.. leek me het beste. Verplaats indien nodig.
[ Voor 0% gewijzigd door foetus_ op 02-01-2020 17:51 . Reden: vmware toevoeging ]