Wij zijn onze Exchange 2010 omgeving aan het migreren naar 2013, hierbij willen meteen High Availabiility meenemen: dwz dat we een DAG inrichten met 3 kopietjes (Active/Passive/Passive). Op dit moment draaien de 8 2013 machines (alle 8 CAS/MBX) live, maar zonder mailboxen van gebruikers; dat gaat over een maand gebeuren.
Voordat we daadwerkelijk mailboxen gaan hosten willen we natuurlijk dat we eea onder controle hebben. Op dit moment krijgen we op een paar Healthsets echter geen grip, DiskSpace is er daar de belangrijkste van.
DiskSpace\LowLogVolumeSpaceMonitor is Unhealthy. De eventlog meldt: "Database "XXX-001' is low on log volume space. XXX-001' is low on log volume space. Current=148,21 GB, Threshold=195,31 GB
De Logs staan op een eigen volume van 150 GB, dit volume heeft 148,21 GB vrij; je zou zeggen dat dat meer dan genoeg is. Exchange wil echter 200 GB free disk space.
Hierna heb ik voor
alle machines onderstaande ServerMonitoringOverride uitgevoerd. Een GlobalMonitoring override heeft overigens hetzelfde effect.
code:
1
2
3
4
5
| Add-ServerMonitoringOverride -Server XXX -Identity DiskSpace\LowLogVolumeSpaceMonitor -ItemType Monitor -PropertyName MonitoringThreshold -PropertyValue '100' -Duration 60.00:00:00
Add-ServerMonitoringOverride -Server XXX -Identity DiskSpace\LowLogVolumeSpaceMonitor -ItemType Probe -PropertyName MonitoringThreshold -PropertyValue '100' -Duration 60.00:00:00
Add-ServerMonitoringOverride -Server XXX -Identity DiskSpace\LowLogVolumeSpaceMonitor -ItemType Responder -PropertyName MonitoringThreshold -PropertyValue '100' -Duration 60.00:00:00 |
Wat er nu gebeurd is dat, naar het zich laat aanzien willekeurig, de healthsets op alle machines van Healthy naar Unhealthy klapperen, typisch is wel dat de LastTransitionTime ongewijzigd blijft. De laatste melding in de eventlog is echter ""The DiskSpace Health Set has determined to be healthy."
code:
1
2
3
4
5
6
7
8
9
10
11
12
| Get-ExchangeServer | where {$_.AdminDisplayVersion -like "Version 15*"} | % { Get-HealthReport -Server $_.Name | Where {$_.Healthset -eq "DiskSpace"} | ft -AutoSize}
Server State HealthSet AlertValue LastTransitionTime MonitorCount
------ ----- --------- ---------- ------------------ ------------
Server1 NotApplicable DiskSpace Healthy 24-3-2014 20:59:22 3
Server2 NotApplicable DiskSpace Healthy 24-3-2014 21:26:06 3
Server3 NotApplicable DiskSpace Healthy 24-3-2014 21:26:30 3
Server4 NotApplicable DiskSpace Healthy 24-3-2014 20:59:09 3
Server5 NotApplicable DiskSpace Unhealthy 24-3-2014 21:24:55 3
Server6 NotApplicable DiskSpace Healthy 24-3-2014 21:03:44 3
Server7 NotApplicable DiskSpace Unhealthy 24-3-2014 21:26:59 3
Server8 NotApplicable DiskSpace Healthy 24-3-2014 20:53:51 3 |
10 minuten later, zonder iets te veranderen
code:
1
2
3
4
5
6
7
8
9
10
| Server State HealthSet AlertValue LastTransitionTime MonitorCount
------ ----- --------- ---------- ------------------ ------------
Server1 NotApplicable DiskSpace Unhealthy 24-3-2014 20:59:22 3
Server2 NotApplicable DiskSpace Degraded 24-3-2014 21:26:06 3
Server3 NotApplicable DiskSpace Unhealthy 24-3-2014 21:26:30 3
Server4 NotApplicable DiskSpace Unhealthy 24-3-2014 20:59:09 3
Server5 NotApplicable DiskSpace Healthy 24-3-2014 21:24:55 3
Server6 NotApplicable DiskSpace Unhealthy 24-3-2014 21:03:44 3
Server7 NotApplicable DiskSpace Unhealthy 24-3-2014 21:26:59 3
Server8 NotApplicable DiskSpace Unhealthy 24-3-2014 20:53:51 3 |
De bedoeling is om op termijn SCOM te gaan gebruiken, maar aangezien SCOM voor exchange gebruik maakt van de exchange health willen we dit wel graag onder controle krijgen. Klapperende DiskSPace Health terwijl we meer dan 99% free disk space hebben is niet handig...