HP Microserver G8, zowel Sdkaart als SSD corrupt?

Pagina: 1
Acties:

Vraag


  • HaTe
  • Registratie: Mei 2007
  • Laatst online: 27-02 07:34

HaTe

haat niet

Topicstarter
Mijn vraag
Vandaag een hele dag weggegooid met het herstellen van mijn Proxmox omgeving. Dit was aanvankelijk gelukt toen ik vast had gesteld dat de boot SD corrupt (met grub om vanaf bay 5 te kunnen booten) was. Vervolgens leek ook de SSD (in bay 5) waar Proxmox op draait gedeeltelijk beschadigd. Dit heb ik kunnen herstellen en heb een aantal uur weer kunnen draaien. Toen ik na wat checks en fixes weer herstarte, werkte een heleboel niet meer. Ik vermoedde toch een kapotte SSD ondanks dat de SMART data nog OK was (geen foute sectoren).
Zojuist maar begonnen met een schone Proxmox installatie. De eerste keer kreeg ik bij installatie allerlei foutmeldingen (blokfouten?). De tweede keer is installatie wel afgerond, maar kreeg ik gelijk allemaal fouten bij services die niet laden. De laatste update is dat ik een I/O error krijg bij het booten:
Afbeeldingslocatie: https://tweakers.net/i/jfgjbngrEKS9WoO-JSRckdxtYXc=/800x/filters:strip_exif()/f/image/YveAU4qoGmleIeQRkgKVbVjf.png?f=fotoalbum_large

Ik ben bang dat het probleem dieper ligt, bijvoorbeeld een kapotte voeding of andere componenten. Kan iemand mij hier uit de brand helpen?

Relevante software en hardware die ik gebruik
HP Microserver Gen 8
4 disks op ZFS
1 SSD EXT4 met Proxmox 9
Een USB stick waar de bootloader voor de SSD op staat.

Wat ik al gevonden of geprobeerd heb
opstarten met grub: Set root=(lvm/pve-root) etc

WP: ME PUHZ-SW75YAA + ERST30D-VM2ED | Solar: 17x TSM-340-DE06M.08 (5780Wp ~6200kWh), Azimuth 179°, Hellingshoek: 34° | PC specs

Alle reacties


  • 3DDude
  • Registratie: November 2005
  • Laatst online: 22:17

3DDude

I void warranty's

bootable usb stick maken om je hardware te testen zou ik zeggen...

https://www.reddit.com/r/...edicated_tools_for_doing/

anything with memtest, hardinfo, smartmontools, will diagnose 99%

bijv een ubuntu live, hirens boot ..

[ Voor 23% gewijzigd door 3DDude op 31-01-2026 00:34 ]

Be nice, You Assholes :)


  • synoniem
  • Registratie: April 2009
  • Niet online
Een blockdevice en/of I/O error wijst meestal op hardware problemen. Heeft die SSD een SATA aansluiting? Want dan zou ik beginnen met hiervan de stekkers te controleren en/of andere kabels proberen. (Zowel voor data als voor power). Mocht dat het niet zijn dan is hardware testen zoals 3DDude aangeeft een goede vervolgstap.

  • HaTe
  • Registratie: Mei 2007
  • Laatst online: 27-02 07:34

HaTe

haat niet

Topicstarter
3DDude schreef op zaterdag 31 januari 2026 @ 00:32:
bootable usb stick maken om je hardware te testen zou ik zeggen...

https://www.reddit.com/r/...edicated_tools_for_doing/

anything with memtest, hardinfo, smartmontools, will diagnose 99%

bijv een ubuntu live, hirens boot ..
Ga morgen mee verder. Rescue disk kon ik niet via ILO bedienen om een of andere reden...
synoniem schreef op zaterdag 31 januari 2026 @ 00:35:
Een blockdevice en/of I/O error wijst meestal op hardware problemen. Heeft die SSD een SATA aansluiting? Want dan zou ik beginnen met hiervan de stekkers te controleren en/of andere kabels proberen. (Zowel voor data als voor power). Mocht dat het niet zijn dan is hardware testen zoals 3DDude aangeeft een goede vervolgstap.
Server draait al zeker 5 jaar met deze setup. Kabel zal het zo opeens niet zijn lijkt me? Het meest gekke vind ik dat de SD kaart ook opeens corrupt was, welke niet eens gemount was aan het OS

[ Voor 4% gewijzigd door HaTe op 31-01-2026 00:44 ]

WP: ME PUHZ-SW75YAA + ERST30D-VM2ED | Solar: 17x TSM-340-DE06M.08 (5780Wp ~6200kWh), Azimuth 179°, Hellingshoek: 34° | PC specs


  • mrmrmr
  • Registratie: April 2007
  • Niet online
Ik zou de computer en kabels inspecteren op kortsluiting (verhitte componenten, geur, verkleuring, verbranding, uitgezette condensatoren, breuk in smd componenten, putjes in chips, etc.).

Als dat allemaal in orde is kun je tests uitvoeren zoals memtest86 of tools op Hiren's Boot CD zoals @3DDude noemde. Daarnaast is er ook System Rescue. Vanuit de BIOS (F9) of iLO kun je systeemtests uitvoeren.

Je kan Rufus gebruiken om de usb sticks aan te maken onder Windows.

De computer en connectoren kun je ontdoen van stof met een spuitbus lucht. Kijk ook of de contacten vrij zijn van corrosie en verkleuring. Schoonmaken kan met isopropylalchol en een wattenstaafje of doekje. Eventueel met contactspray als je er niet goed bij kan.

Overigens verbruikt zo'n server door iLO, HDD controller veel energie als die altijd aanstaat. Dat kan tientallen Watts kosten. Je kan een veel zuiniger thuisserver bouwen op basis van een zuinig desktop moederbord.

  • HaTe
  • Registratie: Mei 2007
  • Laatst online: 27-02 07:34

HaTe

haat niet

Topicstarter
Inmiddels heb ik alle condensatoren bekeken: Niks staat bol
Heb alles schoongemaakt
Voeding doorgemeten, geeft netjes 12.05V met 150mV rimpel, wat prima is, ook onder load
Heb een nieuwe SSD gehaald, maar deze nog niet gebruikt. Opeens start alles wel normaal op, terwijl ik niks heb aangepast..

WP: ME PUHZ-SW75YAA + ERST30D-VM2ED | Solar: 17x TSM-340-DE06M.08 (5780Wp ~6200kWh), Azimuth 179°, Hellingshoek: 34° | PC specs


  • 418O2
  • Registratie: November 2001
  • Laatst online: 13:11
HaTe schreef op zaterdag 31 januari 2026 @ 14:11:
Inmiddels heb ik alle condensatoren bekeken: Niks staat bol
Heb alles schoongemaakt
Voeding doorgemeten, geeft netjes 12.05V met 150mV rimpel, wat prima is, ook onder load
Heb een nieuwe SSD gehaald, maar deze nog niet gebruikt. Opeens start alles wel normaal op, terwijl ik niks heb aangepast..
Maar je hebt wel veel kabels losgehaald en weer vast gezet?

  • HaTe
  • Registratie: Mei 2007
  • Laatst online: 27-02 07:34

HaTe

haat niet

Topicstarter
Nouja, ik had zojuist alle HD bays los en dan start hij wel, met bays niet blijkbaar. Ik moet hier even verder induiken..

Update: Grub maar eens opnieuw op de USB gezet toen ik geen schijven had aangesloten, nu lijkt alles wel goed te starten. Hoop dat dit zo blijft.

Update2: Toch weer te vroeg gejuicht. Ik heb nu (weer) problemen met Proxmox services, waaonder de GUI (pveproxy) die niet laad... Het is elke keer wat en dat nog wel op een schone installatie

[ Voor 64% gewijzigd door HaTe op 31-01-2026 14:48 ]

WP: ME PUHZ-SW75YAA + ERST30D-VM2ED | Solar: 17x TSM-340-DE06M.08 (5780Wp ~6200kWh), Azimuth 179°, Hellingshoek: 34° | PC specs


  • 3DDude
  • Registratie: November 2005
  • Laatst online: 22:17

3DDude

I void warranty's

tsjah, die poort waar je CD drive in zit is eigenlijk niet bedoeld voor booten.
je hebt alle firmwares up to date?
Ik lees allemaal workarounds en geklier om die ODD board werkend te krijgen.

Another workaround for the booting from the ODD is to connect it to the onboard SATA connection and change settings in BIOS to use AHCI or Legacy mode and using a dedicated raid card (Such as the HP P420) for the rest of the disks. The onboard RAID controller is terrible so chances are you may be already adding a raid card so not a huge loss.

Kan je dat is doen: Die SSD op de onboard controller en AHCI mode.
Dagje draaien: dan weet je denk echt of het daar ergens in zit of dat die SSD fucked is :)

Dit is ook een optie:
https://tweakers.net/aanbod/zoeken/?keyword=raid+controller

wellicht gewoon voor weinig eentje halen ;)

[ Voor 8% gewijzigd door 3DDude op 31-01-2026 22:41 ]

Be nice, You Assholes :)


  • HaTe
  • Registratie: Mei 2007
  • Laatst online: 27-02 07:34

HaTe

haat niet

Topicstarter
Ik heb de onboard RAID controller al uit staan en de HDD's gaan dus al via AHCI, ook de ODD connector (HD5) (niet zeker), maar die kan je alleen niet kiezen als boot device. Het booten is het probleem nooit geweest, mits je er maar een extra SD kaart op USB stick in zet met een bootloader die verwijst naar HD5.

Momenteel draait het min of meer weer, behalve dat ik Proxmox opnieuw moet instellen. Ik heb nog een paar keer rare dingen gezien met services die niet draaien, of PERL code fouten, dus het lijkt nog steeds niet top. Nu draait het en ik ga voorlopig niet rebooten en zorgen dat alles goed backupt.

Ik vermoed nu dat de Marvell raid controller (in AHCI mode), de interne SATA controlelr (Intel southbridge) of de kabel naar de SSD defect is, maar niet de SSD of hardeschijven zelf. Hoe ik dit 100% kan uitsluiten weet ik nog niet!
Een aparte SATA PCI-E controller kopen is wellicht sowieso wel verstandig en geeft wellicht ook betere performance op de ZFS array. De ZFS pool meldt zelf geen fouten trouwens.

[ Voor 14% gewijzigd door HaTe op 31-01-2026 21:52 ]

WP: ME PUHZ-SW75YAA + ERST30D-VM2ED | Solar: 17x TSM-340-DE06M.08 (5780Wp ~6200kWh), Azimuth 179°, Hellingshoek: 34° | PC specs


  • mrmrmr
  • Registratie: April 2007
  • Niet online
De Intel controller is betrouwbaarder, zuiniger en sneller dan veel losse RAID kaarten. Als je voldoende aansluitingen hebt zou ik het daarbij houden.

Insteekkaarten splisen vaak bandbreedte, waardoor de disk trager data kan transporteren. RAID controllers ("HBA") zijn een systeem in een systeem met een eigen processor, daardoor is het verbruik zo hoog. Dat is ook het geval voor iLO, die heeft ook een eigen processor. Daardoor neemt het verbruik met factor 3 toe ten opzichte van systemen zonder deze onderdelen.

  • HaTe
  • Registratie: Mei 2007
  • Laatst online: 27-02 07:34

HaTe

haat niet

Topicstarter
mrmrmr schreef op zaterdag 31 januari 2026 @ 22:53:
De Intel controller is betrouwbaarder, zuiniger en sneller dan veel losse RAID kaarten. Als je voldoende aansluitingen hebt zou ik het daarbij houden.

Insteekkaarten splisen vaak bandbreedte, waardoor de disk trager data kan transporteren. RAID controllers ("HBA") zijn een systeem in een systeem met een eigen processor, daardoor is het verbruik zo hoog. Dat is ook het geval voor iLO, die heeft ook een eigen processor. Daardoor neemt het verbruik met factor 3 toe ten opzichte van systemen zonder deze onderdelen.
Standaard is er maar 1 directe SATA poort in de Microserver Gen 8 en de 4 hotbays zitten op een andere onboard controller (B120i). Deze laatste kan ik mogelijk beter vervangen lees ik. Toch is dit niet waar ik problemen mee lijk te hebben.
Verbruik maakt me niet veel uit, ik vind het ideaal om met ILO alles te kunnen regelen in dit soort gevallen.

WP: ME PUHZ-SW75YAA + ERST30D-VM2ED | Solar: 17x TSM-340-DE06M.08 (5780Wp ~6200kWh), Azimuth 179°, Hellingshoek: 34° | PC specs


  • mrmrmr
  • Registratie: April 2007
  • Niet online
Zonder Intel SATA, en met volledige bandbreedte en ASPM ondersteuning is waarschijnlijk de ASMedia ASM1166/1164 chip (6x/4x SATA) de beste keus.
Pagina: 1