Ik weet niet waar ik mijn vraag moet neer plempen, maar aangezien ik niet 100% zeker ben van software, drop ik het hier maar. Mocht een van de modjes een betere oplossing weten, be my guest 
Ok, here goes..
Sinds januari dit jaar, heb ik mijn server draaien op nieuwe hardware. Even een lijstje van wat er toen is gekomen:
- Lian-Li PC6070+
- Tagan TG480-U22 PSU
- MSI K8N Neo4 Platinum
- AMD64 3200+ Venice
- Arctic Freezer Pro 64
- Matrox PCI passief videokaartje (alleen shell, vandaar)
- Seagate 20gb diskje
- 2x Maxtor 6L080M0 SATA 80G
- 2x WD 120G ATA
- Promise ATA controller
Alles liep na wat gedonder met het compileren van een nieuwe kernel, vrijwel meteen perfect.
Rond mei heb ik een upgrade gedaan, van mijn raid-1 data device. Die is vervangen door 3x Seagate NL35 400G (sata) in raid-5. So far so good. Ook alles nog perfect, tot een paar weken later.
Toen ik de SMART info van deze disks wilde gaan uitlezen, bleek dat dit pas vanaf kernel 2.6.16 werd ondersteund, voor sata disks. Ok, geen probleem, upgraden naar 2.6.17. Zie tijdens het configgen van de nieuwe kernel ook een optie voor acpi. Ik denk, naja, laten we die ook maar aanzetten. Heb dus een hoop acpi features in de kernel gebakken (niks experimenteels!). Kernel gecompileerd, reboot, en wat blijkt, server post niet meer.
He-le-maal dood. Meteen dacht ik aan acpi, maar dat leek me op zich wel sterk daar die kernel nog niet aan het booten was. De powerled blijft heel langzaam knipperen, en that's it. Stekker er uit, cmos gecleared, ding boot, en halverwege post, klap, weer uit...
* UltraSub scratches head.
Heeeel raar. Hardware matig niets gewijzigd, en ineens dit soort reacties.
Stekker er weer uit, tijdje gewacht, en booten. Ding draait gewoon goed. Paar weken niets gedaan, geen problemen gehad. Toen besloten de meegecompileerde acpi opties weer uit de kernel te halen. Zo gezegd zo gedaan, nieuwe kernel geboot, geen problemen. Ik denk aha, opgelost, het was acpi.
Verder niet meer over nagedacht, tot ik vandaag het ding plat moest hebben. Shutdown -h, en weer zo dood als een pier. Werkelijk van alles geprobeerd. Alle sata disks er uit, omdat ik had gehoord van slechte sata stekkers. Mocht niet baten. Het is gewoon of met alle hardware, of compleet gestript hetzelfde. Zolang ik reboot middels ctrl-alt-del is er niets aan de hand. Reboot ik middels een commando (shutdown), of gebruik reset of powerknop op de kast, einde oefening.
Ik kom er met mijn kop niet meer bij. Hij draait nu weer, na wat trial and error. Met alle genoemde hardware. Als ik nu niets doe, weet ik wel zeker dattie een jaar door draait. Dat is toch vaag?? Alle voltages zijn superstabiel overigens, zo ook de temperaturen van alle hardware.
Op deze manier is het geen doen. Rebooten durf ik bijna niet meer, en ben als de dood voor een stroom uitval. Het is niet alleen tijdens een post (maar meestal wel), heb hem ook al abrupt plat zien gaan tijdens de linux boot zelf.
Heeft iemand enig idee wat hier aan de hand kan zijn, en ik over het hoofd zie?
Ok, here goes..
Sinds januari dit jaar, heb ik mijn server draaien op nieuwe hardware. Even een lijstje van wat er toen is gekomen:
- Lian-Li PC6070+
- Tagan TG480-U22 PSU
- MSI K8N Neo4 Platinum
- AMD64 3200+ Venice
- Arctic Freezer Pro 64
- Matrox PCI passief videokaartje (alleen shell, vandaar)
- Seagate 20gb diskje
- 2x Maxtor 6L080M0 SATA 80G
- 2x WD 120G ATA
- Promise ATA controller
Alles liep na wat gedonder met het compileren van een nieuwe kernel, vrijwel meteen perfect.
Rond mei heb ik een upgrade gedaan, van mijn raid-1 data device. Die is vervangen door 3x Seagate NL35 400G (sata) in raid-5. So far so good. Ook alles nog perfect, tot een paar weken later.
Toen ik de SMART info van deze disks wilde gaan uitlezen, bleek dat dit pas vanaf kernel 2.6.16 werd ondersteund, voor sata disks. Ok, geen probleem, upgraden naar 2.6.17. Zie tijdens het configgen van de nieuwe kernel ook een optie voor acpi. Ik denk, naja, laten we die ook maar aanzetten. Heb dus een hoop acpi features in de kernel gebakken (niks experimenteels!). Kernel gecompileerd, reboot, en wat blijkt, server post niet meer.
He-le-maal dood. Meteen dacht ik aan acpi, maar dat leek me op zich wel sterk daar die kernel nog niet aan het booten was. De powerled blijft heel langzaam knipperen, en that's it. Stekker er uit, cmos gecleared, ding boot, en halverwege post, klap, weer uit...
* UltraSub scratches head.
Heeeel raar. Hardware matig niets gewijzigd, en ineens dit soort reacties.
Stekker er weer uit, tijdje gewacht, en booten. Ding draait gewoon goed. Paar weken niets gedaan, geen problemen gehad. Toen besloten de meegecompileerde acpi opties weer uit de kernel te halen. Zo gezegd zo gedaan, nieuwe kernel geboot, geen problemen. Ik denk aha, opgelost, het was acpi.
Verder niet meer over nagedacht, tot ik vandaag het ding plat moest hebben. Shutdown -h, en weer zo dood als een pier. Werkelijk van alles geprobeerd. Alle sata disks er uit, omdat ik had gehoord van slechte sata stekkers. Mocht niet baten. Het is gewoon of met alle hardware, of compleet gestript hetzelfde. Zolang ik reboot middels ctrl-alt-del is er niets aan de hand. Reboot ik middels een commando (shutdown), of gebruik reset of powerknop op de kast, einde oefening.
Ik kom er met mijn kop niet meer bij. Hij draait nu weer, na wat trial and error. Met alle genoemde hardware. Als ik nu niets doe, weet ik wel zeker dattie een jaar door draait. Dat is toch vaag?? Alle voltages zijn superstabiel overigens, zo ook de temperaturen van alle hardware.
Op deze manier is het geen doen. Rebooten durf ik bijna niet meer, en ben als de dood voor een stroom uitval. Het is niet alleen tijdens een post (maar meestal wel), heb hem ook al abrupt plat zien gaan tijdens de linux boot zelf.
Heeft iemand enig idee wat hier aan de hand kan zijn, en ik over het hoofd zie?