[Gentoo] APIC errors & Abit VP6 server

Pagina: 1
Acties:

  • MrDummy
  • Registratie: April 2000
  • Laatst online: 25-07-2025

MrDummy

Nog steeds gek op anime...

Topicstarter
Ik draai op de coloplek de niet zo lang geleden de upgraded server.
65 dagen heeft het mooi gelopen, en plotseling - waarschijnlijk teveel apic errors - zodat het zichzelf vastloopt.
De crash van server varieert steeds: soms is het te pingen maar geen draaiende proggies, soms niet te pingen, soms alleen netwerkkaart uitgevallen.

Configuratie systeem:
Abit VP6 moederbord
Dual Intel P3 Coppermine 700 MHz, dezelfde stepping
S3 videokaart in PCI#1
3Com 3c905 10/100 netwerkkaart in slot #2 (dus naast elkaar)
3x 512 MB SDRAM = 1,5 GB RAM

Als drives zijn: cdrom speler, 80 GB 7200 rpm maxtor, 15 GB 5400 rpm maxtor, diskdrive

OS:
Linux Gentoo, kernel 2.4.26

Er is geprobeerd met noapic en MPS 1.1 en 1.4. Beiden geven nog steeds errors.
VP6 is een VIA moederbord met 694x chipset. Er zijn wel succesvolle verhalen van gelezen, maar hier ging het niet zo lekker.
De storingen, na 65 dagen run, komen vrijwel weer na ongeveer 5-8 dagen runtime terug. Ze komen dus vrij snel terug. Waarom ze plotseling optreden is onvoorstelbaar. Tijdens run zijn er al APIC errors gemeld in de log.
Er is ook ACPI. Moet deze uit?
De server liep ook vast met noapic setting.

Bekijk de gegevens onderaan en vertel me maar eens hoe je over vreemde storingen denkt, vooral met Abit VP6 moederbord.
Er is idee dat 3Com niet zo lekker samenwerkt met VP6.
De drivers kunnen ook niet zo goed zijn.
Er is voorstel om te vervangen door Intel Pro/100S netwerkkaart. Goed idee?

Foto's colo:
Afbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2120.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2121.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_01_30/TN_116_1695.JPG

Foto's gegevens scherm:
(cat proc/interrupts)
Afbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2156.JPG

(dmesg)
Afbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2143.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2144.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2145.JPG
Afbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2146.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2147.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2148.JPG
Afbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2149.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2150.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2151.JPG
Afbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2152.JPGAfbeeldingslocatie: http://www.dutchanime.net/colo/colo2004_04_15/TN_121_2153.JPG

  • sphere
  • Registratie: Juli 2003
  • Laatst online: 21:36

sphere

Debian abuser

Ik snap niet wat nou je probleem is. In ieder geval blijkt dat niet uit je startpost. Je vermeld helemaal geen errors :? Ik zie alleen wat quirks staan in je dmesg maar verder geen error.

Als die bak pas vastloopt na langere tijd lijkt het me lastig debuggen. MAar systematisch is "the way to go" zoals altijd.

Als je denkt dat het aan ACPI/APIC ligt, kan je hier meer info vinden en links om een bugreport te plaatsen op bugzilla.kernel.org. Maar zoals gezegd zou ik dan eerst eens met concrete errors op de proppen komen.

http://acpi.sourceforge.net/

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454


Verwijderd

Je had het over de "noapic" boot parameter. Er is echter ook een "nolapic" parameter (met een 'l' tussen de 'o' en de 'a' erin dus). Om mijn Nforce2-based moederbord zonder crashes te laten functioneren (bekend probleem, breek me de bek niet open), moet ik in elk geval beide parameters opgeven. ACPI mag dan aan blijven staan.

Hoewel jij een moederbord met een totaal andere chipset hebt, kan het toch zeker geen kwaad om het te proberen, aangezien jouw problemen kennelijk eveneens APIC-related zijn.

Succes! :)

  • RvdH
  • Registratie: Juni 1999
  • Laatst online: 19-02 14:54

RvdH

Uitvinder van RickRAID

Staan er geen foutmeldingen in je logfiles ofzo (/var/log/*)?

  • _JGC_
  • Registratie: Juli 2000
  • Nu online
VIA en APIC... heb dat KT266A kreng van mij al tig keren laten vastlopen met APIC errors met 2.6. AFAIK hebben ze in de laatste 2.4 kernels de ACPI code gebackport uit 2.6.
Denk dat je er evt omheen zou kunnen werken met een flink gebackporte 2.4.18 kernel ofzo, Debian houdt op dit moment 2.4.18 bij, ik weet van Redhat dat ze 2.4.20 bijhouden. van Redhat zijn er SRPMs te krijgen, Debian heeft .orig.tar.gz's met een .diff.gz patch archief erbij.

Volgende keer overigens liever dmesg > textfile, vervolgens deze textfile ergens uploaden en linken.

  • yootje
  • Registratie: December 2002
  • Laatst online: 29-09-2025
Ik ben bezig met dit topic: [rml][ Gentoo] Emergen loopt voortdurend vast[/rml] en dit topic kan mij ook misschien helpen. Mag ik vragen hoe je die noapic en nolapic later (dus niet als je installeert) doet?

edit: append="noapic" :)

[ Voor 9% gewijzigd door yootje op 26-04-2004 09:57 ]


  • MrDummy
  • Registratie: April 2000
  • Laatst online: 25-07-2025

MrDummy

Nog steeds gek op anime...

Topicstarter
_JGC_ schreef op 26 april 2004 @ 08:55:Volgende keer overigens liever dmesg > textfile, vervolgens deze textfile ergens uploaden en linken.
Sorry, ik was in haast alles te fotograferen wat op het scherm staat, en heb deze info niet gekregen dat ik in textfile kan doen.
IK zal even mijn maat roepen, dan kan hij meer info over geven.

  • sphere
  • Registratie: Juli 2003
  • Laatst online: 21:36

sphere

Debian abuser

Verwijderd schreef op 26 april 2004 @ 03:22:
Je had het over de "noapic" boot parameter. Er is echter ook een "nolapic" parameter (met een 'l' tussen de 'o' en de 'a' erin dus). Om mijn Nforce2-based moederbord zonder crashes te laten functioneren (bekend probleem, breek me de bek niet open), moet ik in elk geval beide parameters opgeven. ACPI mag dan aan blijven staan.

Hoewel jij een moederbord met een totaal andere chipset hebt, kan het toch zeker geen kwaad om het te proberen, aangezien jouw problemen kennelijk eveneens APIC-related zijn.

Succes! :)
Motown: dit is voor jou:
http://atlas.et.tudelft.nl/verwei90/nforce2

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454


Verwijderd

Bedankt. ;)

Maar ik was al op de hoogte van die patches. Ik vraag me alleen af of ik die patches ook met nieuwere kernel-versies kan gebruiken, want de drivers voor de Silicon Image SATA controllers zijn in de laatste releases flink verbeterd.

Bovendien is het reeds duidelijk dat het probleem kan worden opgelost als Asus nou eindelijk met een BIOS-update komt waarin een triviale fix is opgenomen die NVIDIA allang in hun reference BIOS had toegepast! :(

Ik heb Asus er nou al drie keer over gemailed en slechts een keer een (niet bevredigende) reactie gehad. :( Dit valt me echt tegen voor een bedrijf als Asus. Andere fabrikanten (waaronder MSI) hebben allang een update uitgebracht met de nodige fix. :(

  • sphere
  • Registratie: Juli 2003
  • Laatst online: 21:36

sphere

Debian abuser

offtopic:
Zou je dat willen mailen naar het email adres dat op die nforce2 pagina staat? Volgens mij is er alleen maar een fix voor Shuttle borden :? We hijacken het topic een beetje, mijn excuses aan de TS

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454


Verwijderd

sphere2 schreef op 27 april 2004 @ 20:02:
offtopic:
Zou je dat willen mailen naar het email adres dat op die nforce2 pagina staat? Volgens mij is er alleen maar een fix voor Shuttle borden :? We hijacken het topic een beetje, mijn excuses aan de TS
offtopic:
Hmmm, ik meende toch echt ergens gelezen te hebben "MSI en Shuttle". :? Maar ik kan er naast zitten, hoor. Als ik het nog eens een keer tegenkom, stuur ik het wel naar die site. :)

Verwijderd

NEWSFLASH

Tja, sorry mods, nog steeds off-topic, maar ik moet het toch even kwijt. :P

sphere2, check de changelog van de nieuwste Andrew Morton RC-release (2.6.6-rc3-mm2) eens:

code:
1
2
+nforce-disconnect-fix.patch
 Fix the nforce2 horrors.


... en nog verderop in diezelfde changelog:

code:
1
2
nforce-disconnect-fix.patch
  nforce2 C1 halt disconnect fix


Whoohooo! Probleem eindelijk opgelost! Ik heb nog nooit een MM-kernel geprobeerd, maar dit keer ga ik een uitzondering maken.

/me is hartstikke blij :D
Pagina: 1