Toon posts:

APIC error CPU1: 04(04)

Pagina: 1
Acties:

Verwijderd

Topicstarter
Iemand bekend met deze error?

Korte uitleg, systeem draait goed maar na ongeveer een dag of bij redelijk zware load slaat de machine helemaal vast

Vervolgens staat er dan deze error in het scherm verder niks, ik zie ook niks geks in dmesg heel vreemd dus

Dit gebeurt onder Debian linux 3.1

[ Voor 23% gewijzigd door Verwijderd op 18-03-2006 20:36 ]


  • Bergen
  • Registratie: Maart 2001
  • Laatst online: 27-01 12:55

Bergen

Spellingscontroleur

Wat heb je zelf al gevonden? Wat voor hardware draai je? Welke kernel gebruik je?

Als ik Google erop na sla kom ik al gauw uit op een hardwarematig probleem. Booten met kernelflag 'noapic' is een workaround, maar dan is APIC dus uitgeschakeld.

  • Borromini
  • Registratie: Januari 2003
  • Niet online

Borromini

Mislukt misantroop

APIC is een synchronisatiesysteem ofzo... Ik heb met m'n ATi chipset hetzelfde probleem (alleen andere foutmelding). Ik denk niet dat dat ernstig is (Google zegt dat in ieder geval over mijn foutmelding). Heb je die foutcode al es ingegeven op Google?

Got Leenucks? | Debian Bookworm x86_64 / ARM | OpenWrt: Empower your router | Blogje


Verwijderd

Topicstarter
Linux version 2.4.29 () (gcc version 3.3.5 (Debian 1:3.3.5-8))

Moederbord is een SUPER 370DL3

Heb inderdaad al gezocht op google, maar kon niks vinden over deze error message
ik krijg dus vlak voordat de server crashed op het beeldscherm te zien:

APIC error on CPU1: 04(04) en ik zou heel graag willen weten waar die 04(04) voor staat.

Ik dacht eerst dat het misschien aan het geheugen lag, omdat hij dus soms zo een paar dagen goed loopt en dan ineens weer vast slaat met deze error. heb ook al de netwerkkaart vervangen door een 3com omdat die intelkaart die onboard zit ook voor problemen kan zorgen.

maar ik zie dus verder helemaal geen gekke dingen...

hieronder specs van top:

top - 20:32:53 up 28 min, 2 users, load average: 0.06, 0.05, 0.04
Tasks: 124 total, 1 running, 123 sleeping, 0 stopped, 0 zombie
Cpu0 : 0.7% user, 0.3% system, 0.0% nice, 99.0% idle
Cpu1 : 0.3% user, 1.3% system, 0.0% nice, 98.4% idle
Mem: 2069884k total, 196648k used, 1873236k free, 13120k buffers
Swap: 1951888k total, 0k used, 1951888k free, 65124k cached

dat ziet er dus allemaal ook gewoon goed uit

maar ik zou dus echt heel graag willen weten wat dus die 04(04) error betekend, als ik dan een kapotte cpu heb dan zou ik de cpu's dus kunnen vervangen en zou daarmee het probleem opgelost kunnen zijn.

Ik heb ook al geprobeerd om in lilo.conf het volgende te veranderen:

append="noapic nolapic acpi=0ff"
en daarna lilo gedraaid (voor als iemand vraagt of ik dat misschien vergeten ben)

maar ook dat loopt op een gegevenmoment zomaar vast

hier stukje dmesg waarin je kunt zien dat de kernel automatisch al noapic draait

kernel: ACPI disabled because your bios is from 99 and too old
kernel: You can enable it with acpi=force

[ Voor 16% gewijzigd door Verwijderd op 18-03-2006 21:45 ]


  • Borromini
  • Registratie: Januari 2003
  • Niet online

Borromini

Mislukt misantroop

ACPI en APIC zijn twee erg verschillende dingen - ze hebben niks met mekaar te maken ;). APIC is een counter.

Got Leenucks? | Debian Bookworm x86_64 / ARM | OpenWrt: Empower your router | Blogje


  • Tha_Butcha
  • Registratie: November 2000
  • Laatst online: 30-01 13:59
ik blijf erbij dat het een hardware fout is, als ie eerst goed draait en dan op zijn bek gaat.
of je moet ergens echte een huge memory leak hebben, heb je zwaar experimentele software draaien?

Compromises are for the weak


Verwijderd

Topicstarter
sorry inderdaad, heb zitten slapen acpi is inderdaad wat anders dan apic maar inderdaad heb al wel een tijd gedraaid met dit systeem en het heeft het goed gedaan.

het enige wat ik wel op internet vond was dus een combinatie van deze dingen in de append zetten
wat eventueel deze problemen zou oplossen, heb zelfs al nosmp erbij gezet, maar dan draai je maar op 1 processor

misschien een memmory leak, dat zou kunnen, heb dus inderdaad al wat probleempjes die ik in de log files tegen kwam opgelost, en heb wat cronjobs verandert / uitgezet.
misschien dat het dat inderdaad is.

en anders zou het een hardware iets kunnen zijn, dat gevoel heb ik dus zelf ook dat het zoiets is, maar welke hardware zou het dan kunnen zijn? processors of moederbord.

Heb wel wat gelezen over slechte transitors op deze plank (supermicro 370dl3).... maar natuurlijk kan ik dat nu niet zien en moet ik er weer naartoe omdat te kunnen zien wat ik maandag dus gelijk ga doen.
http://balusc.xs4all.nl/frm/list_messages/28

het geheugen is al vervangen, en de onboard networkkaart die is ook al uitgeschakeld, gebruik nu een 3com netwerk kaart.

het enige wat ik dus nog niet heb vervangen door iets anders is de onboard scsi kaart en de cpu's en het moederbord.

scsi kaart en processors is niet zo'n probleem om te vervangen maar moederbord is een kostbaar iets om te vervangen.

  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025

nzyme

terror

probeer eens de mps versie in de bios naar 1.1 te zetten ipv 1.4 :)

| Hardcore - Terror |


Verwijderd

Topicstarter
alvast bedankt voor je tip, ik zal dat wel proberen als ik weer bij die machine ben. Maar maakt dat zoveel verschil als ik hem op mps 1.1 zet?

en weet iemand waar die 04(04) voor staat?

[ Voor 39% gewijzigd door Verwijderd op 20-03-2006 15:31 ]


  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025

nzyme

terror

waar het voor staat is mij ook een raadsel maar op mn asus dual P3 heb ik hetzelfde probleem. Ik gooi even een dvd image over naar die bak en na de transfer staat mn syslog vol met die apic error on cpuX meldingen. Even naar mps versie 1.1 ipv 1.4 was voldoende :)

een jaar of 2 geleden had ik echter een dual p3 xeon op een aopen dx2g+ die hetzelfde had.... Die kon ik echter niet terugzetten naar 1.1 :(

| Hardcore - Terror |


Verwijderd

Topicstarter
het gekke is wel dat ik die error niet zie in de syslog maar alleen op het scherm als hij is vastgelopen. en ik heb een hele tijd gewoon goed gedraaid op deze kernel.

vrijdag ga ik naar de server locatie met een vervangend moederbord en dan ga ik kijken of het misschien toch die transistors zijn die niet goed meer zijn, ik zal er wel een foto van posten zodat andere mensen met eventueel zelfde problemen het verschil kunnen zien.

Er zijn een aantal borden van verschillende fabrikanten in omloop waarop gewoon slechte transitoren zijn gemonteerd, deze zouden kunnen gaan lekken en dit soort problemen kunnen veroorzaken.

[ Voor 19% gewijzigd door Verwijderd op 22-03-2006 11:24 ]


  • jep
  • Registratie: November 2000
  • Laatst online: 06-02 17:12

jep

Ik heb dit probleem ook op een Asus machine waarop ik een workaround heb toegepast door wat dingen in /dev/mtr zijn gewijzigd. Mijn machine draait sinds die workaround echter super en dan negeer ik die foutmelding maar. :)

Verwijderd

Topicstarter
ik had vorig jaar dit probleem ook, heb toen de bus teruggezet van 133 naar 100 mhz, het is toen ook een hele tijd weer goed gegaan, tot aan nu zeg maar
Pagina: 1