apic errors > lock-up

Pagina: 1
Acties:

  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
Het probleem:

mn linux systeem loopt vast na een half uurtje dvd overzetten van pc1 naar pc2 (het probleemsysteem). Ik kopieer gelijktijdig van me eigen pc een iso naar share1 (sda) en naar share2 (sdb). Via dmesg volg ik het een beetje en wat blijkt, er komen nogal veel APIC errors:

stukje "dmesg":
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
root@ophidian: dmesg |grep APIC
OEM ID: ACER     Product ID: M21A         APIC at: 0xFEE00000
Processor #0 6:10 APIC version 17
Processor #1 6:10 APIC version 17
I/O APIC #2 Version 17 at 0xFEC00000.
Enabling APIC mode:  Flat.  Using 1 I/O APICs
APIC error on CPU0: 00(04)
APIC error on CPU1: 00(02)
APIC error on CPU0: 04(04)
APIC error on CPU1: 02(08)
APIC error on CPU0: 04(04)
APIC error on CPU1: 08(08)
APIC error on CPU1: 08(02)
APIC error on CPU0: 04(04)
APIC error on CPU1: 02(02)


lilo.conf:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
root@ophidian:/etc# cat lilo.conf
boot = /dev/sda
#compact        # faster, but won't work on all systems.
prompt
timeout = 10
vga = 771
image = /boot/linux
  root = /dev/sda1
  label = Linux
  read-only
  append = "apm=off acpi=off noapic nolapic"
image = /boot/linux-old
  root= /dev/sda1
  label=linux-old
  read-only


specs:
code:
1
2
3
4
5
6
7
8
9
10
Dual P3 XEON 700/2mb
1024MB SD-RAM
Aopen DX2G+
2x 18GB 10k rpm Seagate SCSI
onboard AIC7896
Diamond Viper V770
Aopen CDRW

slackware 10 
linux-2.6.9


Na een tijdje loopt het systeem compleet helemaal vast en kan ik nix meer op de console doen. De webserver is onbereikbaar en natuurlijk is de filetransfer gestopt met een time-out.

na veel got-werk en google heb ik de append regel opgesteld en ook in de kernel (make menuconfig) powermanagement uitgezet (acpi, apm).
Het helpt echter allemaal niets, die errors zijn er nog steeds.... alleen door het toevoegen van "nolapic" lijkt het iets beter te worden maar dat kan ook aan mij liggen :?

in de bios staat de "single processor MP table" op disabled evenals "power management"

Ik wil van die vastlopers af want zo is natuurlijk nix mee te beginnen |:(

offtopic:
ook bij deze pc gaat het laden van de kernel behoooorlijk traag, 20sec ofzow met al die puntjes :?

| Hardcore - Terror |


  • Kees
  • Registratie: Juni 1999
  • Laatst online: 21:31

Kees

Serveradmin / BOFH / DoC
'noapic' zou inderdaad goed moeten werken tegen apic errors.

Welk moederbord/chipset gebruik je? ik heb het zelf ook wel eens gehad (een bootend systeem hing in 1 van de 3 gevallen, door het toevoegen van 'noapic' ging het goed)

"Een serveradmin, voluit een serveradministrator, is dan weer een slavenbeheerder oftewel een slavendrijver" - Rataplan


  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
mainboard is een Aopen DX2G+ met daarop een Intel 440GX chipset voor de Xeon.
http://www.aopen.nl/products/server/motherboard/dx2gplus.htm

Met 2.4.27 is het probleem hetzelfde, sterker nog de APIC errors komen nu veeeeeel sneller. Wederom met geen APM/APIC zaken in de kernel gebakken en met dezeflde "append=" regel als met 2.6

:?

[ Voor 40% gewijzigd door nzyme op 21-10-2004 12:59 ]

| Hardcore - Terror |


  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
Van: http://www.kernel.org/pub/linux/docs/lkml/#s13-4
Why does my kernel report lots of "APIC error" messages?
(REG, contributed by Mark Hahn) You may get messages like: APIC error on CPU1: 00(08).
APIC is the hardware that ia32 systems use to communicate between CPUs to handle low-level events like interrupts and TLB flushes. APIC messages are checksummed, and automatically retried when they fail. This message indicates that a transaction failed; it's only a problem when there are many of them. The APIC checksum is quite weak, so even a few failures is a cause for concern, since it implies that some corruption has likely gone undetected.
Assuming you're not forcing your motherboard to use an invalid system clock (i.e. AGP other than 66 MHz), this is strictly a physical design flaw in your motherboard. The Abit BP6 is notorious for this flaw, but it's not unheard of on other boards (such as the Gigabyte BXD), and it's possible on any board that uses APICs.

You can force the kernel not to use APIC like this with the "noapic" kernel option. This also forces CPU0 to handle all interrupts.
hmz..... waarom krijg ik dan nog wel die meldingen ondanks dat ik toch echt een zooi noapic apm=off etc in de lilo.conf heb staan :?

| Hardcore - Terror |


  • burne
  • Registratie: Maart 2000
  • Niet online

burne

Mine! Waah!

<open deur>
Omdat je vergeten bent lilo te draaien na het aanpassen?
</open deur>

Vergeet APM, dat staat los van APIC. apic=no smp=no moet voldoende zijn om APIC uit te zetten.

[ Voor 42% gewijzigd door burne op 21-10-2004 21:28 ]

I don't like facts. They have a liberal bias.


  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
kom op zeg...... die fase in de linux wereld ben ik al voor bij hoor :p

smp=no :? gast ik heb niet voor nix een dual sys :)
apic=no :? dat kan natuurlijk ook niet want hij verwacht "debug" of "verbose" ipv no :)

append = "nosmp"..... geen apic errors meer ..... maar wel single proc, dus geen oplossing :(

[ Voor 80% gewijzigd door nzyme op 21-10-2004 23:29 ]

| Hardcore - Terror |


  • Hans
  • Registratie: Juni 1999
  • Niet online
Zelfde errors heb ik al bij twee systemen gezien, en tot twee keer toe kwam dit door een rotte Supermicro plank (lekkende condensatoren). Sindsdien blijf ik ver weg bij supermicro :)

Dusseh, misschien wel hardware failure?

[ Voor 11% gewijzigd door Hans op 22-10-2004 10:37 ]


  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
beetje jammer dan, board is nieuw en amper in gebruik nl :? en waarom werkt alleen het smp stukje dan niet :? want ik heb gister een DVD kunnen overzetten zonder problemen van de ene pc naar het doelsysteem zonder problemen, maar dan wel in NON-SMP mode...

[ Voor 41% gewijzigd door nzyme op 22-10-2004 11:14 ]

| Hardcore - Terror |


  • freggy
  • Registratie: Juli 2002
  • Niet online
Probeer eens een 2.6.9? Er zijn nogal wat veranderingen gebeurd aan de ACPI en APIC gedeeltjes, dus wie weet haalt het iets uit...

  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
er staat in de SP dat ik die al gebruik :) daarvoor met 2.6.8.1 ook problemen trouwz.

| Hardcore - Terror |


  • nzyme
  • Registratie: November 2001
  • Laatst online: 28-12-2025
*kick*

| Hardcore - Terror |

Pagina: 1