Processen lopen zomaar vast

Pagina: 1
Acties:

  • FCA
  • Registratie: April 2000
  • Laatst online: 19-02 11:12
Goed, ik heb dus een probleem. Ik heb een gentoo speelservertje, en nu was ik alles aan het herbouwen (emerge -ep system) met gcc 3.4, om te kijken of alles wel compiled.
Nu liep alles goed, tot ik opeens na het mergen van een package de volgende onvriendelijke mededeling voor m'n neus kreeg:
code:
1
2
doebuild(): aux_get() error; aborting.
segmentation fault

Dus ik vanaf dat package opnieuw mergen, hangt de merge voordat ie is begonnen met downloaden. Een top gaf een stuk of 20 apache processen aan, dus ik stopte apache (nette manier, dus /etc/init.d/apache2 stop)
nu hangt top, ps etc, alleen als ik root ben, als gewone user doet ie het gewoon (maar laat veel minder zien, grsec kernel) apache wil niet starten, killall -9 apache2 hangt ook.
De temperaturen die ik doorkrijg zijn behoorlijk zover ik kan zien ( 27 graden), dus dat lijkt me het niet. memtest86 kan ik niet emergen, dan hangt ie ook gewoon, maar het geheugen lijkt me dit ook niet, anders zou die wel tijdens het compilen falen, niet als ie verder niks lijkt te doen. gcc 3.4 gebruik al tijden op m'n andere computer, nooit een centje pijn gehad daarmee, alleen af en toe wilde iets niet compilen.

Iemand een idee wat er aan de hand is?
emerge --info:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Portage 2.0.50-r8 (default-x86-1.4, gcc-3.4.0, glibc-2.3.3.20040420-r0, 2.6.5-hardened-r5)
=================================================================
System uname: 2.6.5-hardened-r5 i686 Pentium III (Coppermine)
Gentoo Base System version 1.4.16
distcc 2.13 i686-pc-linux-gnu (protocols 1 and 2) (default port 3632) [disabled]
Autoconf: sys-devel/autoconf-2.59-r3
Automake: sys-devel/automake-1.8.3
ACCEPT_KEYWORDS="x86"
AUTOCLEAN="yes"
CFLAGS="-march=pentium3 -O2 -fomit-frame-pointer -momit-leaf-frame-pointer -ftracer -ffast-math -pipe -fstack-protector"
CHOST="i686-pc-linux-gnu"
COMPILER="gcc3"
CONFIG_PROTECT="/etc /usr/kde/2/share/config /usr/kde/3/share/config /usr/share/config /var/qmail/alias /var/qmail/control"
CONFIG_PROTECT_MASK="/etc/gconf /etc/terminfo /etc/env.d"
CXXFLAGS="-march=pentium3 -O2 -fomit-frame-pointer -momit-leaf-frame-pointer -ftracer -ffast-math -pipe -fstack-protector"
DISTDIR="/usr/portage/distfiles"
FEATURES="autoaddcvs ccache sandbox userpriv usersandbox"
GENTOO_MIRRORS="ftp://ftp.snt.utwente.nl/pub/os/linux/gentoo http://gentoo.oregonstate.edu http://www.ibiblio.org/pub/Linux/distributions/gentoo"
MAKEOPTS="-j2"
PKGDIR="/usr/portage/packages"
PORTAGE_TMPDIR="/var/tmp"
PORTDIR="/usr/portage"
PORTDIR_OVERLAY="/usr/local/portage"
SYNC="rsync://rsync.europe.gentoo.org/gentoo-portage"
USE="apache2 crypt gd hardened jpeg ldap mbox mmx mysql pam pic png sse ssl tcltk tcpd threads x86 zlib"


Goed, ik zag dus net het volgende in m'n log
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
kernel BUG at fs/buffer.c:1355!
invalid operand: 0000 [#1]
PREEMPT
CPU:    0
EIP:    0060:[<c01d7bc7>]    Not tainted
EFLAGS: 00010046   (2.6.5-hardened-r5)
eax: 00000092   ebx: 00001000   ecx: 00001000   edx: 000020c0
esi: 00000000   edi: ebfdb040   ebp: 000020c0   esp: d6bfdc4c
ds: 007b   es: 007b   ss: 0068
Process emerge (pid: 13470, threadinfo=d6bfc000 task=e1775220)
Stack: 00000001 00001000 00000000 00000000 00000000 00000000 00000000 ea323e80
       00000000 00000000 00001000 000020c0 ebfdb040 ebd5de00 c01da669 d6bfde20
       000273b2 d6bfde24 c01da696 d6bfde20 c0224711 e86bbcb8 00000010 e86bbcb8
Call Trace: [<c01da669>]  [<c01da696>]  [<c0224711>]  [<c022d7f3>]  [<c01d7b01>]  [<c01d7b01>]  [<c01da669>]  [<c01da669>]  [<c02258c4>]  [<c0210130>]  [<c0227418>]  [<c019e96b>]  [<c02278ab>]  [<c020fef0>]  [<c020ffb4>]  [<c01cc681>]  [<c020fef0>]  [<c01efee1>]  [<c01eef33>]  [<c01ecc47>]  [<c01d69d1>]  [<c028e395>]  [<c01a410f>]  [<c01a4b9f>]
Code: 0f 0b 4b 05 ef 06 37 c0 e9 a8 fe ff ff e8 e7 68 fc ff e9 17
 <6>note: emerge[13470] exited with preempt_count 2
bad: scheduling while atomic!
Call Trace: [<c019e46a>]  [<c01c57c2>]  [<c01c5a5e>]  [<c01ca79c>]  [<c01a0865>]  [<c01a41e6>]  [<c018fe6b>]  [<c01900f0>]  [<c0190178>]  [<c01d7bc7>]  [<c0224655>]  [<c018f7ad>]  [<c01d7bc7>]  [<c01da669>]  [<c01da696>]  [<c0224711>]  [<c022d7f3>]  [<c01d7b01>]  [<c01d7b01>]  [<c01da669>]  [<c01da669>]  [<c02258c4>]  [<c0210130>]  [<c0227418>]
bad: scheduling while atomic!
Call Trace: [<c019e46a>]  [<c01da669>]  [<c0224cad>]  [<c01da669>]  [<c01da696>]  [<c0226955>]  [<c01da696>]  [<c0224711>]  [<c022d3a4>]  [<c022c5ac>]  [<c021b80c>]  [<c020fef0>]  [<c020fef0>]  [<c020ffe1>]  [<c020fef0>]  [<c01efee1>]  [<c01eef33>]  [<c01ecc47>]  [<c01d69d1>]  [<c01ca86b>]  [<c01a0865>]  [<c01a41e6>]  [<c018fe6b>]  [<c01900f0>]
bad: scheduling while atomic!
Call Trace: [<c019e46a>]  [<c01a06a1>]  [<c019efa1>]  [<c01c2504>]  [<c020fef0>]  [<c01d7889>]  [<c020fef0>]  [<c01ef298>]  [<c020ff33>]  [<c01eff5f>]  [<c01eef33>]  [<c01ecc47>]  [<c01d69d1>]  [<c01ca86b>]  [<c01a0865>]  [<c01a41e6>]  [<c018fe6b>]  [<c01900f0>]  [<c0190178>]  [<c01d7bc7>]  [<c0224655>]  [<c018f7ad>]  [<c01d7bc7>]  [<c01da669>]

dat lijkt me het probleem dus. Maar hoe nu op te lossen?

[ Voor 33% gewijzigd door FCA op 26-06-2004 20:15 . Reden: kernel oops gevonden. ]

Verandert z'n sig te weinig.


  • Emmeau
  • Registratie: Mei 2003
  • Niet online

Emmeau

All your UNIX are belong to us

regel 10:
CFLAGS="-march=pentium3 -O2 -fomit-frame-pointer -momit-leaf-frame-pointer -ftracer -ffast-math -pipe -fstack-protector"

moet het niet -fomit-leaf-frame-pointer zijn?
en ik vermoed dat tijdens je emergen van je system wat code verkeerd gecompileerd is (te agressieve optimalisatie misschien?) en een library of iets (waarschijnlijk thread scheduling of het mutex gedeelte).
probeer:
hercompileren met een correcte syntax
hercompileren met een minder strenge optimalisatie?

If you choose to criticise you choose your enemies


  • FCA
  • Registratie: April 2000
  • Laatst online: 19-02 11:12
-momit-leaf-frame-pointer is wel degelijk goed, zie de gcc manual en volgens mij wordt glibc (wat de threading zou moeten doen denk ik) alleen met -O2 -march=pentium3 gebouwd. Ik gok nu eigenlijk dat de hardened en -fstack-protector problemen geven, dat is namelijk het grootste verschil met mijn desktop, en die draait volledig met dit soort flags. Op dit moment wil er niks emergen, dus ik ga morgen als ik weer op m'n kamer ben het ding maar eens fysiek herstarten, want een software reboot wil niet eens meer.

Verandert z'n sig te weinig.


  • igmar
  • Registratie: April 2000
  • Laatst online: 31-01 23:50

igmar

ISO20022

FCA schreef op 26 juni 2004 @ 20:12:
Goed, ik zag dus net het volgende in m'n log
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
kernel BUG at fs/buffer.c:1355!
invalid operand: 0000 [#1]
PREEMPT
CPU:    0
EIP:    0060:[<c01d7bc7>]    Not tainted
EFLAGS: 00010046   (2.6.5-hardened-r5)
eax: 00000092   ebx: 00001000   ecx: 00001000   edx: 000020c0
esi: 00000000   edi: ebfdb040   ebp: 000020c0   esp: d6bfdc4c
ds: 007b   es: 007b   ss: 0068
Process emerge (pid: 13470, threadinfo=d6bfc000 task=e1775220)
Stack: 00000001 00001000 00000000 00000000 00000000 00000000 00000000 ea323e80
       00000000 00000000 00001000 000020c0 ebfdb040 ebd5de00 c01da669 d6bfde20
       000273b2 d6bfde24 c01da696 d6bfde20 c0224711 e86bbcb8 00000010 e86bbcb8
Call Trace: [<c01da669>]  [<c01da696>]  [<c0224711>]  [<c022d7f3>]  [<c01d7b01>]  [<c01d7b01>]  [<c01da669>]  [<c01da669>]  [<c02258c4>]  [<c0210130>]  [<c0227418>]  [<c019e96b>]  [<c02278ab>]  [<c020fef0>]  [<c020ffb4>]  [<c01cc681>]  [<c020fef0>]  [<c01efee1>]  [<c01eef33>]  [<c01ecc47>]  [<c01d69d1>]  [<c028e395>]  [<c01a410f>]  [<c01a4b9f>]
Code: 0f 0b 4b 05 ef 06 37 c0 e9 a8 fe ff ff e8 e7 68 fc ff e9 17
 <6>note: emerge[13470] exited with preempt_count 2
bad: scheduling while atomic!
Call Trace: [<c019e46a>]  [<c01c57c2>]  [<c01c5a5e>]  [<c01ca79c>]  [<c01a0865>]  [<c01a41e6>]  [<c018fe6b>]  [<c01900f0>]  [<c0190178>]  [<c01d7bc7>]  [<c0224655>]  [<c018f7ad>]  [<c01d7bc7>]  [<c01da669>]  [<c01da696>]  [<c0224711>]  [<c022d7f3>]  [<c01d7b01>]  [<c01d7b01>]  [<c01da669>]  [<c01da669>]  [<c02258c4>]  [<c0210130>]  [<c0227418>]
bad: scheduling while atomic!
Call Trace: [<c019e46a>]  [<c01da669>]  [<c0224cad>]  [<c01da669>]  [<c01da696>]  [<c0226955>]  [<c01da696>]  [<c0224711>]  [<c022d3a4>]  [<c022c5ac>]  [<c021b80c>]  [<c020fef0>]  [<c020fef0>]  [<c020ffe1>]  [<c020fef0>]  [<c01efee1>]  [<c01eef33>]  [<c01ecc47>]  [<c01d69d1>]  [<c01ca86b>]  [<c01a0865>]  [<c01a41e6>]  [<c018fe6b>]  [<c01900f0>]
bad: scheduling while atomic!
Call Trace: [<c019e46a>]  [<c01a06a1>]  [<c019efa1>]  [<c01c2504>]  [<c020fef0>]  [<c01d7889>]  [<c020fef0>]  [<c01ef298>]  [<c020ff33>]  [<c01eff5f>]  [<c01eef33>]  [<c01ecc47>]  [<c01d69d1>]  [<c01ca86b>]  [<c01a0865>]  [<c01a41e6>]  [<c018fe6b>]  [<c01900f0>]  [<c0190178>]  [<c01d7bc7>]  [<c0224655>]  [<c018f7ad>]  [<c01d7bc7>]  [<c01da669>]

dat lijkt me het probleem dus. Maar hoe nu op te lossen?
Zet preemption in de kernel uit, zo te zien heeft de oops daarmee te maken. D'r zijn AFAIK nog steeds problemen mee. Het gedrag van een kernel na een oops is iig niet te voorspellen, dus rebooten :)

  • sebas
  • Registratie: April 2000
  • Laatst online: 16-12-2025
bad scheduling while atomic duidt inderdaad op een probleem met preemption. Je gebruikt dus een kernel feature, die niet met preemption overweg kan. Dus of je zet preemption uit, of je zoekt welke feature erover struikelt.

En aub, breek de logs af. Die is echt zwaar onleesbaar, als je wilt dat mensen je helpen, irriteer ze dan niet met onleesbare post of/en verneukte layouts. (Hetzelfde geldt voor quoting.)

Everyone complains of his memory, no one of his judgement.