Jan 2 07:05:19 gimli dhclient: bound to 85.xxx.yyy.zzz -- renewal in 21109 seconds.
Jan 2 12:57:08 gimli dhclient: DHCPREQUEST on eth1 to 217.149.196.4 port 67
Jan 2 12:57:42 gimli last message repeated 3 times
Het eerste probleem ontstaat dus net voor 1 uur 's middags op 2 januari, waar de ethernet link nog up is (getuige het feit dat de berichten nog verstuurd kunnen worden) en de renew ook uiteindelijk slaagt (om 13:20). Aangezien hij DHCP requests uitvoert en geen discovers zal de originele lease nog wel geldig zijn gedurende die tijd, zodat er wat DHCP betreft nog niets aan de hand is. In de praktijk hangt het natuurlijk af of alleen de verbinding met de DHCP server niet goed is, of algemeen. Als het alleen de DHCP server is (misschien bezig met onderhoud) dan hoef je je daar dus niet druk om te maken.
Jan 2 13:20:18 gimli dhclient: bound to 85.xxx.yyy.zzz -- renewal in 21583 seconds.
Jan 2 16:43:17 gimli dhclient: DHCPDISCOVER on eth1 to 255.255.255.255 port 67 interval 10
Het lijkt hier dat de DHCP client direct van lease naar discover gaat, dat is ongebruikelijk. Is hier (rond 16:43) iets uit de log weggevallen of heb je gimli gereset of de lease handmatig gewist of zo?
Jan 2 16:44:16 gimli dhclient: No working leases in persistent database - sleeping.
Jan 2 16:44:16 gimli dhclient: receive_packet failed on eth1: Network is down
Jan 2 16:48:22 gimli dhclient: DHCPDISCOVER on eth1 to 255.255.255.255 port 67 interval 5
Jan 2 16:48:22 gimli dhclient: send_packet: Network is down
[...]
Jan 2 16:49:23 gimli dhclient: Trying recorded lease 85.xxx.yyy.zzz
Jan 2 16:49:23 gimli kernel: e100: eth1: e100_watchdog: link up, 100Mbps, full-duplex
Hier lijkt het er op dat de (Ethernet) link down is, want DISCOVER pakketten moeten normaal gewoon verstuurd kunnen worden zodra je een 'enkele' Ethernet link hebt - dus in dit geval de verbinding van gimli naar het Genexis modem (aangenomen dat daar geen switch of andere apparatuur tussenzit, klopt dat?). Na een paar minuten komt de link kennelijk weer up. Je hebt hier niet toevallig de kabel losgehad, of het Genexis modem gereset?
Wel toevallig dat de link opkomt precies op het moment dat hij de recorded lease gaat proberen (maar dat kan een logging/polling artifact zijn als hij alleen op link checkt als er iets verstuurd moet worden bijvoorbeeld)
Jan 2 16:54:29 gimli dhclient: bound: renewal in 8732 seconds.
Jan 2 17:41:50 gimli shutdown: shutting down for system reboot
Hier heb je een lease, maar besluit je om 17:41 toch gimli te resetten, had je hier verbindingsproblemen (ondanks dat je wel een geldige lease had), of heb je dat om een andere reden gedaan?
Jan 2 17:49:28 gimli kernel: e100: eth1: e100_watchdog: link up, 100Mbps, full-duplex
Jan 2 17:49:31 gimli dhclient: No working leases in persistent database - sleeping.
Jan 2 17:49:31 gimli dhclient: receive_packet failed on eth1: Network is down
Hier zie je een repeterend patroon (tot de lease anderhalf uur later wel weer goed komt), waarbij de kernel steeds zegt dat de link up is (gekomen), maar de dhclient blijft aangeven dat het netwerk down is. Dat is een vreemde situatie.
Enige wat ik zo snel op internet kan vinden over 'receive_packet failed' zijn netwerk driver issues, wellicht is er onlangs iets geupgrade waardoor je server niet meer stabiel werkt? Je hebt ook niet toevallig een brakke kabel of een die niet helemaal netjes ingeplugd/ingeklikt is waardoor de link lijkt te zwabberen?
Aansluiten van een ander apparaat zou kunnen laten zien of het met gimli te maken kan hebben. Nadeel is natuurlijk dat bij wisselen de link onderbroken wordt (wat effect zou kunnen hebben), en je moet op het MAC adres letten, dat kan namelijk expliciet geblokkeerd worden waardoor het probleem apparaat onafhankelijk lijkt, terwijl het dat niet is. Je moet dan dus ook het MAC adres klonen...
Anders zou ik gedurende deze perioden (als het vaker gebeurt) eens de link-leds van het Genexis modem en je server in de gaten houden. Let hierbij wel op dat als het Genexis modem een poort blokkeert (bv. geen dienst geconfigureerd) dat hetgeen je aansluit wel een Ethernet link krijgt. Je kan in dat geval zien dat de link leds op het aangesloten apparaat dus aan zijn, terwijl ze op het Genexis modem uit zijn. De volgende situaties zijn mogelijk:
1) Als je ziet dat link leds aan beide kanten uit zijn is er echt geen link (en dan is het logisch dat DHCP niet werkt)
2) Beide kanten link leds aan dan zou de link ok moeten zijn en mag gimli niet klagen over het versturen van een DISCOVER tenzij er op gilmi zelf iets geblokkeerd wordt of uit staat
3) Als je ziet dat ze aan de apparaat kant wel aan zijn, maar aan de Genexis kant niet, is er geen dienst geconfigureerd op die poort, en zou gimli niet moeten klagen over een network down, maar krijg je dus geen lease
4) Als de Genexis wel een link laat zien maar je aangesloten apparaat niet, dan is er wel een link, maar moet je onderzoeken waarom het aangesloten apparaat dat niet laat zien, of alsnog de data blokkeert (wellicht staat de poort in een speciale mode zoals bij spanning tree dat hij wel een Ethernet link heeft maar niet actief is).