[C++] Eigengemaakte linux daemon wil niet stoppen

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

  • Gehakt
  • Registratie: Juli 2002
  • Laatst online: 19-09 15:50
Ik ben bezig met het bouwen van een red hat cluster op twee virtual machines.
Dit is gelukt en met apache als service zie ik netjes een fail over.

Nu is de volgende stap die ik wilde doen zelf een programma maken en deze als daemon starten en laten stoppen. De applicatie is zeer simpel. Het enige wat de applicatie moet doen is een zin met de hostname wegschrijven in een bestand.

Het resultaat wat ik wil bereiken is dat ik op een gedeelde opslag 1 logfile zie met iets van de volgende meldingen:
code:
1
2
3
4
5
6
7
8
9
Actief op node: 'node1'
Actief op node: 'node1'
Actief op node: 'node1'
Actief op node: 'node2'
Actief op node: 'node2'
Actief op node: 'node2'
Actief op node: 'node1'
Actief op node: 'node1'
Actief op node: 'node1'


De applicatie (simpele main) die ik heb geschreven bevat in feite het volgende:
C++:
1
2
3
4
5
6
7
8
// haal de hostname op
while(1)
{
   // open het logbestand
   // schrijf een regel inc hostname in het logbestand
   // sluit het logbestand
   // sleep 1 seconde
}



De linux cluster service maakt gebruik van een script in /etc/init.d voor het stopen/starten en de status van de daemon. Hiervoor heb ik een kopie gemaakt van /etc/init.d/skeleton
De enige aanpassingen die ik daarin heb gemaakt zijn het veranderen van de applicatie naam en de optie "--background" meegegeven voor het starten.

Het starten van de daemon in het cluster lijkt ook netjes te gaan. Het stoppen van de daemon duurt echter erg lang en mislukt vervolgens. Ik vermoed dus dat ik ergens een denkfout maak en dat het niet zo simpel is. Moet ik nog iets van signals in mijn applicatie implementeren?


Mijn init.d script is als volgt:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
#! /bin/sh
### BEGIN INIT INFO
# Provides:          clustertest
# Required-Start:    $remote_fs $syslog
# Required-Stop:     $remote_fs $syslog
# Default-Start:     2 3 4 5
# Default-Stop:      0 1 6
# Short-Description: Example initscript
# Description:       This file should be used to construct scripts to be
#                    placed in /etc/init.d.
### END INIT INFO

# Author: Foo Bar <foobar@baz.org>
#
# Please remove the "Author" lines above and replace them
# with your own name if you copy and modify this script.

# Do NOT "set -e"

# PATH should only include /usr/* if it runs after the mountnfs.sh script
PATH=/sbin:/usr/sbin:/bin:/usr/bin
DESC="Description of the service"
NAME=clustertest
DAEMON=/usr/bin/$NAME
DAEMON_ARGS="/home/joost/DaemonLogFile.txt"
PIDFILE=/var/run/$NAME.pid
SCRIPTNAME=/etc/init.d/$NAME

# Exit if the package is not installed
[ -x "$DAEMON" ] || exit 0

# Read configuration variable file if it is present
[ -r /etc/default/$NAME ] && . /etc/default/$NAME

# Load the VERBOSE setting and other rcS variables
. /lib/init/vars.sh

# Define LSB log_* functions.
# Depend on lsb-base (>= 3.0-6) to ensure that this file is present.
. /lib/lsb/init-functions

#
# Function that starts the daemon/service
#
do_start()
{
    # Return
    #   0 if daemon has been started
    #   1 if daemon was already running
    #   2 if daemon could not be started
    start-stop-daemon --start --quiet --background --pidfile $PIDFILE --exec $DAEMON --test > /dev/null \
        || return 1
    start-stop-daemon --start --quiet --background --pidfile $PIDFILE --exec $DAEMON -- \
        $DAEMON_ARGS \
        || return 2
    # Add code here, if necessary, that waits for the process to be ready
    # to handle requests from services started subsequently which depend
    # on this one.  As a last resort, sleep for some time.
}

#
# Function that stops the daemon/service
#
do_stop()
{
    # Return
    #   0 if daemon has been stopped
    #   1 if daemon was already stopped
    #   2 if daemon could not be stopped
    #   other if a failure occurred
    start-stop-daemon --stop --quiet --retry=TERM/30/KILL/5 --pidfile $PIDFILE --name $NAME
    RETVAL="$?"
    [ "$RETVAL" = 2 ] && return 2
    # Wait for children to finish too if this is a daemon that forks
    # and if the daemon is only ever run from this initscript.
    # If the above conditions are not satisfied then add some other code
    # that waits for the process to drop all resources that could be
    # needed by services started subsequently.  A last resort is to
    # sleep for some time.
    start-stop-daemon --stop --quiet --oknodo --retry=0/30/KILL/5 --exec $DAEMON
    [ "$?" = 2 ] && return 2
    # Many daemons don't delete their pidfiles when they exit.
    rm -f $PIDFILE
    return "$RETVAL"
}

#
# Function that sends a SIGHUP to the daemon/service
#
do_reload() {
    #
    # If the daemon can reload its configuration without
    # restarting (for example, when it is sent a SIGHUP),
    # then implement that here.
    #
    start-stop-daemon --stop --signal 1 --quiet --pidfile $PIDFILE --name $NAME
    return 0
}

case "$1" in
  start)
    [ "$VERBOSE" != no ] && log_daemon_msg "Starting $DESC" "$NAME"
    do_start
    case "$?" in
        0|1) [ "$VERBOSE" != no ] && log_end_msg 0 ;;
        2) [ "$VERBOSE" != no ] && log_end_msg 1 ;;
    esac
    ;;
  stop)
    [ "$VERBOSE" != no ] && log_daemon_msg "Stopping $DESC" "$NAME"
    do_stop
    case "$?" in
        0|1) [ "$VERBOSE" != no ] && log_end_msg 0 ;;
        2) [ "$VERBOSE" != no ] && log_end_msg 1 ;;
    esac
    ;;
  status)
       status_of_proc "$DAEMON" "$NAME" && exit 0 || exit $?
       ;;
  #reload|force-reload)
    #
    # If do_reload() is not implemented then leave this commented out
    # and leave 'force-reload' as an alias for 'restart'.
    #
    #log_daemon_msg "Reloading $DESC" "$NAME"
    #do_reload
    #log_end_msg $?
    #;;
  restart|force-reload)
    #
    # If the "reload" option is implemented then remove the
    # 'force-reload' alias
    #
    log_daemon_msg "Restarting $DESC" "$NAME"
    do_stop
    case "$?" in
      0|1)
        do_start
        case "$?" in
            0) log_end_msg 0 ;;
            1) log_end_msg 1 ;; # Old process is still running
            *) log_end_msg 1 ;; # Failed to start
        esac
        ;;
      *)
        # Failed to stop
        log_end_msg 1
        ;;
    esac
    ;;
  *)
    #echo "Usage: $SCRIPTNAME {start|stop|restart|reload|force-reload}" >&2
    echo "Usage: $SCRIPTNAME {start|stop|status|restart|force-reload}" >&2
    exit 3
    ;;
esac

:

Zoals eerder vermeld: alleen de naam van de applicatie is ingevuld en bij het starten wordt de optie --background extra opgegeven.

Iemand ideeen waarom mijn daemon niet netjes zou willen stoppen? Het lijkt er na lange tijd (30+ s) op dat de service toch gestopt maar het werkt niet in combinatie met het cluster.

Acties:
  • 0 Henk 'm!

  • BoAC
  • Registratie: Februari 2003
  • Laatst online: 20-09 23:24

BoAC

Memento mori

Kijk is naar de manpage van signal. Zet in de functie die je gaat maken een variable om in je prog bijvoorbeeld en break dan uit je eigen while loop.

Acties:
  • 0 Henk 'm!

  • Gehakt
  • Registratie: Juli 2002
  • Laatst online: 19-09 15:50
Ik heb een signal handler ingebouwd maar het lijkt nog niet te werken. Ik ben er al wel achter dat het default signal wat --stop stuurt TERM is.

Dit is de code van mij applicatie. Het is de volledige code en het verdient aangezien het bijna niks is. Ik heb echt geen idee waarom hij niet netjes en snel gestopt kan worden door het init.d script.

C++:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
#include <stdio.h>
#include <unistd.h>

#include <iostream>
#include <fstream>
#include <string.h>
#include <signal.h>

using namespace std;

// GLOBAL VARIABLES
const int HOST_NAME_MAX(64);
volatile bool run_program(true);

// FORWARD DECLARATION
void handler(int sig, siginfo_t* siginfo, void* context);

int main(int argc, char **argv)
{

    struct sigaction new_action;

    memset(&new_action, '\0', sizeof(new_action));

    new_action.sa_sigaction = &handler;
    new_action.sa_flags = SA_SIGINFO;

    sigaction(SIGTERM, &new_action, 0);

// declare buffer and get hostname string
    char hostName[HOST_NAME_MAX];
    hostName[HOST_NAME_MAX] = '\0';
    int error = gethostname(hostName, HOST_NAME_MAX);

// declare output stream (file)
    ofstream outputFile;

    while(true)
    {
        // Check if we should brake the loop because of a signal
        if (!run_program)
        {
            break;
        }

        string hostNameString;
        hostNameString += string("ClusterTest runs on node: '");
        hostNameString += string(hostName);
        hostNameString += string("'\n");

// Open file, write string, close file
        outputFile.open(argv[1], ios::app);
        outputFile << hostNameString;
        outputFile.close();

    }
    return 0;
}

void handler(int sig, siginfo_t* siginfo, void* context)
{
    printf ("Sending PID: %ld, UID: %ld\n",
        (long)siginfo->si_pid, 
        (long)siginfo->si_uid);
    run_program = false;
}

[ Voor 4% gewijzigd door Gehakt op 07-01-2012 00:06 ]


Acties:
  • 0 Henk 'm!

  • farlane
  • Registratie: Maart 2000
  • Laatst online: 15:26
Stuur em eens handmatig een SIGTERM of SIGKILL, stopt ie dan wel?

Somniferous whisperings of scarlet fields. Sleep calling me and in my dreams i wander. My reality is abandoned (I traverse afar). Not a care if I never everwake.


Acties:
  • 0 Henk 'm!

  • Gehakt
  • Registratie: Juli 2002
  • Laatst online: 19-09 15:50
Ja dan stop hij wel. Als ik kill -s TERM <processid> stuur stopt het geheel wel. Stukje uit de manpage van start-stop-daemon:
−s, −−signal signal

With −−stop, specifies the signal to send to processes being stopped (default TERM).

[ Voor 55% gewijzigd door Gehakt op 07-01-2012 01:06 ]


Acties:
  • 0 Henk 'm!

  • Soultaker
  • Registratie: September 2000
  • Laatst online: 18:14
Volgens mij zit het probleem niet in je "daemon" maar in het feit dat er nooit een PID-file niet aangemaakt wordt. Vervolgens kan het rc-script je daemon logischerwijs ook niet signalen. Aangezien je applicatie zelf geen PID-file schrijft, kun je die door start-stop-daemon laten genereren door de --make-pidfile optie (of kortweg -m) mee te geven bij het starten van de daemon. Grote kans dat het dan gewoon werkt.

Acties:
  • 0 Henk 'm!

  • Gehakt
  • Registratie: Juli 2002
  • Laatst online: 19-09 15:50
Soultaker schreef op zaterdag 07 januari 2012 @ 06:14:
Volgens mij zit het probleem niet in je "daemon" maar in het feit dat er nooit een PID-file niet aangemaakt wordt. Vervolgens kan het rc-script je daemon logischerwijs ook niet signalen. Aangezien je applicatie zelf geen PID-file schrijft, kun je die door start-stop-daemon laten genereren door de --make-pidfile optie (of kortweg -m) mee te geven bij het starten van de daemon. Grote kans dat het dan gewoon werkt.
Dit is inderdaad de oplossing voor het niet stoppen van de "daemon"! _/-\o_ Op het cluster werkt het nu ook gewoon correct!

Dank aan allen die meegedacht hebben! Ik kan weer verder bouwen aan het geheel 8)

[ Voor 13% gewijzigd door Gehakt op 07-01-2012 10:56 ]

Pagina: 1