Ik ben bezig met het bouwen van een red hat cluster op twee virtual machines.
Dit is gelukt en met apache als service zie ik netjes een fail over.
Nu is de volgende stap die ik wilde doen zelf een programma maken en deze als daemon starten en laten stoppen. De applicatie is zeer simpel. Het enige wat de applicatie moet doen is een zin met de hostname wegschrijven in een bestand.
Het resultaat wat ik wil bereiken is dat ik op een gedeelde opslag 1 logfile zie met iets van de volgende meldingen:
De applicatie (simpele main) die ik heb geschreven bevat in feite het volgende:
De linux cluster service maakt gebruik van een script in /etc/init.d voor het stopen/starten en de status van de daemon. Hiervoor heb ik een kopie gemaakt van /etc/init.d/skeleton
De enige aanpassingen die ik daarin heb gemaakt zijn het veranderen van de applicatie naam en de optie "--background" meegegeven voor het starten.
Het starten van de daemon in het cluster lijkt ook netjes te gaan. Het stoppen van de daemon duurt echter erg lang en mislukt vervolgens. Ik vermoed dus dat ik ergens een denkfout maak en dat het niet zo simpel is. Moet ik nog iets van signals in mijn applicatie implementeren?
Mijn init.d script is als volgt:
Zoals eerder vermeld: alleen de naam van de applicatie is ingevuld en bij het starten wordt de optie --background extra opgegeven.
Iemand ideeen waarom mijn daemon niet netjes zou willen stoppen? Het lijkt er na lange tijd (30+ s) op dat de service toch gestopt maar het werkt niet in combinatie met het cluster.
Dit is gelukt en met apache als service zie ik netjes een fail over.
Nu is de volgende stap die ik wilde doen zelf een programma maken en deze als daemon starten en laten stoppen. De applicatie is zeer simpel. Het enige wat de applicatie moet doen is een zin met de hostname wegschrijven in een bestand.
Het resultaat wat ik wil bereiken is dat ik op een gedeelde opslag 1 logfile zie met iets van de volgende meldingen:
code:
1
2
3
4
5
6
7
8
9
| Actief op node: 'node1' Actief op node: 'node1' Actief op node: 'node1' Actief op node: 'node2' Actief op node: 'node2' Actief op node: 'node2' Actief op node: 'node1' Actief op node: 'node1' Actief op node: 'node1' |
De applicatie (simpele main) die ik heb geschreven bevat in feite het volgende:
C++:
1
2
3
4
5
6
7
8
| // haal de hostname op while(1) { // open het logbestand // schrijf een regel inc hostname in het logbestand // sluit het logbestand // sleep 1 seconde } |
De linux cluster service maakt gebruik van een script in /etc/init.d voor het stopen/starten en de status van de daemon. Hiervoor heb ik een kopie gemaakt van /etc/init.d/skeleton
De enige aanpassingen die ik daarin heb gemaakt zijn het veranderen van de applicatie naam en de optie "--background" meegegeven voor het starten.
Het starten van de daemon in het cluster lijkt ook netjes te gaan. Het stoppen van de daemon duurt echter erg lang en mislukt vervolgens. Ik vermoed dus dat ik ergens een denkfout maak en dat het niet zo simpel is. Moet ik nog iets van signals in mijn applicatie implementeren?
Mijn init.d script is als volgt:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
| #! /bin/sh ### BEGIN INIT INFO # Provides: clustertest # Required-Start: $remote_fs $syslog # Required-Stop: $remote_fs $syslog # Default-Start: 2 3 4 5 # Default-Stop: 0 1 6 # Short-Description: Example initscript # Description: This file should be used to construct scripts to be # placed in /etc/init.d. ### END INIT INFO # Author: Foo Bar <foobar@baz.org> # # Please remove the "Author" lines above and replace them # with your own name if you copy and modify this script. # Do NOT "set -e" # PATH should only include /usr/* if it runs after the mountnfs.sh script PATH=/sbin:/usr/sbin:/bin:/usr/bin DESC="Description of the service" NAME=clustertest DAEMON=/usr/bin/$NAME DAEMON_ARGS="/home/joost/DaemonLogFile.txt" PIDFILE=/var/run/$NAME.pid SCRIPTNAME=/etc/init.d/$NAME # Exit if the package is not installed [ -x "$DAEMON" ] || exit 0 # Read configuration variable file if it is present [ -r /etc/default/$NAME ] && . /etc/default/$NAME # Load the VERBOSE setting and other rcS variables . /lib/init/vars.sh # Define LSB log_* functions. # Depend on lsb-base (>= 3.0-6) to ensure that this file is present. . /lib/lsb/init-functions # # Function that starts the daemon/service # do_start() { # Return # 0 if daemon has been started # 1 if daemon was already running # 2 if daemon could not be started start-stop-daemon --start --quiet --background --pidfile $PIDFILE --exec $DAEMON --test > /dev/null \ || return 1 start-stop-daemon --start --quiet --background --pidfile $PIDFILE --exec $DAEMON -- \ $DAEMON_ARGS \ || return 2 # Add code here, if necessary, that waits for the process to be ready # to handle requests from services started subsequently which depend # on this one. As a last resort, sleep for some time. } # # Function that stops the daemon/service # do_stop() { # Return # 0 if daemon has been stopped # 1 if daemon was already stopped # 2 if daemon could not be stopped # other if a failure occurred start-stop-daemon --stop --quiet --retry=TERM/30/KILL/5 --pidfile $PIDFILE --name $NAME RETVAL="$?" [ "$RETVAL" = 2 ] && return 2 # Wait for children to finish too if this is a daemon that forks # and if the daemon is only ever run from this initscript. # If the above conditions are not satisfied then add some other code # that waits for the process to drop all resources that could be # needed by services started subsequently. A last resort is to # sleep for some time. start-stop-daemon --stop --quiet --oknodo --retry=0/30/KILL/5 --exec $DAEMON [ "$?" = 2 ] && return 2 # Many daemons don't delete their pidfiles when they exit. rm -f $PIDFILE return "$RETVAL" } # # Function that sends a SIGHUP to the daemon/service # do_reload() { # # If the daemon can reload its configuration without # restarting (for example, when it is sent a SIGHUP), # then implement that here. # start-stop-daemon --stop --signal 1 --quiet --pidfile $PIDFILE --name $NAME return 0 } case "$1" in start) [ "$VERBOSE" != no ] && log_daemon_msg "Starting $DESC" "$NAME" do_start case "$?" in 0|1) [ "$VERBOSE" != no ] && log_end_msg 0 ;; 2) [ "$VERBOSE" != no ] && log_end_msg 1 ;; esac ;; stop) [ "$VERBOSE" != no ] && log_daemon_msg "Stopping $DESC" "$NAME" do_stop case "$?" in 0|1) [ "$VERBOSE" != no ] && log_end_msg 0 ;; 2) [ "$VERBOSE" != no ] && log_end_msg 1 ;; esac ;; status) status_of_proc "$DAEMON" "$NAME" && exit 0 || exit $? ;; #reload|force-reload) # # If do_reload() is not implemented then leave this commented out # and leave 'force-reload' as an alias for 'restart'. # #log_daemon_msg "Reloading $DESC" "$NAME" #do_reload #log_end_msg $? #;; restart|force-reload) # # If the "reload" option is implemented then remove the # 'force-reload' alias # log_daemon_msg "Restarting $DESC" "$NAME" do_stop case "$?" in 0|1) do_start case "$?" in 0) log_end_msg 0 ;; 1) log_end_msg 1 ;; # Old process is still running *) log_end_msg 1 ;; # Failed to start esac ;; *) # Failed to stop log_end_msg 1 ;; esac ;; *) #echo "Usage: $SCRIPTNAME {start|stop|restart|reload|force-reload}" >&2 echo "Usage: $SCRIPTNAME {start|stop|status|restart|force-reload}" >&2 exit 3 ;; esac : |
Zoals eerder vermeld: alleen de naam van de applicatie is ingevuld en bij het starten wordt de optie --background extra opgegeven.
Iemand ideeen waarom mijn daemon niet netjes zou willen stoppen? Het lijkt er na lange tijd (30+ s) op dat de service toch gestopt maar het werkt niet in combinatie met het cluster.