[WCG] Status WU's steeds aborted by project

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Modbreak:Dit topic is afgesplitst van [Stampede] Hitparade van 2 april


Ik loop tegen het volgende probleem aan, ik heb sinds 3 dagen 10 systemen draaien maar continue zie ik bij status 'aborted by project' en staat deze vervolgens niets te doen. Doe ik dan 'update project' begint ie weer maar stop vervolgens een ander weer met dezelfde melding.

[ Voor 18% gewijzigd door iisschots op 03-04-2009 18:39 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • SandStar
  • Registratie: Oktober 2002
  • Laatst online: 21:29

SandStar

DPC-Crew

Zandster

DukeBox schreef op vrijdag 03 april 2009 @ 16:43:
Ik loop tegen het volgende probleem aan, ik heb sinds 3 dagen 10 systemen draaien maar continue zie ik bij status 'aborted by project' en staat deze vervolgens niets te doen. Doe ik dan 'update project' begint ie weer maar stop vervolgens een ander weer met dezelfde melding.
heb je dat bij alle sub-projecten van WCG of alleen bij een bepaalde?

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Geen idee.. ik heb 10 clones gemaakt en maar 1 wil er draaien.. heb niets aangegeven welke projecten ik wil doen volgens mij.
Afbeeldingslocatie: http://imageserver.qik.nl/dukebox/wgcaborted.PNG

Ik zie ook deze meldingen continue in de logfile:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result X0000058390911200509270934_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result X0000058390936200509270933_1
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result X0000058390955200509270934_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result HFCC_t1_00170109_TrkB_0002_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi501_00008_2
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi501_00043_12
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi502_00008_9
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi502_00024_17
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi502_00032_1
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01910400_xmdEq_Model6Xapo_03_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01911843_xmdEq_Model6Xapo_02_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01750078_xmdEq_Model6Xapo_02_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01800477_xmdEq_Model6Xapo_03_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01807635_xmdEq_Model6Xapo_04_0

[ Voor 101% gewijzigd door DukeBox op 03-04-2009 17:39 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

DukeBox schreef op vrijdag 03 april 2009 @ 16:59:
Geen idee.. ik heb 10 clones gemaakt en maar 1 wil er draaien.. heb niets aangegeven welke projecten ik wil doen volgens mij.
[afbeelding]

Ik zie ook deze meldingen continue in de logfile:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result X0000058390911200509270934_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result X0000058390936200509270933_1
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result X0000058390955200509270934_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result HFCC_t1_00170109_TrkB_0002_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi501_00008_2
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi501_00043_12
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi502_00008_9
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi502_00024_17
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result mi502_00032_1
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01910400_xmdEq_Model6Xapo_03_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01911843_xmdEq_Model6Xapo_02_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01750078_xmdEq_Model6Xapo_02_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01800477_xmdEq_Model6Xapo_03_0
03/04/2009 17:39:18|World Community Grid|Message from server: Resent lost result faah6039_ZINC01807635_xmdEq_Model6Xapo_04_0
Als je gecloned hebt na het client attachen, dan heb je een probleem. De image dient voor allereerste WCG attach gemaakt te worden. Er was er een van XS die wekenlang al z'n werk maar bleef verliezen, lange discussies, tot die vertelde wat ie deed. De clients kijken in een bestandje naar het ID dat toegewezen was, dus al zn clients werd verteld dat ze werk hadden wat al elders toegewezen was en dumpten het weer en de volgende vertelde dan weer dat het weg was en probeerde te recoveren, enzovoorts.

[ Voor 5% gewijzigd door Anoniem: 167389 op 03-04-2009 18:44 ]


Acties:
  • 0 Henk 'm!

  • iisschots
  • Registratie: November 2002
  • Laatst online: 31-05 15:04
Ik heb het afgesplitst van de hitparade. Dit kan ook prima in een apart topic :)

Hackerspace in Friesland | www.frack.nl | Bezig met opzetten, help mee!


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op vrijdag 03 april 2009 @ 17:45:
[...]

Als je gecloned hebt na het client attachen, dan heb je een probleem. De image dient voor allereerste WCG attach gemaakt te worden. Er was er een van XS die wekenlang al z'n werk maar bleef verliezen, lange discussies, tot die vertelde wat ie deed. De clients kijken in een bestandje naar het ID dat toegewezen was, dus al zn clients werd verteld dat ze werk hadden wat al elders toegewezen was en dumpten het weer en de volgende vertelde dan weer dat het weg was en probeerde te recoveren, enzovoorts.
Dat lijkt idd bij mij ook te gebeuren.. al het werk dat ik thuis had is onderhand ook verdwenen.
Waar kan ik die ID aanpassen ?

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

1. In message log kijken wat het exact data directory path is.
2. Detach client van WCG (project tab als je de gui BM gebruikt)
3. Client stoppen, ook daemon /service
4. Er staan een paar bestandjes in de data_dir (zie 1) met de worldcommunitygrid.org in de file naam. Die deleten + Alle client_state.xxxx.xmls bestanden deleten.
5. Klant herstarten en opnieuw een attach to project doen.
6. Verifieren of het log een andere ID laat zien. is 6 cijferig.

Als dit werkt, herhalen op alle andere koetjes tot je er flauw van bent.

Ergens staat een mass-roll out document, maar denk dat het voor het aantal een beetje overkill is.

hoor het wel of de instructies complete zijn.

[ Voor 2% gewijzigd door Anoniem: 167389 op 03-04-2009 20:45 . Reden: stappen correctie ]


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op vrijdag 03 april 2009 @ 19:15:
Als dit werkt, herhalen op alle andere koetjes tot je er flauw van bent.
Hmm, dat is wel ngoal wat werk.. punt is dat ik alles via PXE doe en dus niet echt wat kan scripten o.i.d.
Ergens staat een mass-roll out document, maar denk dat het voor het aantal een beetje overkill is.
Toevallig een linkje ?

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
03/04/2009 19:39:18|World Community Grid|Message from server: (reached daily quota of 268 results)
wtf ?

[ Voor 13% gewijzigd door DukeBox op 04-04-2009 02:34 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

Jammer, een friese stamboek probeert het na 02:00:01 CET weer want dan krijg je weer een kans om te testen of WCG je client niet meer als clone ziet. Stel je voor, 10 bij de bank die de zelfde bank account zouden gebruiken en de een klagen dat de ander altijd het geld op maakt.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op vrijdag 03 april 2009 @ 19:54:
Jammer, een friese stamboek probeert het na 02:00:01 CET weer want dan krijg je weer een kans om te testen of WCG je client niet meer als clone ziet. Stel je voor, 10 bij de bank die de zelfde bank account zouden gebruiken en de een klagen dat de ander altijd het geld op maakt.
Het gaat niet om 10 clients.. het gaat om 10 clusters. Totaal 160 clients.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

Ik zal eens spitten of een splinternieuwe cliënt geattached kan worden, off-line, maar zonder dat een ID vastgezet is, zodat als de client upgestart wordt deze automatisch nieuw ingericht wordt. Mogelijk een paar xml file edits.

[ Voor 63% gewijzigd door Anoniem: 167389 op 03-04-2009 20:36 ]


Acties:
  • 0 Henk 'm!

Anoniem: 167389

Snel antwoord en nog veel simpler dan gedacht. Maak nieuw image van de geinstallerde klant incl. attach met WCG, maar delete alleen de cient_statexxxx.xml files, inslusief the prev backups. De klant zal dan bij opstarten contact zoeken en een nieuw <hostid> toegewezen krijgen.

[ Voor 4% gewijzigd door Anoniem: 167389 op 04-04-2009 00:37 ]


Acties:
  • 0 Henk 'm!

  • Xaverius
  • Registratie: Juni 2001
  • Laatst online: 11-07 22:46

Xaverius

Ultraloper - korte dan... 😎

Het zou mooi zijn als je het gaat lukken DukeBox, ik ben erg nieuwsgierig welke output je bij WCG kan halen met je farm. }:O }:O }:O

https://smashrun.com/hans.vandermeer/invite
Stop de verwelking!
COVID19 resultaat: 30% meer hardgelopen dan ooit, langste afstand van 52 -> 69km gebracht


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op vrijdag 03 april 2009 @ 20:38:
Snel antwoord en nog veel simpler dan gedacht. Maak nieuw image van de geinstallerde klant incl. attach met WCG, maar delete alleen de cient_statexxxx.xml files, inslusief the prev backups.
Dat had ik dus gedaan, alleen attatched en verder geen client*.xml files..
Anoniem: 167389 schreef op vrijdag 03 april 2009 @ 20:38:
...De klant zal dan bij opstarten contact zoeken en een nieuw <hostid> toegewezen krijgen.
03/04/2009 21:40:56|World Community Grid|Generated new host CPID: c85ef1e4ce8359d676b90b05bd847060
Is dat dit ? Die zie ik namelijk regelmatig langskomen. Maar helaas, ook na het verwijderen van de client* en *worldcommunity* files blijft ie terug komen met aborted.
Zal morgen nog 1 poging wagen als ik weer wu's kan downloaden.. maar als het limiet maar 268 is, ga ik dat nooit redden. Ik wil alleen al meer threads draaien dan dat.

[ Voor 22% gewijzigd door DukeBox op 04-04-2009 01:52 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • SandStar
  • Registratie: Oktober 2002
  • Laatst online: 21:29

SandStar

DPC-Crew

Zandster

DukeBox schreef op zaterdag 04 april 2009 @ 01:43:
[...]

03/04/2009 21:40:56|World Community Grid|Generated new host CPID: c85ef1e4ce8359d676b90b05bd847060
Is dat dit ? Die zie ik namelijk regelmatig langskomen. Maar helaas, ook na het verwijderen van de client* en *worldcommunity* files blijft ie terug komen met aborted.
Zal morgen nog 1 poging wagen als ik weer wu's kan downloaden.. maar als het limiet maar 268 is, ga ik dat nooit redden. Ik wil alleen al meer threads draaien dan dat.
ik gok dat die 268 per hostid is en niet per user/ip

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Alle nieuwe hosts die ik uitrol krijgen meteen de melding "04/04/2009 01:46:12|World Community Grid|Message from server: (reached daily quota of 268 results)"
Dus denk het toch wel. Daarnaast draait alles onder dezelfde userid en ook ip.
Nou ja, ik begrijp nog 10 min. wachten, dan kan ik het weer proberen..

[ Voor 13% gewijzigd door DukeBox op 04-04-2009 01:50 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

CPID is een Cross Project ID wat heel wat anders is als host_id. CPID wordt door BOINCstats gebruikt om al je verschillende projecten, als je die hebt bijeen te garen bijv bij BOINC stats.

Er zijn quota's per WCG projects. Als je all projects profiel gebruikt dan telt het op. Quota's zijn ook niet voor alle projecten gelijk. In eerste instantie na het quota behalen van slechte resultaten, krijg je niet meteen de volle laag om middernacht. De kraan wordt langzaam weer open gezet. Goed resultaat terug sturen en er komt dacht ik 4 bij, slecht resultaat en er gaan er weer 2 af. Dat is progressief. Faal Quota's zijn per device maar ook algeheel want WCG wil natuurlijk niet dat iemand met een park door de hele voorraad vreet. Dan zouden alle reparatie klussen met verkorte deadline gaan circuleren en niet alle devices hebben een stability rating die dat op zouden kunnen nemen met als gevolg een zeer lange queue aan de server kant... dat wil de project manager natuurlijk vermijden. zo ongeveer.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Zat binnen 4 sec. weer aan het quota, had 250 cores draaien en opeens alles in 1 keer weer aborted.. wat een ongeloofelijke k*t client, heb precies gedaan wat jullie melden dus de client stop gezet, detach, files verwijderd en weer gestart. Weer attach gedaan en weer aborted. Komt nog eens bij dat ik 1 queue met ruim 100 gedane results had die nu ook allen weg zijn.

Kan het evt. ook komen omdat ze allen dezelfde hostname hebben ?

Overigens kan ik nu niets doen op de site (30 niet beschikbaar wegens update.. :?) want ik wilde het aantal dagen dat hij in voorraad moest houden op 0 zetten i.p.v. 0.4.

Hoe moet ik 320 cpu's van werk voorzien tegelijk als je er maar 250 kan downloaden ? Moet nu zeker weer 24 uur wachten ?
Het is mij echt allemaal veel te veel moeite, ik ken geen enkele andere client die zo lastig is met kopietjes e.d. jammer maar helaas.

[ Voor 49% gewijzigd door DukeBox op 04-04-2009 02:40 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • FreezeXJ
  • Registratie: Mei 2006
  • Laatst online: 04-07 21:15

FreezeXJ

DPC-Crew

Mooooh!

Kun je dan niet maar een heel klein stukje van je park @ WCG inzetten, en als dat eenmaal werkt de rest voorzichtig overhevelen? Dan pak je gewoon de kleinst mogelijke eenheid om mee te klooien, en staat de rest gewoon op SoB. In dat geval ram je ook niet tegen je quota-limieten aan, want met 4 uur/WU * 250 WUs kun je dus maximaal zo'n 40 CPUs bezighouden...

"It needs but one foe to breed a war, not two, master Warden. And those who have not swords can still die upon them" - Eowyn


Acties:
  • 0 Henk 'm!

  • DigiK-oz
  • Registratie: December 2001
  • Laatst online: 10-07 11:45
DukeBox schreef op zaterdag 04 april 2009 @ 02:27:

Kan het evt. ook komen omdat ze allen dezelfde hostname hebben ?
Ik kan me voorstellen dat dat het probleem is, ja. Als ze als 1 host gezien worden telt dat in ieder geval tot je 250 results. Maar ook die abort kan daar misschien aan liggen, zelfde hostname en andere specs, of ander cross-projectid voor de host. Op de WCG website, bij device manager, hoeveel hosts staan daar? En kan je een test doen met een paar verschillende hostnames, of hebben die dingen echt allemaal dezelfde naam?

Whatever


Acties:
  • 0 Henk 'm!

Anoniem: 167389

De servers kijken naar een 5-6 tal machine info punten ter onderscheiding, inclusief intern IP adress. Zelfde hostnamen is geen enkel punt, maar het wordt wel moeilijk op de Result Status page om te onderscheiden wie wat doet.

Ik neem aan dat je nieuwe image was gemaakt zonder de client_state.xmls en client_state_prev.xml en de oude van de hosts gewist werden tijdens installatiej. Zonder verwijdering van de client_state.xmls zal het probleem persisteren (sorry als ik een open deur intrap).

Goed draaiende klanten hebben een daily limit - per client en wegens de enorme power van 8-16-32 cores, is dat behoorlijk hoog gezet. Er zijn genoeg cluster klanten bij WCG, maar de essentie blijft dat ze als uniek gezien moeten kunnen worden ander weet de server niet wie het is, vandaar de <host_id> in het client_state.xml file.

Als je het niet kunt oplossen, kan je knreed@us.ibm.com direct mailen. Hij is de "mass" man bij WCG. Klanten met duizende devices zijn er dus dit moet ook kunnen werken.

thanks for keeping trying.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op zaterdag 04 april 2009 @ 10:48:
Ik neem aan dat je nieuwe image was gemaakt zonder de client_state.xmls en client_state_prev.xml en de oude van de hosts gewist werden tijdens installatiej. Zonder verwijdering van de client_state.xmls zal het probleem persisteren (sorry als ik een open deur intrap).
Het deploy systeem is niet ingericht om maar snel een paar clients te draaien, er wordt gekeken naar vrije resources en hier worden meteen instances aan gekoppeld. Misschen kijk ik er mogen nog een laatste keer na als ik weer wu's kan downloaden.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • Suicyder
  • Registratie: Mei 2002
  • Laatst online: 22:20
Ik heb indertijd ook al eens gezeur gehad met hostnames. In mijn geval had ik een 3tal clients draaien onder 1 hostname en zag maar van 1 resultaat. Alle 3 een andere hostname geven en WCG een reinstall geven loste het op.

Weet alleen niet of dit voor jou een optie is.

Acties:
  • 0 Henk 'm!

  • Evo155
  • Registratie: Oktober 2004
  • Laatst online: 04-03-2023
offtopic:
Jammer dat het zo lastig is om grote parken te wisselen van project. (Dwz van distributed naar Boinc naar Sob bijv.) Als we de power van X-ray die nu op OGR staat en de power van NoizyCows die op RC5 staat op WCG zouden kunnen zetten(gesteld dat zij dat willen), zouden we nog hele andere output zien dan de mooie output die we nu al hebben.

Evo155 AKA Uplinksweetlake


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Ik zal kijken of ik de hostname op basis van rdns kan creeren, misschien helpt dat.

update: Krijg nu wel meerdere device profiles, maar allen dezelfde naam.. dat is wel vreemd.
Heb er nu 6 draaien, kijken of die goed gaat.. moet nu wel alles met het handje doen dus het zullen er niet zoveel worden.

[ Voor 61% gewijzigd door DukeBox op 04-04-2009 15:33 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • Suicyder
  • Registratie: Mei 2002
  • Laatst online: 22:20
Alle hulp binnen TACR is welkom, hopelijk kunnen we plek 1 nog halen met jou hulp :9

Acties:
  • 0 Henk 'm!

Anoniem: 167389

DukeBox schreef op zaterdag 04 april 2009 @ 13:44:
Ik zal kijken of ik de hostname op basis van rdns kan creeren, misschien helpt dat.

update: Krijg nu wel meerdere device profiles, maar allen dezelfde naam.. dat is wel vreemd.
Heb er nu 6 draaien, kijken of die goed gaat.. moet nu wel alles met het handje doen dus het zullen er niet zoveel worden.
Met BOINC Account Manager en BOINCview(voor Windows), kan je de hele ratjetoe vanaf 1 beeldscherm en computer laten uitrollen. Dan moet je deploy image wel een client hebben die aan een BAM account gekoppeld is. Die forceert dan weer de attach. Ja, met BOINC vele mogelijkheden, maar blij dat je er toch een paar werkende hebt kunnen krijgen, met werk.

Niet zeker wat je met profielen bedoeld, maar BOINC heeft er 4 waarvan default by default al gecreeerd is. Dan heeft WCG ook nog profile presets. Daar op My Grid > Device Manager > Default > naar maximum output switchen anders loopt ie maar op 60% per core.

[ Voor 14% gewijzigd door Anoniem: 167389 op 04-04-2009 17:03 ]


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op zaterdag 04 april 2009 @ 17:01:
Niet zeker wat je met profielen bedoeld,
Ik bedoelde device names, onder device manager.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

Js dat is geen ramp... zie mijn eerdere noot, dat het dan moeilijk wordt om te ontdekken welke client slechte resultaten aflevert. Ikzelf gebruik device name info suppress <suppress_net_info>1</suppress_net_info> in de cc_config.xml. Dan wordt het <host_id> ook als device naam gebruikt, losgekoppeld van hoe het netwerk je device kent. Nooit verwarring wie het dan is en verdere anonimisering tussen intern netwerk en het internet.

[ Voor 22% gewijzigd door Anoniem: 167389 op 04-04-2009 18:15 ]


Acties:
  • 0 Henk 'm!

Anoniem: 222991

In het begin heb ik ook settings gecopieerd, maar nooit zo'n problemen gehad. Die PXE machines hebben die een eigen disk of bewaren die alles in RAM? Anders krijg je problemen op het moment dat ze in dezelfde directory zitten te krassen.

Vond de output van DukeBox al zo laag, in het verleden heb je volgens mij toch ook een keer mee gedraaid op WCG?

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 222991 schreef op zaterdag 04 april 2009 @ 19:32:
In het begin heb ik ook settings gecopieerd, maar nooit zo'n problemen gehad. Die PXE machines hebben die een eigen disk of bewaren die alles in RAM? Anders krijg je problemen op het moment dat ze in dezelfde directory zitten te krassen.
De PXE clients hebben alleen een ramdrive. Drive wordt wel opgeslagen bij het (netjes) afsluiten van het systeem.
Vond de output van DukeBox al zo laag, in het verleden heb je volgens mij toch ook een keer mee gedraaid op WCG?
Ja, maar dat was een hele andere client.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

UD Agent... jammer dat de ontwikkelaars besloten die te dumpen, en het dus voor WCG onhoudbaar werd om die nog langer te gebruiken.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 167389 schreef op zaterdag 04 april 2009 @ 19:52:
UD Agent... jammer dat de ontwikkelaars besloten die te dumpen, en het dus voor WCG onhoudbaar werd om die nog langer te gebruiken.
Klopt.. kan me wel herinneren dat ik daar ook wel ff mee bezig was.
Tot nu toe vond ik de fad, sob en eccp client het makkelijkst (onder linux), installeren, clonen, starten en klaar. Enige dat ik weer erg handig vind aan de BOINC client is dat ie meteen al als deamon draait.

Uiteindelijk nog het aantal verdubbelt, heb nu 12 clients draaiend gekregen, misschien morgen nog een paar als ik weer werk kan downloaden.

[ Voor 21% gewijzigd door DukeBox op 04-04-2009 23:59 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 222991

Kun je alle client met bijvoorbeeld boicview benaderen, die heb ik op een windows bak staan om alle client in 1 overzicht te hebben. Als dat kan kun je overwegen de clients te starten met alleen boinc maar zonder projects en als alles up and running is met boincview op alle clients tegelijke een project attachen. Dan krijgen ze allemaal neem ik aan hun eigen id. is maar een gedacht spinsel maar zou je kunnen helpen.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Ik draai geen GUI dus dat is niet mogelijk.

[ Voor 128% gewijzigd door DukeBox op 05-04-2009 13:22 ]

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

Je hebt maar 1 Windows machine nodig om je complete overzicht te krijgen met BOINCview voor al je klantjes op je netwerk. 1.5.8beta (en hoger zal het nooit meer gaan), kan ze zelfs in een IP range zoeken.

Nog iets daaromtrent: Het behoeft de toevoeging van een remote_hosts.cfg filetje aan je image met alle mogelijke IP's gelijst. Beste is om in gui_rpc_auth.cfg ook een simpel paswoord te zetten en dat op alle machines te plaatsen (die daarna herstart dienen te worden om het 't nieuw paswoord te laten pakken). Kan ook in je deploy image natuurlijk.

[ Voor 47% gewijzigd door Anoniem: 167389 op 05-04-2009 13:29 ]


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Draai ook geen windows.. is hoe dan ook streng verboden om een windows bak in dat netwerk te hangen.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 167389

Wow, dat is zeer serieus.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Meer voorzorgs maatregel aangezien de render engines vaak met verouderde kernels e.d. werken met bekende security issues en er intern in het cluster vlan geen antivirus en firewall e.d. draait (i.v.m. performance). Kan er alleen via een kvm of reverse proxy bij op dit moment en alleen de boincmgr werkt met proxy's.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 222991

sta jij als DukeBox of [DPC] DukeBox in de stats van Elteor?
Dat tweede account heeft wel punten maar geen team???

[ Voor 31% gewijzigd door Anoniem: 222991 op 05-04-2009 14:12 ]


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Geen idee, maar mijn account is [DPC] DukeBox (sinds 2007), die andere ken ik niet.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

Anoniem: 222991

[DPC] Dukebox heeft pas 2 dagen werk ingeleverd volgens BOINCstats !
En voeg effe DPC als team toe. ;)

Snap niet waarom BOINCstats zegt dat je geen team hebt terwijl Jis stats je er wel bij ons bijzet.

[ Voor 32% gewijzigd door Anoniem: 222991 op 05-04-2009 14:20 ]


Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Anoniem: 222991 schreef op zondag 05 april 2009 @ 14:14:
[DPC] Dukebox heeft pas 2 dagen werk ingeleverd volgens BOINCstats !
En voeg effe DPC als team toe. ;)
Snap niet precies wat je daar mee bedoeld, ben als sinds 2007 lid van DPC.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • Suicyder
  • Registratie: Mei 2002
  • Laatst online: 22:20
DukeBox schreef op zondag 05 april 2009 @ 14:25:
[...]

Snap niet precies wat je daar mee bedoeld, ben als sinds 2007 lid van DPC.
Er staat in DPC 2 accounts met de naam DukeBox. 1x gewoon DukeBox en 1x [DPC] DukeBox

Ik denk dat, dat wat verwarring oplevert

Acties:
  • 0 Henk 'm!

  • Escrimador
  • Registratie: September 2002
  • Laatst online: 03-07 17:32
DukeBox schreef op zondag 05 april 2009 @ 13:28:
Draai ook geen windows.. is hoe dan ook streng verboden om een windows bak in dat netwerk te hangen.
ook niet via virtualbox o.i.d. ?

Only dead fish go with the flow


Acties:
  • 0 Henk 'm!

Anoniem: 167389

plz zie andere Dukebox draad want de member naam is nu op 2 plaatsen in behandeling.

Acties:
  • 0 Henk 'm!

  • DukeBox
  • Registratie: April 2000
  • Laatst online: 22:13

DukeBox

Voor je 't weet wist je 't nie

Topicstarter
Zal wel ff slotje aanvragen aangezien dit is opgelost.

Duct tape can't fix stupid, but it can muffle the sound.


Acties:
  • 0 Henk 'm!

  • iisschots
  • Registratie: November 2002
  • Laatst online: 31-05 15:04
DukeBox schreef op zondag 05 april 2009 @ 15:47:
Zal wel ff slotje aanvragen aangezien dit is opgelost.
Wanneer iets is opgelost zetten we een topic niet op slot, hij verdwijnt vanzelf wel uit de topic list.

Hackerspace in Friesland | www.frack.nl | Bezig met opzetten, help mee!


Acties:
  • 0 Henk 'm!

  • Arjan Scholl
  • Registratie: Maart 2001
  • Laatst online: 09-07 12:53
Ik krijg het hier ook niet helemaal voor elkaar.
Ik heb 2 Windows SBS2003 servers lopen op 2 locaties die ik met WCG mee wil laten doen.
Maar bij het attachen van het project krijgen ze allebei dezelfde host_id toegewezen.
Ze hebben allebei hetzelfde (interne) IP en dezelfde hostnaam.
Resultaat: Alle WU's aborted by project.

Ik heb geen zin om deze dingen te veranderen is er toch een mogelijkheid de client te draaien?

Acties:
  • 0 Henk 'm!

Anoniem: 167389

Zelfde IP address op interne netwerk en zelfde hostnaam zal nagenoeg zeker niet werken. Zou echt niet weten wat de workaround is... aan 2 verschillende accounts koppelen.

Acties:
  • 0 Henk 'm!

  • Arjan Scholl
  • Registratie: Maart 2001
  • Laatst online: 09-07 12:53
Dat is jammer, dan maar 1 quadcore minder.

Acties:
  • 0 Henk 'm!

  • MeneerKrab
  • Registratie: Augustus 2000
  • Laatst online: 10-07 11:17
Anoniem: 167389 schreef op maandag 06 april 2009 @ 18:58:
Zelfde IP address op interne netwerk en zelfde hostnaam zal nagenoeg zeker niet werken. Zou echt niet weten wat de workaround is... aan 2 verschillende accounts koppelen.
hij zegt ook niet dat hij 2 servers met zelfde hostnaam en zelfde ip op 1 netwerk heeft hangen. Het gaat hier om 2 locaties.

Acties:
  • 0 Henk 'm!

Anoniem: 167389

Hier een interne Notitie van WCG tech iz mass roll out naar clusters die bijv. zelfde IP/Hostnaam delen. Werk aan de winkel en waarschijnlijk wat berichten richting Berkeley. Zag dat WCG all speciale Mass Roll-Out compiles had van de BOINC klant die te downloaden zijn. Had ergens hier al 1 linkje geplaatst:
We need to re-write the 'mass install' document to update it with new information as well as additional details for submitting the agent as backfill on a grid. We are seeing some interest from folks who have traditional grids submitting the client. That shares some of the same characteristics as the problem you are describing. Specifically from our conversations we need to be able to do the following:

Set the client to process exactly one workunit and then exit
Set the client so that it doesn't have issues with the host id
Set the client so that multiple instances can run on one machine
Set the client so that there are no issues if it is moved between different computers (as long as they are consistent types)

I have some emails I need to do to send to connect with some of the other BOINC projects that are running most of their time on grids.
BOINC heeft trouwens al een soort van Exit upon task finished optie. Me er nooit in verdiept.

Acties:
  • 0 Henk 'm!

Anoniem: 167389

MeneerKrab schreef op maandag 06 april 2009 @ 19:47:
[...]

hij zegt ook niet dat hij 2 servers met zelfde hostnaam en zelfde ip op 1 netwerk heeft hangen. Het gaat hier om 2 locaties.
Tja, dat gaat weer terug naar het maken van een image waar de client_state....xml's nog in zitten. Maar als dat van twee aparte externe IP's komt is dat moeilijk te begrijpen. Dan moet WCG het al als 2 aparte machines zien, ongeacht of het een kopie is.
Pagina: 1