Distributed Folding doet mee aan CASP6 voorspellingswedstrijd |
![]() |
Welkom ! |
Schrik niet van de topictitel. Middels dit topic wil ik graag de aandacht voor een tijdelijke wijziging bij het DC project Distributed Folding. Gelieve het hele topic door te lezen als je meedoet aan het Distributed Folding project. Nieuwe informatie zal, buiten de Distributed Folding website en het bijbehorende forum ook zo snel mogelijk gepost worden in de Dagelijkse DF hitparades op GoT. Daarnaast zal mijn mijn .plan op WDO de belangrijkste informatie/wijzigingen bevatten. Als je niet weet waar dit over gaat dan heeft dit topic waarschijnlijk geen functie voor jou. Toch nieuwsgierig? Lees dan eens de Distributed Folding faq. |
Waar gaat het over? |
Distributed Folding heeft aangegeven mee te gaan doen aan de CASP6 voorspellings wedstrijd. Deze participatie heeft enkele consequenties voor alle deelnemers. CASP staat voor "Critical Assessment of techniques for protein Structure Prediction" Het project zal, naar verwachting, in de week van 5 juli overswitchen op de CASP6 targets (zoals 2 jaar geleden ook aan CASP5 is meegedaan). Dit houdt in dat er iedere week een nieuw target wordt uitgegeven en je moet updaten. Degenen die dit niet kunnen bijhouden, tot begin september wordt er 1x per week een nieuw target uitgegeven, wordt voorgesteld/aangeraden tijdelijk een ander DC project te draaien om zo geen verloren CPU time te creëren. Uiteraard hoef je niet continu mee te doen met DF aan het CASP6 gebeuren. Af en toe de client aanzetten blijft gewoon mogelijk De grootte van de targets zal ongeveer tussen de 50 en 150 residuen liggen. Dit resulteert in de ene keer in een hele snelle en de andere keer in een wat langzamere. Daarnaast zal generation 0 worden vergroot tot 30.000 structures, dit resulteert in langer uitrekenen voor gen 0. DF tracht hiermee betere resultaten te kunnen bereiken. Tijdens de CASP6 wedstrijd wordt er niet gesproken over 'proteins' maar over 'targets'. De gehanteerde strategie van Distributed Folding om aan deze voorspellingswedstrijd mee te doen valt hier in het engels te lezen. Onderstaande gegevens zijn bij elkaar geschraapt, dank voor het lenen van jullie intellectuele eigendom |
Het doel van CASP6 |
De CASP6 wedstrijd heeft als hoofddoel een uitgebreide en objectieve weergave te geven van de mogelijkheden en imperfecties van protein structure voorspellingen. Om dit te bewerkstelligen zullen de deelnemers zo veel mogelijk voorspellingen geven voor nog nader uit te geven structuren. Het zullen geheel nieuwe voorspellingen zijn en geen basering op reeds bekende structuren welke er enigzins op lijken. Al met al gaat het erom om middels de wedstrijd diverse methoden van protein structure voorspellingen (protein folding) naast elkaar te leggen en te kijken hoe de manier waarop hedendaags proteinfolding wordt benaderd verbeterd kan worden. De doelstellingen van de wedstrijd zijn te herleiden tot 7 vragen. Omdat vertaling naar het Nederlands mogelijk de essentie kan verliezen zijn deze in het Engels overgenomen. 1) Are the models produced similar to the corresponding experimental structure? 2) Is the mapping of the target sequence onto the proposed structure (i.e. the alignment) correct? 3) Have similar structures that a model can be based on been identified? 4) Are the details of the models correct? 5) Has there been progress from the earlier CASPs? 6) What methods are most effective? 7) Where can future effort be most productively focused? In de zomer van 2002 heeft Distributed Folding meegedaan aan de CASP5 wedstrijd. Resultaten zijn hier te bezichtigen. Aan de hand van de uitslag waarbij DF constant presteerde op alle targets is het nieuwe algoritme ontwikkeld welke in de huidige client is verweven. Hiermee is destijds ook Fase2 van Distributed Folding begonnen. |
Clientperikelen |
Client updaten Er zijn 3 manieren om de client te laten updaten.
Als je toch aan het sparen bent dan zal de client de melding dat er geupdate moet worden niet geven. Nogmaals er moet geupdate worden en wel binnen een bepaald tijdsbestek. Binnen 24 uur na de update uitgaven zal je voor oude gespaarde data nog 100% waardering krijgen. Na 24 en binnen 48 uur zal je nog maar 50% waardering krijgen voor oude punten. Na 48 uur zal er geen credit meer worden gegeven aan oude punten/data. Dus flush tijdig als je spaart en update de client om het nieuwe protein te krijgen. Nog beter: spaar zo min mogelijk tijdens de CASP6 wedstrijd daar er wekelijks een nieuwe target (update) wordt uitgegeven. Nog enkele tips Vergeet niet dat er snelheidsinstellingen zijn die voor aardig wat outputstijging zorgen. Dat zijn de opties 'Use Extra RAM' en 'Quiet Mode', uitleg van deze opties. Erg handig en overzichtelijk is de dfGUI waarin deze opties aan te vinken zijn. Om handmatig deze opties aan te zetten lees dit. Niet ongeduldig worden als jouw client nog niet geupdate is terwijl iemand anders al gepost heeft dat de zijne het wel is. Het komt wel, je hebt tenslotte 24 uur. Als je er niet zeker van bent of de client zichzelf update, of dat je sneller het nieuwe target wilt hebben kun je natuurlijk ook de client in z'n geheel downloaden. Om te controleren of je de juiste versie/ het nieuwe target hebt kun je naar de datum van het bestand protein.trj in de DF directory. |
Samenvatting |
Onderstaand in het kort waar het om draait:
|
De voortgang van het CASP6 project |
Dit onderdeel zal nog aangevuld worden na verstrekken van informatie. Voorlopig ga ik uit van 10 targets. Het actuele target zal middels de rode letters worden aangegeven. Iedere dinsdag zal rond 17:30 uur een nieuw target worden uitgeven, tenzij DF zelf anders aangeeft! 1e target Dit target heeft als naam SOR45 en bestaat uit 126 amino acids. Het target zal 'gevouwen' worden van dinsdag 6 juli vanaf 16:30 uur (+ kleine vertraging) t/m (geschat) dinsdag 13 juli 17:30 uur! 2e target Dit target heeft als naam 1167B en bestaat uit 94 amino acids. Het target zal 'gevouwen' worden van dinsdag 13 juli vanaf 17:30 t/m (geschat) dinsdag 20 juli 17:30 uur. 3e target Dit target heeft als naam TM0487 en bestaat uit 104 amino acids. Het target zal 'gevouwen' worden van dinsdag 20 juli vanaf 17:30 t/m (geschat) dinsdag 27 juli 17:30 uur. 4e target Dit target heeft als nummer T0213 en bestaat uit 103 amino acids. Het target zal 'gevouwen' worden van dinsdag 27 juli vanaf 17:30 (geschat) t/m woensdag 4 augustus 17:30 uur 5e target Dit target heeft als nummer T0214 en bestaat uit 110 amino acids. Het target zal 'gevouwen' worden van woensdag 4 augustus vanaf 17:30 (geschat) t/m dinsdag 10 augustus 17:30 uur 6e target Dit target heeft als naam PAE0736 en bestaat uit 98 amino acids. Het target zal 'gevouwen' worden van dinsdag 10 augustus vanaf 17:30 (geschat) t/m dinsdag 17 augustus 17:30 uur 7e target Dit target heeft als naam TTHB84 en bestaat uit 121 amino acids. Het target zal 'gevouwen' worden van dinsdag 17 augustus vanaf 17:30 uur (geschat) t/m dinsdag 24 augustus 17:30 uur * MarcyDarcy target * Dit target heeft als naam 1wj8 en bestaat uit 119 amino acids. Het target zal 'gevouwen' worden van dinsdag 24 augustus vanaf 17:30 uur (geschat) t/m dinsdag 31 augustus 17:30 uur. Dit 8e target is tevens de laatste in de CASP voorspellingswedstrijd, hierna zal het Distributed Folding project weer overstappen op de normale situatie waarbij proteins ongeveer 1x per maand worden uitgegeven. |
Tot slot |
Distributed Folding heeft aangegeven dat de huidige wijze van waardering zal worden gehandhaafd (alles telt gewoon mee). Tijdelijk zal er uitgegaan worden van resultaten op basis van "Fitness score" in plaats van de "RMSD" waarde. Dit kan voor de statsbouwers een mogelijke consequentie hebben? Het bestand native.val in de clientdirectory zal niet worden gebruikt door de DF client, daar er geen vergelijking te maken valt met hoe het resultaat eruit moet komen te zien. Het is mogelijk dat dit bestand daarom ook tijdelijk zal ontbreken in de nieuwe downloads vanaf de DF website. Controleer of je de laatste versie van DF hebt draaien. Resultaten van de CASP6 webstrijd verwacht ikzelf, bij ontbreken van tot nu toe nadere informatie, rond december/januari. Hierna zal ook een evaluatie plaatsvinden van de gekozen strategie, de resultaten en een vergelijking met de overige deelnemers aan de CASP6 wedstrijd. Het DC project Predictor@home zal eveneens aan de CASP6 wedstrijd meedoen. Zij maken gebruik van het BOINC platform. Afblijven verder hoor! Wij supporten DF Als je toch (al dan niet om het even te testen/naast elkaar te draaien) wilt proberen, kies dan wel voor het Dutch Power Cows team. Enjoy deze CASP6 voorspellingswedstrijd en vouwze! Vraag aan jullie: is er behoefte voor de mensen die hier lieven niet aan mee willen doen (i.v.m. het niet rustig een weekje weg kunnen gaan) aan een overzicht met alle projecten waaraan DPC meedoet met omschrijving en clientmogelijkheden? Aanvullingen en/of opmerkingen? Post ze hier in het topic of mailtje naar distributedfolding@dutchpowercows.org |
[ Voor 68% gewijzigd door MarcyDarcy op 25-08-2004 08:57 . Reden: Laatste CASP target ]