Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

R: histogram dilemma

Pagina: 1
Acties:

  • Kenpachi
  • Registratie: April 2013
  • Laatst online: 08-10 21:40
Beste tweakers,

Ik denk dat m'n vraag het best hier bijkan, dus bij deze.

Ik heb een(nep) database met 500 patiëntgegevens. Deze patiënten worden behandeld voor hun ziekte. Er zijn twee behandelmethodes. Het is de bedoeling dat ik uit de vele gegevens moet kunnen afleiden welke behandeling het best is (minst overledenen). Ik moet werken met het programma 'R'.

Ik kan nu een histogram (Edit: Barplot) maken waarbij de twee behandelmethoden kan splitsen. Van ieder methode kan ik bijvoorbeeld kijken hoeveel procent van de mensen diabetes wel en niet hebben. Ik krijg dus dit:

https://www.dropbox.com/s...abetus%20met%20stents.png [/img]

Wat ik eigenlijk wil,maar wat me niet lukt is dat ik ook nog een derde conditie wil hebben. Ik heb er namelijk niet veel aan hoeveel mensen diabetes hebben bij behandeltype A. Ik wil ook weten hoeveel mensen daarvan het eind wel/niet gehaald hebben. Dus eigenlijk wil ik mijn huidige histogram twee keer hebben waarbij je bij de ene gegevens hebt van dode mensen en de andere overlevende mensen.

Ik heb het wel in een tabel vorm kunnen krijgen, maar niet in een histogram:
https://www.dropbox.com/s...tents%20en%20endpoint.png

Ik weet dus niet hoe ik m'n code tot nu toe verder kan aanpassen om aan m'n eisen te voldoen.
Dit is mijn code tot nu toe:


library(foreign, pos=4)
Dataset <-
read.spss("D:/Google drive/TU ....../Coronary_disease_set_9.sav",
use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
colnames(Dataset) <- tolower(colnames(Dataset))
mydata<-xtabs(~dm+rando, data=Dataset)
library(abind, pos=4)
mytable<-colPercents(mydata)
mygraph<-barplot(mytable[-3:-4,-6:-8], beside=TRUE, col=c("blue", "red"), legend=TRUE, ylab="Percentages", main="Diabetus Mellitus", ylim=c(0,100))
text(mygraph, 0, round(mytable[-3:-4,-6:-8], 1.0), cex=1, pos=3, col=c("white"))


Heeft iemand een tip hoe ik dit kan aanpakken/aanpassen?

Mvg

[ Voor 7% gewijzigd door Kenpachi op 13-03-2014 19:24 ]


  • El_kingo
  • Registratie: Mei 2002
  • Laatst online: 17-03 11:17
Een tip die ik je sowieso kan geven: koop (of leen) een goed boek over epidemiologie!
Dit is bijna een standaard voorbeeld in nagenoeg alle epidemiologie boeken...

Om op je probleem terug te komen:
Hoewel ik het niet helemaal uit je post kan halen denk ik dat de term survival analysis (en Kaplan-Meier) hier wel eens van pas zou kunnen komen. Je figuren worden (bij mij in ieder geval) niet getoond. Dus ik kan niet zien wat je precies bedoelt...

Aangezien ik het idee heb dat je iets van een stage of onderzoeksproject aan het doen bent denk ik dat je daarmee eerst zelf wel verder dingen kunt uitzoeken / lezen voordat er kant en klare oplossingen gegeven gaan worden. (Ik kan het mis hebben, maar dan nog leer je er meer van door het zelf verder uit te zoeken)

  • Kenpachi
  • Registratie: April 2013
  • Laatst online: 08-10 21:40
Ja Kaplan-meier ken ik en ik probeer er ook mee te werken.
Ik vraag niet om een kant en klare antwoord, maar meer tips die me de goede richting kunnen helpen. Ik denk dat dit meer een programmeer probleempje is.
Het enige dat ik beschikbaar is een module over statistiek, maar dat kan me niet helpen met m'n programma.
In ieder geval bedankt voor je antwoord.

Tips zijn welkom.

[ Voor 6% gewijzigd door Kenpachi op 13-03-2014 14:02 ]


  • El_kingo
  • Registratie: Mei 2002
  • Laatst online: 17-03 11:17
Maar dan splits je je dataset toch gewoon in wel en niet overlevenden (zal vast en zeker een veld zijn in je dataset) en maak je van de individuele datasets histogrammen?

functie subset() in R is hier handig voor!

  • Kenpachi
  • Registratie: April 2013
  • Laatst online: 08-10 21:40
Je voorstel lijkt me heel handig! Dat zou een hoop preblemen oplossen. Echter lukt het me niet om ze te scheiden. Ook heb ik bij subset gekeken. Daar kan ik alleen variabelen selecteren. Verder is er een subset expression vak waar <all cases> staat. Ik zou dan denken dat ik de conditie daar moet plaatsen. Dus ik typte daar dood=no, maar dat werkt niet.
Zoals je onderhand wel hebt gemerkt ben ik nieuw met R.

  • El_kingo
  • Registratie: Mei 2002
  • Laatst online: 17-03 11:17
Right, ik mag hieruit concluderen dat je een of andere frontend (of GUI) voor R gebruikt?
Iets als RStudio, Tinn-R o.i.d.?

Hoe is gecodeerd of iemand dood is of niet?
Als je dat weet kun je daar ook op selecteren.

Als dat niet expliciet gecodeerd is zul je dat zelf moeten doen (bijvoorbeeld als er een datum van overlijden is gegeven, zullen logischerwijs alleen die mensen die overleden zijn een datum hebben staan in die kolom).

Maar dit begint verdacht veel op een basis cursus R te lijken. Dit zijn zaken die je zelf ook kunt uitzoeken...

  • Kenpachi
  • Registratie: April 2013
  • Laatst online: 08-10 21:40
Ik ben inderdaad iets cruciaals vergeten te vermelden. Ik gebruik Rcommander als GUI. Het is niet de opdracht om allerlei codes te leren gebruiken. Vandaar Rcmdr. Nu ben ik dus tegen de limiet gelopen van Rcmdr en moet ik zelf in de code duiken. Daar gaat het echter niet goed. Het is gelukt om grouped barplot (neem me niet kwalijk, was dus geen histogram) te maken met twee variabelen. Nu is het dus de kunst om de code zodanig aan te passen zodat er sprake is van 3 variabelen.
Ik doe m'n best om alles zelf uit te zoeken. Zo te zien heb je redelijk kennis van R. Bedankt voor je input tot nu toe.
Als je vindt dat dit de 'basis' is dus een onnodige topic hoef je van me niet te reageren :)
Aan voorgekauwde oplossingen heb ik niks aan en daarom vraag ik sinds mijn eerste post aan tips die me verder kunnen helpen.

Edit

Of iemand is overleden is een yes/no variabele.

Edit 2

Ik heb de afbeeldingen nu op dropbox gezet. Hopelijk zijn ze nu wel te openen.

[ Voor 7% gewijzigd door Kenpachi op 13-03-2014 19:23 ]

Pagina: 1