[RStudio] formule samenstelling

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Awoodentree
  • Registratie: Mei 2010
  • Niet online
Beste Tweakers,

Bij bijgevoegd .csv bestand wil ik in R Studio een lijst met de nchar functie creëren die het aantal elementen van de Tweets telt. Deze lijst wil ik dan als kolom toevoegen aan het data frame.

Ik ben nu aan het proberen met de sapply functie, maar heb geen idee het aantal characters uit de kolom 'text'. Dit moet vervolgens achter de dataframe worden geplakt.al characters uit de kolom 'text'. Dit moet vervolgens achter de dataframe worden geplakt.

WeTransfer link voor Excel bestand: https://we.tl/TrSSqsp7Sz

Groet,
Tim

Edit: .xls naar .csv veranderd

[ Voor 3% gewijzigd door Awoodentree op 17-02-2017 20:12 ]


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
Het is geen Excel bestand, het is een CSV.
Ik zou als ik jou was even de code plaatsen die je gebruikt. Zo reageert er bijna niemand.

[ Voor 53% gewijzigd door DJMaze op 17-02-2017 20:11 ]

Maak je niet druk, dat doet de compressor maar


Acties:
  • 0 Henk 'm!

  • Awoodentree
  • Registratie: Mei 2010
  • Niet online
code:
1
2
3
4
5
6
7
8
9
10
> my_columns2 <- subset(df, select=c("text"))
> my_columns[,1] <- gsub('"',"",my_columns[,1])
> x <- my_columns2 
> sapply(X = x,FUN=nchar)
#This creates a dataframe with only the counted characters per Tweet.#

y <- my_columns 
> mk <- within(y, {
 + nChar <- sapply(X = x,FUN=nchar) + }) 
> > head(mk)


Het is me op dit moment gelukt met bovenstaande code. Meer op goed geluk dan kunde. Iemand een idee hoe ik dit netter/beter kan doen?

Acties:
  • 0 Henk 'm!

  • RobLemmens
  • Registratie: Juni 2003
  • Laatst online: 07-10 16:57
# eerst de tabel inlezen
data <- read.csv("tweets.csv", sep = ";", quote = "\"", header = T, stringsAsFactors = F)

# dan de kolom toevoegen
data$charcount <- nchar(data$text)


de meeste basisfuncties werken direct op vectoren in R daar hoef je geen apply voor te gebruiken.

[ Voor 22% gewijzigd door RobLemmens op 18-02-2017 13:50 ]