With the code:
frase <- data.frame(id = c(1,2),
texto = c("palavra1 palavra2 palavra3 palavra4 palavra5",
"palavra6 palavra7 palavra8 palavra9 palavra10 palavra11 "),
stringsAsFactors = FALSE)
It is generated:
id texto
1 1 palavra1 palavra2 palavra3 palavra4 palavra5
2 2 palavra6 palavra7 palavra8 palavra9 palavra10 palavra11
I would like to create a set of lines with 3 words each. The desired result is this:
id texto
1 1 "palavra01 palavra02 palavra03"
2 1 "palavra02 palavra03 palavra04"
3 1 "palavra03 palavra04 palavra05"
4 2 "palavra06 palavra07 palavra08"
5 2 "palavra07 palavra08 palavra09"
6 2 "palavra08 palavra09 palavra10"
7 2 "palavra09 palavra10 palavra11"
Realize that:
para um conjunto de 5 palavras existem 3 linhas (5-2).
para um conjunto de 6 palavras existem 4 linhas (6-2).
Does anyone suggest an efficient code to perform this operation?