n <- c("alberto queiroz souza","bernardo josé silva","josé césar pereira","alberto, q-s.","alberto, queiroz souza","alberto, q. s.","alberto, q c", "bernardo, j. s.", "bernardo, j. silva", "josé, c. p.", "josé, c. pereira")
I have to find every element of vector n, in df:
df <- data.frame(Titulo.1 = c("ALBERTO QUEIROZ SOUZA (ALBERTO, Q-S.) - ATUA NA EMPRESA.","B. J SILVA (BERNARDO, J. SILVA)", "JOSÉ CÉSAR PEREIRA (JOSÉ, C. P.)", "LENILTON FRAGOSO (FRAGOZO, LENILTON)","ALKMIM, MARCIO"),
Titulo.2 = c("BERNARDO JOSÉ SILVA (BERNARDO, J. S.)","ALBERTO QUEIROZ SOUZA (ALBERTO, QUEIROZ SOUZA)","JOSÉ CÉSAR PEREIRA (JOSÉ, C. PEREIRA)","LENILTON FRAGOSO (FRAGOZO, LENILTON)","ALKMIM, MARCIO"),
Titulo.3 = c("LENILTON FRAGOSO (FRAGOZO, L)","BERNARDO JOSÉ SILVA (BERNARDO, J. S.) - ATUA NA EMPRESA","ALBERTO QUEIROZ SOUZA (ALBERTO, Q. S.)","JOSÉ CÉSAR PEREIRA (J. C. P.)","ALKMIM, MARCIO"),
Titulo.4 = c("JOSÉ CÉSAR PEREIRA (JOSÉ, CÉZAR PEREIRA)","LENILTON FRAGOSO (FRAGOZO, LENILTON) - ATUA NA FIOCRUZ","ALKMIM, MARCIO","ALBERTO (ALBERTO, Q C)","BERNARDO JOSÉ SILVA (B, J. S.)"),
Titulo.5 = c("BERNARDO JOSÉ SILVA (BERNARDO, JS)","JOSÉ CÉSAR PEREIRA (JOSÉ, C. PEREIRA) - ATUA NA FIOCRUZ","LENILTON FRAGOSO (FRAGOZO, L.)","ALKMIM, MARCIO","ALBERTO QUEIROZ SOUZA (ALBERTO, Q-S.)"),
stringsAsFactors = FALSE)
When I find it, I should add "- acts in the company", thus "josé, cp - acts in the company", for example.
But if the match in df already has the "- acts in the company", obviously does not need.
I'm trying the match first, with something like this:
for (x in n) {
result <- sapply(df, gsub, pattern = x, ...)
#ou
result <- sapply(df, str_replace, pattern = x, ...)
}
But it's difficult.