Mining Text with Weka

6

I would like to know how to create a .arff executable file to use in weka. I remember that I am mining text. My file is experiencing errors and I'm not getting results.

Following is a piece of the file:

@relation texto
@attribute message string
@attribute classe {Teste.Mineracao}


@data
'A palavra “pedófilo” é um composto recente do
substantivo pais (criança) e do verbo phileo
(amar). Com essa base, são encontrados dois
substantivos em grego antigo: paidophilos e
paidophilès. A pedofilia grega é o amor homossexual
e pedagógico de um homem maduro
por um menino impúbere (Binard & Clouard,
1997).
Hoje, de acordo com os autores citados acima,
a pedofilia seria caracterizada pelo desejo
sexual de um adulto em relação às crianças.
Mas, perguntam eles, de que desejo se trata?
Um pai que abusa de sua filha durante anos
pertence à mesma categoria que um homem
que gosta de acariciar meninos de oito anos?
Dutroux – belga que foi notícia recorrente nos
jornais em 1996, quando os corpos de duas meninas
de oito anos, violentadas e mortas por
inanição, foram encontrados enterrados no jardim
de sua casa – nomeado pela opinião pública
de pedófilo, não seria antes um sádico, um
assassino ou um perverso?
O objetivo deste trabalho é mostrar como o
termo pedofilia é entendido pela Folha de S.
Paulo, o jornal de maior circulação no Brasil
hoje. Para tanto, procuro entender suas características
em oposição a outros termos designativos
da violência sexual contra a criança:
estupro, abuso sexual, pornografia e incesto,
contribuindo, dessa forma, para a discussão
acerca da representação da violência sexual e
de seu agressor.', Teste
    
asked by anonymous 21.04.2015 / 22:50

2 answers

2

If you want to split the text into subStrings formed by this video will help you. Here the link for the documentation of the function that divides the text into vectors of words.

Here the link for standard file formatting.

If this does not solve, explain better what you want to do, and what errors.

    
22.04.2015 / 02:21
0

From what I've seen, in your file you have two declared classes, Test and Mining, but in @data you only have Teste , the Mining class is missing! Or you include or exclude the attribute classe -> @attribute classe {Teste}

    
28.02.2018 / 04:49