How to pick up words and save in a string?

0

How do I save words I get in a new string ?

gravarArq.println(token.getLexeme() + "_" + token.getPOSTag() + "_" + token.getFeatures());

How do I get what comes from token.getPOSTag() and save all words that come from it into a new string ?

for (org.cogroo.text.Token token : sentence.getTokens()) { // lista de tokens
    token.getStart(); token.getEnd(); // caracteres onde o token comeca e termina
    token.getLexeme(); // o texto do token (palavra que ele separa e pega exp: "clinico"
    token.getLemmas(); // um array com os possiveis lemas para o par lexeme+postag
    token.getPOSTag(); // classe morfologica de acordo com o contexto("coloca "prp, adj,n(noun))
    token.getFeatures(); // genero, numero, tempo etc
    contadorTokens++;
    System.out.println(token.getLexeme() + "_" + token.getPOSTag() + "_" + token.getFeatures());// imprime a palavra com o tag
      gravarArq.println(token.getLexeme() + "_" + token.getPOSTag() + "_" + token.getFeatures());
    //System.out.println(token.getLexeme());
}
    
asked by anonymous 06.11.2014 / 23:15

1 answer

1

If I understand, I think that's it.

// poo instantiation

String val = new String(token.getPOSTag());

// declaration and instantiation (more practical)

String val = token.getPOSTag();

But if your token.getPOSTag () attribute has more than 1 value after that for scan, you will need a list.

ArrayList<String> listaTokens = new ArrayList<String>();

for (org.cogroo.text.Token token : sentence.getTokens()) { // lista de tokens
    token.getStart(); token.getEnd(); // caracteres onde o token comeca e termina
    token.getLexeme(); // o texto do token (palavra que ele separa e pega exp: "clinico"
    token.getLemmas(); // um array com os possiveis lemas para o par lexeme+postag
    listaTokens.add(token.getPOSTag()); // classe morfologica de acordo com o contexto("coloca "prp, adj,n(noun))
    token.getFeatures(); // genero, numero, tempo etc
    contadorTokens++;
    System.out.println(token.getLexeme() + "_" + token.getPOSTag() + "_" + token.getFeatures());// imprime a palavra com o tag
      gravarArq.println(token.getLexeme() + "_" + token.getPOSTag() + "_" + token.getFeatures());
    //System.out.println(token.getLexeme());
}
    
07.11.2014 / 04:17