Resumo Trabalho

COMPILAÇÃO E ANOTAÇÃO DO CORPUS COELHO NETTO: LUZES NO ENSINO E PESQUISAS LITERÁRIAS POR MEIO DA LINGUÍSTICA DE CORPUS

Autor(es): FRANCIMARY MACEDO MARTINS

Este trata da compilação e anotação morfossintática do Corpus Coelho Netto, um corpus de textos literários dos séc. XIX e XX, dos romances A Conquista e Turbilhão e contos de Sertão, do escritor Coelho Netto. A pesquisa está na interface da Linguística Computacional e da Linguística de Corpus (BERBER SARDINHA, 2000, 2004, 2005a; ALUÍSIO; ALMEIDA, 2006; ALENCAR, 2010, 2013a, 2013b). A compilação consistiu nas etapas de seleção, coleta de textos e manipulação; nesta são realizadas a limpeza, edição e atualização dos textos; e a Anotação Morfossintática do Corpus, que foi realizada pelo etiquetador automático Aelius, modelo AeliusHunPos, um software livre em Python que utiliza a Natural Language Toolkit – NLTK. O Corpus está preparado para ser submetido a análises linguístico-computacionais, envolvendo o campo do ensino e estudo em áreas diversas. O Corpus está em processo de ajustes de adequação para envio e publicação no Repositório de Recursos da Linguateca-PT.

Veja o artigo completo: PDF