Por favor, use este identificador para citar o enlazar este ítem: http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1150456
Título: Uma estratégia para a identificação de citações geográficas em textos técnico-científicos da área agrícola na língua portuguesa.
Autor: MOURA, M. F.
MEDEIROS, C. M.
Afiliación: MARIA FERNANDA MOURA, CNPTIA; CLARA MATTOS MEDEIROS.
Año: 2022
Referencia: Campinas: Embrapa Agricultura Digital, 2022.
Páginas: 19 p.
Descripción: Resumo - A proposta deste trabalho é utilizar um reconhecedor de entidades nomeadas para a língua portuguesa, a fim de extrair metadados de citações a localizações geográficas brasileiras em publicações técnico-científicas do domínio agrícola. A estratégia adotada consistiu na identificação de padrões de citação a localidades de interesse, a partir da criação de uma coleção dourada, e a consequente personalização do reconhecedor de entidades nomeadas da biblioteca SpaCy. Os experimentos conduzidos, com os novos treinamentos da SpaCy, mostram uma revocação média de 0,92 e uma precisão média de 0,95, permitindo aceitar que a acurácia para a identificação das localidades nos textos seja bastante confiável.
Palabras clave: Mineração de texto
Reconhecimento de entidades nomeadas
SpaCy
Citación: (Embrapa Agricultura Digital. Boletim de pesquisa e desenvolvimento, 52).
ISSN: 2764-2623
Tipo de Material: Folhetos
Acceso: openAccess
Aparece en las colecciones:Boletim de Pesquisa e Desenvolvimento (CNPTIA)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
Boletim52-2022.pdf913.38 kBAdobe PDFVista previa
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace