Use este identificador para citar ou linkar para este item:
http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1150456| Título: | Uma estratégia para a identificação de citações geográficas em textos técnico-científicos da área agrícola na língua portuguesa. |
| Autoria: | MOURA, M. F.![]() ![]() MEDEIROS, C. M. ![]() ![]() |
| Afiliação: | MARIA FERNANDA MOURA, CNPTIA; CLARA MATTOS MEDEIROS. |
| Ano de publicação: | 2022 |
| Referência: | Campinas: Embrapa Agricultura Digital, 2022. |
| Páginas: | 19 p. |
| Conteúdo: | Resumo - A proposta deste trabalho é utilizar um reconhecedor de entidades nomeadas para a língua portuguesa, a fim de extrair metadados de citações a localizações geográficas brasileiras em publicações técnico-científicas do domínio agrícola. A estratégia adotada consistiu na identificação de padrões de citação a localidades de interesse, a partir da criação de uma coleção dourada, e a consequente personalização do reconhecedor de entidades nomeadas da biblioteca SpaCy. Os experimentos conduzidos, com os novos treinamentos da SpaCy, mostram uma revocação média de 0,92 e uma precisão média de 0,95, permitindo aceitar que a acurácia para a identificação das localidades nos textos seja bastante confiável. |
| Palavras-chave: | Mineração de texto Reconhecimento de entidades nomeadas SpaCy |
| Série: | (Embrapa Agricultura Digital. Boletim de pesquisa e desenvolvimento, 52). |
| ISSN: | 2764-2623 |
| Tipo do Material: | Folhetos |
| Acesso: | openAccess |
| Aparece nas coleções: | Boletim de Pesquisa e Desenvolvimento (CNPTIA)![]() ![]() |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Boletim52-2022.pdf | 913.38 kB | Adobe PDF | ![]() Visualizar/Abrir |








