Use este identificador para citar ou linkar para este item:
http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/885560
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.author | MOURA, M. F. | pt_BR |
dc.contributor.author | SANTOS, F. F. dos | pt_BR |
dc.contributor.author | MARCACINI, R. M. | pt_BR |
dc.contributor.author | REZENDE, S. O. | pt_BR |
dc.date.accessioned | 2011-04-11T11:11:11Z | pt_BR |
dc.date.available | 2011-04-11T11:11:11Z | pt_BR |
dc.date.created | 2011-04-11 | pt_BR |
dc.date.issued | 2010 | pt_BR |
dc.identifier.citation | Campinas: Embrapa Informática Agropecuária, 2010. | pt_BR |
dc.identifier.uri | http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/885560 | pt_BR |
dc.description | Para facilitar a compreensão de uma coleção de documentos, pode-se organizá-la em grupos hierárquicos e obter descritores para cada um dos grupos automaticamente. O problema que se apresenta é decidir entre métodos de agrupamentos e de descrição dos grupos, que sejam eficientes e apresentem bons resultados. Particularmente, este trabalho apresenta uma proposta para a comparação entre resultados obtidos a partir de métodos de seleção de descritores em agrupamentos hierárquicos de documentos, especificamente para métodos independentes do algoritmo de agrupamento utilizado. Para esses métodos, dado um agrupamento hierárquico, o objetivo é selecionar descritores (palavras ou sentenças) discriminativos dos grupos, preferencialmente sem repetição de descritores ao longo dos efetivamente representativo da coleção de textos agrupada. Dessa forma, torna-se imperativo encontrar uma medida que verifique a efetividade da discriminação para os descritores selecionados, bem como uma medida de qualidade destes. Nessa proposta, a discriminação é medida por meio da avaliação dos resultados de um processo de recuperação de informações, que utiliza os descritores para formar as expressões de busca. A qualidade é medida pela variabilidade do vocabulário obtido e sua representatividade em relação ao conjunto total de atributos utilizado para o agrupamento dos documentos. Essas medidas e processo de validação respeitam a hierarquia produzida pelo agrupamento, bem como padronizações e validações confiáveis do ponto de vista estatístico. Os experimentos e os resultados obtidos mostram que essa metodologia é capaz de avaliar seguramente a diferença de efetividade entre métodos de descrição de agrupamentos hierárquicos, tendo sido aplicada a dezesseis coleções de textos e quatro diferentes métodos de descrição. | pt_BR |
dc.language.iso | por | pt_BR |
dc.relation.ispartofseries | (Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 26). | pt_BR |
dc.rights | openAccess | pt_BR |
dc.subject | Descritores de agrupamento | pt_BR |
dc.subject | Agrupamento hierárquico | pt_BR |
dc.subject | Mineração de texto | pt_BR |
dc.subject | Modelos lineares generalizado | pt_BR |
dc.subject | Análise de variância | pt_BR |
dc.subject | Recuperação de informação | pt_BR |
dc.subject | Hierarchical document clusters descriptors | pt_BR |
dc.subject | Multiple mean comparisons | pt_BR |
dc.subject | Generalized linear models | pt_BR |
dc.subject | Mutual information mean | pt_BR |
dc.title | Metodologia para a comparação de diferentes métodos de descrição de agrupamentos hierárquicos de documentos independentes do algoritmo de agrupamento. | pt_BR |
dc.type | Folhetos | pt_BR |
dc.date.updated | 2011-04-11T11:11:11Z | pt_BR |
dc.format.extent2 | 37 p. il. | pt_BR |
riaa.ainfo.id | 885560 | pt_BR |
riaa.ainfo.lastupdate | 2011-04-11 | pt_BR |
dc.contributor.institution | MARIA FERNANDA MOURA, CNPTIA; FABIANO FERNANDES DOS SANTOS, USP; RICARDO MARCONDES MARCACINI, USP; SOLANGE OLIVEIRA REZENDE, USP. | pt_BR |
Aparece nas coleções: | Boletim de Pesquisa e Desenvolvimento (CNPTIA)![]() ![]() |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
BolPesq26.pdf | 1.29 MB | Adobe PDF | ![]() Visualizar/Abrir |