Use este identificador para citar ou linkar para este item: http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1126478
Título: Análise de cluster não supervisionado em R: agrupamento hierárquico.
Autoria: FERREIRA, R. R. M.
PAIM, F. A. de P.
RODRIGUES, V. G. S.
CASTRO, G. S. A.
Afiliação: ROGERIO RESENDE MARTINS FERREIRA, CNPM; FERNANDO ANTONIO DE PADUA PAIM, CNPM; VALÉRIA GUIMARÃES SILVESTRE RODRIGUES, USP; GUSTAVO SPADOTTI AMARAL CASTRO, CNPM.
Ano de publicação: 2020
Referência: Campinas: Embrapa Territorial, 2020.
Páginas: 43 p.
Conteúdo: Ao analisar uma base de dados, um dos principais desafios do analista é resumir a informação coletada. Em muitos casos, quando contamos com um grande número de observações, pode ser de interesse criar grupos. Dentro de cada grupo os elementos devem ser semelhantes entre si e diferentes dos elementos dentro dos outros grupos. A análise de clusters é um procedimento da estatística multivariada que tenta agrupar um conjunto de dados em subgrupos homogêneos, chamados de agrupamentos. É uma técnica matemática que tem como finalidade revelar estruturas de classificação nos dados do mundo real. Os métodos hierárquicos da análise de cluster têm como principal característica um algoritmo capaz de fornecer mais de um tipo de partição dos dados. Ele gera vários agrupamentos possíveis, e um cluster pode ser mesclado a outro em determinado passo do algoritmo. A maioria dos ambientes e softwares de análise estatística dispõem de opções para fazer análise de cluster e construção de dendrogramas. O software R conta com uma grande quantidade de funções e pacotes de trabalho para análise de agrupamento. É nesse contexto que esta publicação se insere, ao descrever os principais conceitos para a aplicação de procedimentos estatísticos de análise não supervisionada que objetivam produzir agrupamentos hierárquicos com base na semelhança ou dissemelhança entre os objetos de estudo. O leitor perceberá a dificuldade associada ao processo e entenderá os usos principais da técnica.
Thesagro: Análise de Dados
Palavras-chave: Análise de agrupamento
Software
Série: (Embrapa Territorial. Documentos, 133)
ISSN: 0103-7811
Tipo do Material: Folhetos
Acesso: openAccess
Aparece nas coleções:Série Documentos (CNPM)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
5360.pdf7,06 MBAdobe PDFThumbnail
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace