SóProvas


ID
2355706
Banca
CONSULPLAN
Órgão
TRF - 2ª REGIÃO
Ano
2017
Provas
Disciplina
Estatística
Assuntos

Sobre técnicas de agrupamento não hierárquicas, marque V para as afirmativas verdadeiras e F para as falsas.

( ) A escolha inicial das sementes do algoritmo k-médias (k-means) não influencia no agrupamento final, pois ele é um método robusto.

( ) No k-médias cada elemento tem a chance de mudar de grupo k vezes.

( ) Dendogramas são gráficos que mostram a evolução dos grupos formados pelo k-médias.

A sequência está correta em

Alternativas
Comentários
  • Todas são falsas, vejamos:

    k-média - para dados não supervisionados

    k é o número de classes que é estabelecida pelo analista

    Para gerar as classes e classificar as ocorrências, faz-se uma comparação entre cada valor de cada linha por meio da distância. Geralmente utiliza-se a distância euclidiana para calcular o quão ‘longe’ uma ocorrência está da outra,, depois de calculado estabelece-se um centróide (uma referência) conforme os dados são colocados o centróide é refinado pela média dos valores de cada atributo de cada ocorrência que pertence a esse centróide, com isso o algorítimo (k-média) colca as ocorrências da tabela de acordo com cada atributo de cada ocorrência que pertence ao centróide de acordo com sua distância.

    ASSERTIVA

    ( FALSO ) A escolha inicial das sementes do algoritmo k-médias (k-means) não influencia no agrupamento final, pois ele é um método robusto. se  média será em relação ao K que é estabelecido pelo analista, obviamente que k irá influenciar no agrupamento final

     

     

    (FALSO ) No k-médias cada elemento tem a chance de mudar de grupo k vezes. Na verdade conforme os elementos são inseridos, a distância entre eles e o centróides vai ser ajustada pela média, mas a média do centróide é que é ajustada, esse ajuste não vai fazer com que o elemento mude de grupo

     

     

    (FALSO ) Dendogramas são gráficos que mostram a evolução dos grupos formados pelo k-médias. Dendogramas são representações gráficas para classificação de métodos não supervisionados (assim como k-média) mas o que ele faz é descobrir "padrões naturais" de comportamento entre as amostras com seu perfil multivariado e agrupa-las de tal modo que elas pertençam a um mesmo grupo, a ideia é maximizar a homegeneidade interna, dentro dos grupos e maximizar a heterogeneidade entre os grupos.