-
Clustering é um ramo da Estatística Multivariada que engloba métodos utilizados para descobrir estruturas em um conjunto complexo de dados. O objetivo principal de clustering é separar objetos ou observações em classes naturais de forma que os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.
Análise de Séries Temporais: determina características seqüenciais, como dados com dependência no tempo. Seu objetivo é modelar o estado do processo extraindo e registrando desvios e tendências no tempo.
Fonte: http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf
-
Tipos de Descoberta de Conhecimento durante a Data Mining:
- Regras de associação - Essas regras relacionam a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.
- Hierarquias de classificação - O objetivo é trabalhar em um conjunto de eventos ou transações para criar uma hierarquia de classes.
- Padrões seqüenciais - Uma seqüência de ações ou eventos é investigada.
- Padrões com séries temporais - Similaridades podem ser encontradas em posições de uma série temporal de dados, que é uma seqüência de dados tomada a intervalos regulares, como vendas diárias ou preço diário de fechamento de ações.
- Clustering (Agrupando) - Uma dada população de eventos ou novos itens podem ser particionados (segmentados) em conjuntos de elementos 'similares'.
Sistema de Banco de Dados - Elmari, Navathe. 4º ed.
Cap. 27 - Regras de Associação
pág. 626 e 627
-
Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.
Gaba: ERRADO
-
Sequências (e não cluster)
Na sequência os eventos estão ligados ao longo do tempo.
Pode-se descobrir, por exemplo, que quando se compra uma Casa, em 65% das vezes se adquire uma nova Geladeira no período de duas semanas; e que em 45% das vezes, um Fogão também é comprado um mês após a compra da residência.
Sequência = Casa ➞ Geladeira ➞ Fogão
-
A QUESTAO REFERE-SE AOS PADROES SEQUENCIAIS TEMPORAIS, MUITO SEMELHANTE À TECNICA DE CLUSTERIZACAO
-
Um dos métodos de classificação do datamining é a Análise de Séries Temporais, por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo.
-
CLUSTERIZAÇÃO → agrupamento de elementos com características comuns, busca melhorar o desempenho do BD.
x
PADRÕES TEMPORAIS → fator temporal/intervalos regulares.
-
Gabarito: errado
>> Outras questões:
Prova: CESPE - 2013 - MPU - Analista - Suporte e Infraestrutura
Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo
Prova: CESPE / CEBRASPE - 2021 - TCE-RJ - Analista de Controle Externo - Especialidade: Tecnologia da Informação
No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)
Prova: CESPE - 2013 - SERPRO - Programador de computador
Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo
-
GABARITO ERRADO
No Data Mining, a técnica de Agrupamento (Clustering) é utilizada para identificar dados que possuem alguma similaridade entre si, agrupando-os em registros que não são preestabelecidos. (Técnica não supervisionada)
FONTE: Meus resumos
“É justo que muito custe o que muito vale”. -D'Ávila
-
As características sequenciais são identificadas nos métodos de
associação e não nos métodos de análise de agrupamento.
A associação (ou aprendizagem de regras) visa descobrir
relacionamentos entre variáveis em grandes bancos de dados. Dito de outro
modo, as regras de associação correlacionam a presença de um item com uma
faixa de valores para um conjunto de variáveis diverso.
▪ Análise de ligações: a ligação entre os diversos objetos de
interesse é descoberta automaticamente. Ex.: quando um cliente do sexo
masculino compra fraldas em supermercado, geralmente ele compra
cerveja.
▪ Padrões sequenciais: uma sequência de ações ou eventos é
buscada. A detecção de padrões sequenciais é equivalente à detecção
de associações entre eventos com certos relacionamentos
temporais. Ex.: se um paciente fuma excessivamente, provavelmente
sofrerá com problemas pulmonares.
▪ Padrões dentro de série temporal: as similaridades entre os dados
podem ser detectadas dentro de posições de uma série temporal, que é
uma sequência de dados tomados em intervalos regulares. Ex.: os
casacos de frio são mais baratos no verão e mais caros no inverno.
A análise de clusters (análise de agrupamentos ou análise de
aglomerações) é um método de mineração de dados essencial
para classificar itens, eventos ou conceitos em agrupamentos comuns
chamados de clusters.
Gabarito: Errado.
-
Gabarito: errado
Agrupamento( clustering):
(CESPE / CEBRASPE - 2013) Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo
(CESPE / CEBRASPE - 2021) No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)
(CESPE / CEBRASPE - 2013) Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo
obs: lembrando que a diferença entre clustering e classificação e que esse último é supervisionado, já aquele é NÃO supervisionado.