Questão Q768681

Com relação a data mining e data warehouse, julgue o item que se segue.

Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever conhecimento descoberto durante processos de mineração de dados.

Alternativas

Certo

Errado

Comentários

Se analisarmos a descrição acima temos uma definição da tarefa de agrupamento ou clustering. A clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo comalguma medida de similaridade. De forma intuitiva, padrões pertencentes a um dado cluster devem ser mais “similares” entre si do que em relação a padrões pertencentes a outros clusters.

Vejam, portanto, que a alternativa está correta.

Fonte: https://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-sedf-tecnologia-da-informacao-bd-e-bi/
Ele está falando da classificação de dados. Que é uma alternativa para obtenção de conhecimento. O agrupamento de dados similares. CORRETO
Trata-se de Clusterização / Agrupamento de Dados.

Paulo ☕, posso até estar enganado, mas acho que na classificação de dados as classes são predefinidas. No caso da questão, deseja-se agrupar registros em grupos com base em suas similaridades, ou seja, não existem classes predefinidas, como bem explica o comentário do Marco Aguiar.
associação

classificação

agrupamento

2016

Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.

2012

Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados.

Certa
CORRETO
Agrupamento é uma das tarefas que podem ser realizadas pelos Data Mines. Ela é uma maneira de descrever conhecimento, mas não é a descoberta de conhecimento em si.
Descrever conhecimento é foda.
CORRETO

Pode ser por agrupamento K-means
CERTO

Acredito que outra questão ajuda a responder essa.

(2017/TCE-PE/Auditor) Em relação à análise de agrupamentos (clusterização) em mineração de dados, o método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. CERTO
Gabarito Certo

Em data mining, na tarefa de Agrupamento (Clustering), o algoritmo de agrupamento tem como meta identificar semelhanças entre dados e dispor estes em grupos de acordo com o seu grau de similaridade. Com isto os dados ficam organizados em subconjuntos homogêneos, o que torna a visualização pelo usuário mais simples e compreensível.
Gab certo

Tarefa de Agrupamento (Clustering)
O algoritmo de agrupamento tem como meta identificar semelhanças entre dados e dispor estes em grupos de acordo com o seu grau de similaridade. Com isto os dados ficam organizados em subconjuntos homogêneos, o que torna a visualização pelo usuário mais simples e compreensível.
Em data mining, na tarefa de Agrupamento (Clustering), o algoritmo de agrupamento tem como meta identificar semelhanças entre dados e dispor estes em grupos de acordo com o seu grau de similaridade. Com isto os dados ficam organizados em subconjuntos homogêneos, o que torna a visualização pelo usuário mais simples e compreensível.

(2017/TCE-PE/Auditor) Em relação à análise de agrupamentos (clusterização) em mineração de dados, o método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. CERTO
Marquei errado por utilizar o termo conhecimento, acredito que o mais correto seria utilizar informação. O Data Mining fará o tratamento de dados para gerar informações que possam gerar conhecimento e valor para o usuário. A informação se tornará conhecimento apenas se for útil ao usuário, o que não é garantido.
Se analisarmos a descrição acima temos uma definição da tarefa de agrupamento ou clustering. A clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo com alguma medida de similaridade. De forma intuitiva, padrões pertencentes a um dado cluster devem ser mais “similares” entre si do que em relação a padrões pertencentes a outros clusters.

Vejam, portanto, que a alternativa está correta.

Fonte: https://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-sedf-tecnologia-da-informacao-bd-e-bi/
O agrupamento ou clusterização junta registros semelhantes entre si e diferente dos presentes nos demais grupos. Essa é, realmente, uma técnica descritiva de mineração de dados, que permite descrever o conhecimento obtido em forma de um agrupamento de valores semelhantes. É importante que você se lembre que a clusterização é associada ao aprendizado de máquina não supervisionado, em que as classes em que os registros serão distribuídos não são conhecidas previamente.
SÓ NÃO ENTENDI A PARTE QUE FALA EM "conhecimento descoberto", ALGUÉM PODERIA EXPLICAR???
# CLUSTERIZAÇÃO -> PROCESSO QUE BASICAMENTE BUSCA AGRUPAR DADOS QUE POSSUEM ALGUMA SIMILARIDADE. O GRUPO DERIVADO DESTE PROCESSO PODE SER CHAMADO DE CLUSTER. A CLUSTERIZAÇÃO BUSCA PRINCIPALMENTE MELHORAR O ''DESEMPENHO'', SE É QUE PODEMOS CHAMAR ASSIM, DE UM BD.
DADOS > INFORMAÇÃO > CONHECIMENTO > INTELIGÊNCIA
======================
Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever CONHECIMENTO descoberto durante processos de mineração de dados. (ERRADO)
======================
Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever DADOS descobertos durante processos de mineração de dados. (CERTO)
======================
======================MAS... QUEM SOU EU NA FILA DO PÃO ?!?!?!
AGRUPAMENTO: Técnica de aprendizagem não-supervisionada. Encontra os grupos e os classifica de maneira automática.

OBJETIVO: Colocar registros em grupos por semelhança e aproximação.
GABARITO: CERTO

Assertiva refere-se a tarefa ou técnica de clusterização ou agrupamento.

A análise de cluster é uma ferramenta de análise exploratória de dados para resolver problemas de classificação. O objetivo é classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters.
Descrever CONHECIMENTO foi pra acabar . Na prova eu erraria.
ESTATÍSTICA E TECNOLOGIA DA INFORMAÇÃO, CAMINHANDO LADO A LADO. SÃO ESSES GUERREIROS QUE CONSEGUEM TRAZER GRANDES AVANÇOS PARA A MEDICINA. UMA SALVA DE PALMAS *CLAC CLAC CLAC*

#MOMENTOREFLEXÃO
Gab.: C

A técnica de clusterização/ agrupamento é descritiva. Além disso, buscar agrupar elementos similares em um cluster. Dentro de uma população temos vários clusters.

O conhecimento descoberto na clusterização se dá por esses agrupamentos. A forma de obter conhecimento baseada nessa técnica
CERTO

Na descrição acima temos uma definição da tarefa de agrupamento ou clustering.

A clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo com alguma medida de similaridade.
Agrupamento (clustering/agregação): Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos. (Descritiva, não supervisionado, não utiliza classes previamente definidas)
"O objetivo do agrupamento é colocar registros em grupos, de modo que os registros em um grupo sejam semalhantes uns aos outros e diferentes dos registros em outros grupos. Os grupos constumam ser disjuntos." Navathe (2011,p .712)
Questão mal elaborada, "é uma maneira de descrever conhecimento descoberto" não há conhecimentos nesta fase, no máximo informações, construidas a partir dos dados organizados.
O melhor foi "agrupar registros em grupos", não é redundância?
CERTO
Trata-se da técnica de Mineração de Dados -> Clustering (Agrupamento)
- Aprendizado Não supervisionado (ninguém ensina o algoritmo, as classes são criadas pelo próprio algoritmo)
- coloca no mesmo grupo "objetos" similares -> vai observar o que tem similar e agrupar automaticamente (características comuns)
ex: O algoritmo na Netflix vai agrupar os usuários que assistem séries de "terror", e ao lançar uma nova séria desse tipo, recomendará de imediato para esses usuários.
Gabarito: Correto.
A ideia da clusterização é agrupar as observações (os registros) em grupos em que seus membros são semelhantes entre si e diferentes dos demais grupos. Enquanto na classificação nós já temos um conjunto predefinido de classes em que o sistema deve dividir as observações, na clusterização esses grupos são determinados pelo próprio algoritmo, então náo ha classes predefinidas
Gabarito certo.
Data mining ou mineração de dados é um processo para extrair dados específicos de um grande banco de dados. Para isso, há algumas técnicas, sendo elas:
1. -Regras de associação
2. -Árvores de decisão
3. -Redes neurais
4. -Induções de regras
5. -Análise de agrupamentos
A análise de agrupamentos (clusterização) tem como objetivo classificar casos em grupos, de modo que seja forte a associação entre os dados do mesmo agrupamento e a associação seja fraca entre dados de diferentes agrupamentos.
Existem grupos que são semelhantes entre si e diferentes dos registros que estão em outros grupos, mas que se correlacionam e descrevem, a partir disso, um conhecimento (descrição de conhecimento) descoberto.

SóProvas

Continue usando...

O que está incluso