-
A coleta dos dados que serão minerados é uma etapa prévia à própria aplicação das tarefas de mineração (como classificação, clusterização, regras de associação…), sendo assim uma das etapas do processo de preparação.
Gabarito: B
-
Introdução
- Mineração de dados: descoberta de novas informações em função de padrões ou regras em grandes quantidades de dados. Para que os dados possam ser minerados. De acordo com a metodologia CRISP-DM existem fases para isso. Elas são: entendimento do negócio, compreensão dos dados, preparação dos dados, modelagem, abstração e entrega. Veja a imagem a seguir para entender melhor: https://dnc.group/blog/wp-content/uploads/2020/10/crispdm.png
Vamos às alternativas.
- a) Errada, por quê? O comando da questão está pedindo uma fase, não o processo como um todo
- b) A Preparação dos Dados compreende as ações de pré-processamento dos dados para a fase de modelagem propriamente dita. Exemplos dessa fase: selecionar os dados que serão efetivamente analisados, promover a limpeza de dados, adequar ao formato e construir novos atributos.
- c) Aqui pela lógica conseguimos mantar a essa letra. Veja pelo comando da questão que está querendo coletar o dado, não está no momento de aplicá-lo
- d) Regras de associação lida com o relacionamento de mais de uma transação, ou seja, são elementos que ocorrem em comum. Exemplo: a compra de um produto quando um outro produto é comprado. O enunciado está ainda a um passo atrás, não está querendo nenhuma implicação.
- e) É um dado preditivo. Toda vez que queremos encontrar uma informação preditiva que retorne um valor numérico, usamos a regressão.
Fonte:
- PDF da estratégia concursos do professor Thiago Rodrigues Cavalcanti
- USP Regras de Associação Regras de Associação https://dcm.ffclrp.usp.br/~augusto/teaching/ami/AM-I-Regras-Associacao.pdf
- O que são problemas de Classificação e de Regressão? https://www.youtube.com/watch?v=rDIocV_r9Xk
-
Gabarito (B)
CRISP-DM - é uma METODOLOGIA desenhada para processos de mineração de dados. Nego DaDa Modela AÍ
Entender o Negócio: é realizado um inventário de requisitos, suposições e restrições de recursos.
Entender os Dados: recolhimento de dados e início de atividades para familiarização com os dados, identificando problemas.
- Verificação da qualidade dos dados.
Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Ocorre várias vezes no processo.
- Coleta do dado que será garimpado.
Modelagem: são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado.
Avaliação: são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo.
Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.
-
Letra B
CRISP-DM (“é um modelo que está incluso na Mineração de dados”)
· Esse modelo define o CICLO DE VIDA do projeto de Mineração de dados (data mining)
· Faz com que a Mineração de dados seja mais produtiva e eficiente
Etapas: (“EE.PM.AI”)
- Entendimento do negócio: definir os objetivos, requisitos, e o problema
- Entendimento dos dados: conhecer os dados
- Preparação dos dados: limpeza, preparação e planejamento dos dados para a modelagem
- Modelagem dos dados: aplicação de técnicas de data mining
- Avaliação: realização de testes para validar os dados
- Implementação / Desenvolvimento