SóProvas


ID
5594986
Banca
CESPE / CEBRASPE
Órgão
Prefeitura de Aracaju - SE
Ano
2021
Provas
Disciplina
Banco de Dados
Assuntos

Em um projeto de data mining, a coleta do dado que será garimpado ocorre no processo de 

Alternativas
Comentários
  • A coleta dos dados que serão minerados é uma etapa prévia à própria aplicação das tarefas de mineração (como classificação, clusterização, regras de associação…), sendo assim uma das etapas do processo de preparação.

    Gabarito: B

  • Introdução

    • Mineração de dados: descoberta de novas informações em função de padrões ou regras em grandes quantidades de dados. Para que os dados possam ser minerados. De acordo com a metodologia CRISP-DM existem fases para isso. Elas são: entendimento do negócio, compreensão dos dados, preparação dos dados, modelagem, abstração e entrega. Veja a imagem a seguir para entender melhor: https://dnc.group/blog/wp-content/uploads/2020/10/crispdm.png

    Vamos às alternativas.

    • a) Errada, por quê? O comando da questão está pedindo uma fase, não o processo como um todo
    • b) A Preparação dos Dados compreende as ações de pré-processamento dos dados para a fase de modelagem propriamente dita. Exemplos dessa fase: selecionar os dados que serão efetivamente analisados, promover a limpeza de dados, adequar ao formato e construir novos atributos.
    • c) Aqui pela lógica conseguimos mantar a essa letra. Veja pelo comando da questão que está querendo coletar o dado, não está no momento de aplicá-lo
    • d) Regras de associação lida com o relacionamento de mais de uma transação, ou seja, são elementos que ocorrem em comum. Exemplo: a compra de um produto quando um outro produto é comprado. O enunciado está ainda a um passo atrás, não está querendo nenhuma implicação.
    • e) É um dado preditivo. Toda vez que queremos encontrar uma informação preditiva que retorne um valor numérico, usamos a regressão.

    Fonte:

    • PDF da estratégia concursos do professor Thiago Rodrigues Cavalcanti
    • USP Regras de Associação Regras de Associação https://dcm.ffclrp.usp.br/~augusto/teaching/ami/AM-I-Regras-Associacao.pdf
    • O que são problemas de Classificação e de Regressão? https://www.youtube.com/watch?v=rDIocV_r9Xk
  • Gabarito (B)

    CRISP-DM - é uma METODOLOGIA desenhada para processos de mineração de dados. Nego DaDa Modela AÍ

    Entender o Negócio: é realizado um inventário de requisitos, suposições e restrições de recursos.

    Entender os Dados: recolhimento de dados e início de atividades para familiarização com os dados, identificando problemas.

    - Verificação da qualidade dos dados.

    Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Ocorre várias vezes no processo.

    - Coleta do dado que será garimpado.

    Modelagem: são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado.

    Avaliação: são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo.

    Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • Letra B

    CRISP-DM (“é um modelo que está incluso na Mineração de dados”)

    ·        Esse modelo define o CICLO DE VIDA do projeto de Mineração de dados (data mining)

    ·        Faz com que a Mineração de dados seja mais produtiva e eficiente

    Etapas: (“EE.PM.AI”)

    - Entendimento do negócio: definir os objetivos, requisitos, e o problema

    - Entendimento dos dados: conhecer os dados

    - Preparação dos dados: limpeza, preparação e planejamento dos dados para a modelagem

    - Modelagem dos dados: aplicação de técnicas de data mining

    - Avaliação: realização de testes para validar os dados

    - Implementação / Desenvolvimento