SóProvas


ID
2645914
Banca
CESPE / CEBRASPE
Órgão
TCM-BA
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

Assinale a opção correta a respeito do CRISP-DM.

Alternativas
Comentários
  • Letra A - Errada

    Cross Industry Standard Process for Data Mining (CRISP-DM) é uma metodologia especificamente desenhada para processos de mineração de dados

     

  • 6 fases da CRIP_DM:

    1.Entendimento do Negócio: entender problema, principais objetivos, expectativas;

    2.Compreensão dos Dados: inspecionar, organizar, descrever os dados. Quais dados serão relevantes para decifrar o problema?

    3.Preparação dos Dados: preparar BD´s , definir formatos, escolher atributos dos dados que trabalhará;

    4.Modelagem: Seleciona e aplica as técnicas de mineração de Dados + apropriadas para resolver o problema apontado na etapa 1.Entendimento do Negócio;

    5.Avaliação: acompanha os resultados objetivos, avalia aplicabilidade das soluções encontradas e do conhecimento obtido;

    6.Desenvolvimento: cria a entrega pro cliente

  • Como surgiu o CRISP-DM?

    Embora seja um assunto desconhecido para muitos, o CRISP-DM não é uma metodologia nova. O modelo de trabalho nasceu em 1996 a partir da iniciativa de profissionais que trabalhavam com data mining e buscavam desenvolver um modelo de processo capaz de funcionar em qualquer tipo de indústria, gratuito e não-proprietário, capaz de preencher essa lacuna.

    CRISP não é suite proprietária.

    http://www.bigdatabusiness.com.br/se-voce-se-interessa-por-big-data-precisa-entender-o-crisp-dm/

  • a) (ERRADO) - Ver comentátio do Luiz Sa.

    b) (CORRETO)

    c) (ERRADO) - Essa é a fase de Entendimento do Negócio

    d) (ERRADO) - Essa é a fase de Modelagem

    e) (ERRADO) - Essa é a fase de Avaliação

     

  • Gaba: B

     

    Fases do CRISP-DM

     

    Entender o Negócio: foca em entender o objetivo do projeto a partir

    de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

     

    Entender os Dados: recolhimento de dados e inicio de atividades para

    familiarização com os dados, identificando problemas ou conjuntos interessantes.

     

    Preparação dos Dados: construção do conjunto de dados final a partir

    dos dados iniciais. Normalmente ocorre várias vezes no processo.

     

    Modelagem: várias técnicas de modelagem são aplicadas, e seus

    parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

     

    Avaliação: é construído um modelo que parece ter grande qualidade

    de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

     

    Implantação: o conhecimento adquirido pelo modelo é

    organizado e apresentado de uma maneira que o cliente possa utilizar.

     

    https://pt.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining

  • Gabarito Letra B

    Uma pequena correção referente ao cometário do Guilherme BG quanto ao erro da alternativa D

    a) (ERRADO) - Comentário do Luiz Sa

    -->Cross Industry Standard Process for Data Mining (CRISP-DM) é uma metodologia especificamente desenhada para processos de mineração de dados.

    b) (CORRETO)

    c) (ERRADO) - Essa é a fase de Entendimento do Negócio

    Identificar o problema a ser resolvido e gerar 3 resultados:

    i.      Background: explique a situação da empresa e como o projeto irá resolver o problema;

    ii.     Objetivo do Projeto;

    iii.    Critério de Sucesso: explique qual métrica dirá se o projeto atingiu ou não seu resultado pretendido.

    d) (ERRADO) - Essa é a fase de Preparação do Dado

    i.      Selecionar o Dado: selecionar e documentar o motivo da seleção do dado;

    ii.      Limpar o Dado: tratar dados coletados sujos ou corrompidos;

    iii.      Construir o Dado: criar dados considerados necessários para o data mining;

    iv. Integrar o Dado: técnica de juntar 2 ou mais fontes de dados diferentes.

    e) (ERRADO) - Essa é a fase de Avaliação

    -->Verificar Critérios de Sucesso;

  • a) O erro da assertiva é dizer que o CRISP-DM é um padrão proprietário. Na verdade, a ideia por trás do CRISP-DM é ser um conjunto aberto e independente de softwares específicos de aplicação. ERRADA

    b) Está é a nossa resposta. A primeira verificação a respeito da estrutura e da qualidade dos dados é realizada na fase de data understanding ou entendimento de dados. CERTA

    c) Na minha opinião, o levantamento de requisitos é realizado na etapa de entendimento de negócio. Nesta etapa também é realizado o levantamento a respeito dos propósitos da mineração e construído um plano de implementação, que deve atender aos requisitos necessários para o sistema. ERRADA

    d) Não existe essa fase de avaliação de dados no CRISP-DM. ERRADA

    e) Na verdade a etapa descrita se relaciona mais com a avaliação, já que é nessa etapa que se verifica a efetividade do processo atual e se estima possibilidade de melhorias. ERRADA

  • Etapas e atividades do CRISP-DM

    Entendimento/Compreensão do Negócio

    Determinar os Objetivos de negócio

    Conhecer/Avaliar a situação

    Inventário do recurso, Risco de contingênciaRequisitos, suposições e restrições

    Determinar objetivos p/ mineração

    Produzir um plano de projeto

    Entendimento/Compreensão dos Dados

    Coletar dados iniciais

    Descrever os dados

    Explorar os dados

    Verificar a qualidade dos dados

    Preparação dos Dados

    Selecionar os dados

    Limpar os dados

    Construir os dados

    Integrar os dados

    Formatar os dados

    Descrição da Base

    Modelagem

    Selecionar técnica de modelagem

    Gerar projeto/design de teste

    Construir modelos

    Avaliar o modelo

    Ajustar o modelo

    Avaliação

    Avaliação dos resultados

    Revisão do processo

    Determinar os próximos passos

    Implantação/Entrega

    Planejar a implantação/entrega

    Planejar o monitoramento e manutenção

    Produzir relatório final

    Lições aprendidas

  • Essa foi difícil, em!!!

    Tive que pescar. hehehe

  • Verificar a qualidade dos dados parece se encaixar muito melhor na fase de "Peparação dos Dados"

  • O CRISP-DM (Cross Industry Standard Process for Data Mining) é um modelo de referência2 de mineração de dados que descreve um conjunto de processos para realizar projetos de mineração de dados em uma organização baseado nas melhores práticas utilizadas por profissionais e acadêmicos do ramo.

    É importante destacar que se trata de uma metodologia não proprietária que pode ser aplicada livremente a qualquer projeto independentemente do tamanho ou tipo do negócio. Bem, essa metodologia possui um ciclo de vida não-linear composto por seis fases ou etapas.

    “O Projeto CRISP-DM desenvolveu um modelo de processos de mineração de dados com foco industrial e independente de ferramentas. Partindo dos processos embrionários de descoberta de conhecimento usados atualmente na indústria e respondendo diretamente aos requisitos do usuário, este projeto definiu e validou um processo de mineração de dados aplicável em diversos setores da indústria. Isso tornará grandes projetos de mineração de dados mais rápidos, mais baratos, mais confiáveis e mais gerenciáveis. Até casos de mineração de dados em pequena escala se beneficiarão do uso do CRISP-DM”.

    As fases são:

    (1) Entendimento do Negócio;

    (2) Entendimento dos Dados;

    (3)Preparação dos Dados;

    (4) Modelagem;

    (5) Avaliação; e

    (6) Implantação.

  • GABARITO B

    O CRISP-DM (Cross Industry Standard Process for Data Mining) é um modelo de referência, um modelo de processos, um frame work de processos, uma metodologia de mineração de dados que descreve um conjunto de processos para realizar projetos de mineração de dados em uma organização baseado nas melhores práticas utilizadas por profissionais e acadêmicos do ramo.

  • GAB: B

    IMAGINA UM VENDEDOR DE RUA NO BRÁS. DAÍ UMA PESSOA AVISA PRA ESSE VENDEDOR QUE O RAPA (POLICIA) ESTÁ CHEGANDO PRA APREENDER O PRUDUTO DELE.

    A PESSOA AVISA:

    Ei Ei PM AÍ!

    • ENTENDIMENTO DE NEGOCIO
    • ENTENDIMENTO DE DADOS
    • PREPARACAO
    • MODELAGEM
    • AVALICAO
    • IMPLANTACAO

  • Gabarito Letra B

    a) (ERRADO) -CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias para a realização de um projeto de mineração de dados.

    -->Cross Industry Standard Process for Data Mining (CRISP-DM) é uma metodologia especificamente desenhada para processos de mineração de dados.

    b) (CORRETO) A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados.

    c) (ERRADO) -Durante a fase de preparação dos dados, é realizado um inventário de requisitos, suposições e restrições de recursos.

    Essa é a fase de Entendimento do Negócio

    Identificar o problema a ser resolvido e gerar 3 resultados:

    i.      Background: explique a situação da empresa e como o projeto irá resolver o problema;

    ii.     Objetivo do Projeto;

    iii.    Critério de Sucesso: explique qual métrica dirá se o projeto atingiu ou não seu resultado pretendido.

    d) (ERRADO) -Na fase de avaliação dos dados, são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado.

    Essa é a fase de Preparação do Dado

    i.      Selecionar o Dado: selecionar e documentar o motivo da seleção do dado;

    ii.      Limpar o Dado: tratar dados coletados sujos ou corrompidos;

    iii.      Construir o Dado: criar dados considerados necessários para o data mining;

    iv. Integrar o Dado: técnica de juntar 2 ou mais fontes de dados diferentes.

    e) (ERRADO) - Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo atual.

    Essa é a fase de Avaliação

    -->Verificar Critérios de Sucesso;

  • modelo CRISP-DM?

    • Modelo de Referência/ de Processos / Metodologia de mineração de dados
    • Não proprietária (aplicada livremente)
    • Independe do tamanho ou tipo do negócio
    • Fases não precisam seguir a sequência

    FASES:

    1)Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

    2)Entender os Dados: recolhimento de dados e início de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    3) Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    4) Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

    5) Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

    6) Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • a) CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias para a realização de um projeto de mineração de dados. ERRADA

    O CRISP-DM é um modelo de referência de mineração de dados. Trata-se de uma metodologia não proprietária.

    b) A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados. CERTA!

    São atividades da fase de entendimento dos dados:

    • Coletar os dados iniciais
    • Descrever os dados
    • Explorar os dados
    • Verificar a qualidade dos dados.

    c) Durante a fase de preparação dos dados, é realizado um inventário de requisitos, suposições e restrições de recursos. ERRADA

    São atividades da fase de preparação de dados:

    • Selecionar os dados
    • Limpar os dados
    • Construir os dados
    • Integrar os dados
    • Formatar os dados
    • Descrição da base

    d) Na fase de avaliação dos dados, são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado. ERRADA

    São atividades da fase de teste e avaliação

    • Avaliação dos resultados
    • Revisão do processo
    • Determinar os próximos passos.

    e) Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo atual. ERRADA

    A assertiva se refere à fase de teste e avaliação (acima citada)

  • CRISP-DM é assim:

    Entender como o negócio (1) funciona, pegar os seus dados (2), prepará-los(3), e fazer um modelo (4) que se adeque ao que foi entendido e preparado. Daí, você faz um teste(5), pra avaliar se o seu modelo faz jus ao negócio e aos dados. Depois, quando tudo está ok, você implanta (6).

    OBS. A fase 5 pode ser chamada de teste ou avaliação.

  • Letra B

    CRISP-DM (“é um modelo que está incluso na Mineração de dados”)

    ·        Esse modelo define o CICLO DE VIDA do projeto de Mineração de dados (data mining)

    ·        Faz com quem a Mineração de dados seja mais produtiva e eficiente

    Etapas: (“EE.PM.AI”)

    - Entendimento do negócio: definir os objetivos, requisitos, e o problema

    - Entendimento dos dados: entender e conhecer os dados -> CASO DA QUESTÃO

    - Processo de limpeza (preparação dos dados): preparar os dados para a modelagem, limpeza de inconsistências e ruídos.

    - Modelagem dos dados: aplicação de técnicas de data mining sobre os dados

    - Avaliação: realização de testes para validar os dados

    - Implementação: execução