SóProvas


ID
2522533
Banca
CESPE / CEBRASPE
Órgão
TCE-PE
Ano
2017
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard Process of Data Mining).


Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes.

Alternativas
Comentários
  • Comentário: Essa para mim foi a questão mais difícil da prova. Primeiramente você teria que se lembrar das fases do CRISP, a primeira fase é o entendimento do negócio e a segunda entendimento dos dados. Vejamos o que cada uma tem como objetivo:

    Entendimento do negócio: deve determinar os objetivos de negócio, fazer uma análise da situação atual e estabelecer os objetivos da mineração de dados. Finalizando com um plano de projeto.

    Entendimento dos dados: Nesta etapa vamos entender os dados baseados nos requisitos. Nesta etapa podemos incluir uma coleta de dados, descrição, exploração e verificação da qualidade dos mesmos. Nesta etapa temos uma característica peculiar: identificar se as variáveis do modelo são independente umas das outras. Quando as variáveis são independentes podemos concluir que elas não possuem informações sobrepostas. Em econometria ou analise matemática podemos pensar em variáveis que são linearmente independentes. Uma escolha cuidadosa de variáveis independentes pode fazer com que a execução dos algoritmos seja feita de forma mais eficiente.

    Enfim, depois desta longa explicação teórica, podemos perceber que o examinador associou eventos de etapas diferentes dos CRISP a fase de entendimento do negócio. Logo, a alternativa está incorreta.

    Gabarito Preliminar: E. Gabarito Oficial: E.

  • Só colocar na cabeça que:

    Sistemas Analíticos analisam os dados e depois acham os problemas/soluções

  • Prof. Patrícia Quintão - Ponto dos Concursos

    A seguir, destacamos uma síntese das etapas pertencentes ao modelo CRISP (The CRISPDM Consortium, 2000):

    1 Entendimento do Negócio (Business Understanding)

    Essa fase inicial tem o foco no entendimento do negócio que visa obter conhecimento sobre os objetivos do negócio e seus requisitos, e então converter esse conhecimento em uma definição de um problema de mineração de dados, e um plano preliminar designado para alcançar esses objetivos.

     

    2 Seleção dos Dados (Data Understanding)

    Consiste no entendimento dos dados, que visa à familiarização com o banco de dados pelo grupo de projeto, utilizando-se de conjuntos de dados “modelo”.

    Uma vez definido o domínio sobre o qual se pretende executar o processo de descoberta, o próximo passo é selecionar e coletar o conjunto de dados ou variáveis necessárias. Essa fase se inicia com uma coleta inicial de dados, e com procedimentos e atividades visando a familiarização com os dados, para identificar possíveis problemas de qualidade, ou detectar subconjuntos interessantes para formar hipóteses.

     

    Observe que a banca misturou conceitos das fases 1 e 2 no enunciado da questão. Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, e na fase de seleção de dados é possível fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes. Portanto, a assertiva está errada.

     

    Comentário completo no link abaixo:

    http://blog.pontodosconcursos.com.br/comentarios-da-prova-do-tcepe-para-auditor-de-contasobras-publicas-analise-de-informacoes/

  • na verdade basta saber o conceito de data mining pra resolver: ele busca encontrar variáveis interdependentes. 

  • Visa obter conhecimento sobre os objetivos do negócio e seus requesitos!


    ERRADO

  • A identificação dos dados é feita na 2ª fase (entendimento dos dados).

    Na 1ª fase (entendimento do negócio) procura-se entender o negócio e seus requisitos, não trata dos dados diretamente.

     

  • Gaba:  Errado

     

    Durante a fase de entendimento do negócio, busca-se descrever claramente o problema (fase 1), fazer a identificação dos dados (fase 2) e verificar se as variáveis relevantes para o projeto não são interdependentes.

     

    O CRISP-DM é uma metodologia utilizada para se desenvolver mineração de dados. As fases são:

     

    1. Entendimento do negócio

    2. Entendimento dos dados

    3. Preparação dos dados

    4. Modelagem

    5. Avaliação

    6. Entrega

  • Entendimento de negócios: Nessa etapa , o foco é entender qual o objetivo que se deseja atingir com a mineração de dados. O entendimento do negócio irá ajudar nas proximas etapas.

  • Entendimento dos Negócios: O foco dessa fase é entender qual objetivo deseja-se atingir com a mineração de dados

    Entendimento dos Dados: Após definir os objetivos, é necessário conhecer os dados visando:

    - Descrever de forma clara o problema

    - Identificar os dados relevantes do problema em questão

    - Certificar-se que as variáveis relevantes para o projeto não são interdependentes.

    Logo, o enunciado define o Entendimento dos Dados e não dos Negócios. QUESTÃO ERRADA!

  • Prof. Patrícia Quintão - Ponto dos Concursos

    A seguir, destacamos uma síntese das etapas pertencentes ao modelo CRISP (The CRISPDM Consortium, 2000):

    1 Entendimento do Negócio (Business Understanding)

    Essa fase inicial tem o foco no entendimento do negócio que visa obter conhecimento sobre os objetivos do negócio e seus requisitos, e então converter esse conhecimento em uma definição de um problema de mineração de dados, e um plano preliminar designado para alcançar esses objetivos.

     

    2 Seleção dos Dados (Data Understanding)

    Consiste no entendimento dos dados, que visa à familiarização com o banco de dados pelo grupo de projeto, utilizando-se de conjuntos de dados “modelo”.

    Uma vez definido o domínio sobre o qual se pretende executar o processo de descoberta, o próximo passo é selecionar e coletar o conjunto de dados ou variáveis necessárias. Essa fase se inicia com uma coleta inicial de dados, e com procedimentos e atividades visando a familiarização com os dados, para identificar possíveis problemas de qualidade, ou detectar subconjuntos interessantes para formar hipóteses.

     

    Observe que a banca misturou conceitos das fases 1 e 2 no enunciado da questão. Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, e na fase de seleção de dados é possível fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes. Portanto, a assertiva está errada.

     

    Comentário completo no link abaixo:

    http://blog.pontodosconcursos.com.br/comentarios-da-prova-do-tcepe-para-auditor-de-contasobras-publicas-analise-de-informacoes/

  • Sem nunca ter estudado a matéria matei a questão no enunciado na parte que diz:

    Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard Process of Data Mining).

    Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes.

    Quando se vai fazer um levantamento sobre o entendimento de um negócio, o problema é uma das partes intermediárias ou finais... depois de saber como deveria ser o PROCESSO do Negócio vc identifica os PROBLEMAS

  • A coleta inicial dos dados ocorre somente na fase de data understanding. Dessa forma, essa identificação dos dados e a verificação se as variáveis são interdependentes são atividades que só irão ocorrer nessa etapa de entendimento dos dados. Ao contrário do que afirma o examinador, a fase de entendimento do negócio é anterior às tarefas descritas na assertiva.

  • Etapas e atividades do CRISP-DM

    Entendimento/Compreensão do Negócio

    Determinar os Objetivos de negócio

    Conhecer/Avaliar a situação

    Inventário do recurso, Risco de contingênciaRequisitos, suposições e restrições

    Determinar objetivos p/ mineração

    Produzir um plano de projeto

    Entendimento/Compreensão dos Dados

    Coletar/identificar dados iniciais

    Descrever os dados

    Explorar os dados

    Verificar a qualidade dos dados

    Preparação dos Dados

    Selecionar os dados

    Limpar os dados

    Construir os dados

    Integrar os dados

    Formatar os dados

    Descrição da Base

    Modelagem

    Selecionar técnica de modelagem

    Gerar projeto/design de teste

    Construir modelos

    Avaliar o modelo

    Ajustar o modelo

    Avaliação

    Avaliação dos resultados

    Revisão do processo

    Determinar os próximos passos

    Implantação/Entrega

    Planejar a implantação/entrega

    Planejar o monitoramento e manutenção

    Produzir relatório final

    Lições aprendidas

  • Segundo Camilo, na fase de entendimento dos dados,

    As fontes fornecedoras dos dados podem vir de diversos locais e possuírem diversos formatos.

    Segundo Olson et al. [58], após definir os objetivos, é necessário conhecer os dados visando:

    Descrever de forma clara o problema;

    Identificar os dados relevantes para o problema em questão;

    Certificar-se de que as variáveis relevantes para o projeto não são interdependentes.

  • O erro da questão está na mistura das funções de cada fase.

  • GAB E

    O entendimento do negócio: Busca compreender das necessidades gerenciais e dos objetivos e requisitos de negócio que devem ser atendidos pela mineração de dados.

    Estratégia.

  • CRISP-DM: modelo de referência de mineração de dados que descreve um conjunto de processos para realizar projetos de mineração de dados em uma organização baseado nas melhores práticas utilizadas por profissionais.Trata-se de uma metodologia não proprietária que pode ser aplicada livremente a qualquer projeto independentemente do tamanho ou tipo de negócio.

    Fases da mineração de dados:

    entendimento dos negócios;

    entendimento dos dados;

    preparação dos dados;

    construção do modelo;

    teste e avaliação;

    implantação.

  • Gabarito E

    CRISP-DM ? Cross-Industry Standard Process of Data Mining

    [x] Empreendimento dos negócios: nesta etapa, o foco é entender qual o objetivo que se deseja atingir com a mineração dos dados.

    [x] Entendimento dos dados: as fontes fornecedoras dos dados podem vir de diversos locais e possuir diversos formatos.

    [x] Preparação dos dados: devido às diversas origens possíveis, é comum que os dados não estejam preparados para que os métodos de mineração de dados sejam aplicados diretamente.

    [x] Modelagem: é nesta fase que as técnicas (algoritmos) de mineração serão aplicadas. A escolha da(s) técnica(s) depende dos objetivos desejados.

    [x] Avaliação: testes e validações, visando obter a confiabilidade nos modelos, devem ser executados (cross validation, suplied test set, use training set, percentage split), e indicadores para auxiliar a análise dos resultados precisam ser obtidos (matriz de confusão, índice de correção e incorreção de instâncias mineradas, estatística kappa, erro médio absoluto, erro relativo médio, precisão, F-measure, entre outros).

    [x] Distribuição: Após executado o modelo com os dados reais e completos, é necessário que os envolvidos conheçam os resultados.

  • ERRADO

    A banca incluiu duas fases em uma só.

    CRISP-DM (Cross-Industry Standard Process of Data Mining)

    O CRISP-DM é uma metodologia utilizada para se desenvolver mineração de dados. Sua principal vantagem é que ela pode ser aplicada a qualquer tipo de negócio, e não tem dependência de ferramenta para ser executada. As fases são:

    1. Entendimento do negócio

    Essa fase inicial tem o foco no entendimento do negócio que visa obter conhecimento sobre os objetivos do negócio e seus requisitos, e então converter esse conhecimento em uma definição de um problema de mineração de dados, e um plano preliminar designado para alcançar esses objetivos.

    2. Entendimento dos dados

    Consiste no entendimento dos dados, que visa à familiarização com o banco de dados pelo grupo de projeto, utilizando-se de conjuntos de dados “modelo”. Aqui, você deverá coletar, descrever — usando estatísticas — , explorar e verificar a qualidade do seu dado.

    3. Preparação dos dados

    Nessa fase você irá preparar os dados para a modelagem (selecionar os dados, limpar/tratar, criar dados se necessário e fazer a integração quando houver duas fontes de dados diferentes).

    4. Modelagem

    É nesse momento que você irá realizar a construção do seu modelo. Essa fase consiste em escolher seu algoritmo — que pode ser desde Decision Trees até Neural Nets —, criar o modelo em si e tunar seus parâmetros. Você pode criar diferentes modelos e compará-los na próxima fase.

    5. Avaliação

    Hora de avaliar os resultados de seu modelo. Se lembra dos critérios de sucesso que você definiu lá na primeira fase? É hora de verificar se ela foi atingida. Se não foi, é necessário voltar a primeira fase e entender o que deu de errado, determinar um novo escopo e tentar novamente.

    6. Entrega

    Nesta fase final é hora de colocar seu modelo em produção, para que possa ser usado.

  • Cross Industry Standard Process for Data Mining (CRISP-DM) → metodologia especificamente desenhada para processos de mineração de dados;

    Fases do CRISP-DM

    Entender o Negócio → entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

    Entender os Dados → recolhimento de dados e inicio de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    Preparação dos Dados → construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    Modelagem → várias técnicas de modelagem, parâmetros calibrados para otimização. Comum retornar à Preparação dos Dados durante essa fase.

    Avaliação → verificar se o modelo atinge os objetivos do negócio.

    Implantação → conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • Fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes (ou

    seja, não se sobrepõem) são atividades da fase de entendimento dos dados e, não do negócio

  • Essa é a fase de entendimento de dados, e não de negócio.

  • Errado

    A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados

    Fases do CRISP-DM

    Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

    Entender os Dados: recolhimento de dados e inicio de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

    Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

    Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • ERRADO

    Oque é um modelo CRISP-DM?

     É um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.

    Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos. (RESPOSATA DA QUESTÃO)

    Entender os Dados: recolhimento de dados e inicio de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

    Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

  • Questão ERRADA

    O conteúdo dessa questão está no relatório técnico da Universidade Federal de Goiás, que cita Olson et al. e pode ser visto aqui:

    https://rozero.webcindario.com/disciplinas/fbmg/dm/RTINF_001-09.pdf

    CRISP-DM consiste em 6 fases, e as duas primeiras são:

    1. Entendimento do negócio:

    Nessa etapa, o foco é entender qual o objetivo que se deseja atingir com a mineração de dados. O entendimento do negócio irá ajudar nas próximas etapas.

    2. Entendimento dos dados:

    As fontes fornecedoras dos dados podem vir de diversos locais e possuírem diversos formatos. Segundo Olson et al., após definir os objetivos, é necessário conhecer os dados visando:

    •Descrever de forma clara o problema; :

    • Identificar os dados relevantes para o problema em questão;

    • Certificar-se de que as variáveis relevantes para o projeto não são interdependentes.”

    Note, portanto, que os itens elencados na questão correspondem à fase 2. 

  • Fases do CRISP/DM:

    1 - Entendimento de negócio: Essa fase busca entender o que o cliente quer, qual problema ele quer resolver, os objetivos do cliente, limitações e etc.

    2 - Entendimento de Dados: Aqui vamos começar a trabalhar com os dados brutos, buscando entender esses dados (por isso entendimento de dados) e descobrir mais detalhes sobre eles.

    3 - Preparação de dados: Vamos preparar os dados por meio de técnicas de mineração, a fim de excluir dados inúteis, completar dados, transformar dados e etc.

    4 - Construção do modelo: Aqui vamos escolher as técnicas, ferramentas e algoritmos que serão utilizados, tendo como base os dados da fase anterior (preparação de dados);

    5 - Teste e Avaliação: Vamos testar os dados a fim de descobrir se as metas impostas foram atingidas, os problemas foram solucionados e etc.

    6 - Implementação: Por fim vem a implementação definitiva no ambiente do cliente, para que ele utilize-o.

    Perceba que a QC mistura a fase 1 com a fase 2.

    Gab.: Incorreto

  • SIM. A BANCA REPETE QUESTÕES:

    (CESPE / CEBRASPE - 2021 – TCE-RJ – Controle Externo) Com relação a noções de mineração de dados e Big Data, julgue os itens que se seguem.

    Na primeira fase do CRISP-DM (cross industry standard process for data mining), há o entendimento dos dados para que se analise a qualidade destes.

    RESPOSTA: A primeira fase do CRISP-DM é entendimento do NEGÓCIO e não entendimento dos dados.

    GABARITO: ERRADO.

  • CRISP possui 6 etapas/fases:

    Entendimento do negócio: determinar os objetivos de negócio, fazer uma análise da situação atual e estabelecer os objetivos da mineração de dados, finalizando com um plano de projeto.

    Entendimento dos dados: Baseado nos requisitos. Coleta de dados, descrição, exploração e verificação da qualidade dos mesmos. Identificar se as variáveis do modelo são independentes umas das outras, se independentes, não possuem informações sobrepostas

    Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase. A mineração de dados se encaixa aqui

    Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

    Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados. 

  • alguém sabe me explicar o que significa: variáveis não serem interdependentes?

    Sei que essa verificação acontece na fase de entendimento dos dados,mas quera saber o que quer dizer.

  • Basta associar que ANTES de você sequer pensar em DADOS vc tem que primeiro entender qual é o NEGÓCIO. Depois que a fase do negócio estiver claramente determinada (objetivos, análise de situação, plano...) você pode saber quais dados precisa (coletar de dados, descrever, explorar, verificar da qualidade dos mesmos) e é nessa etapa que vc identifica se as variáveis são independentes umas das outras (se não forem, elas têm informações sobrepostas)

  • Nessa fase se objetiva identificar o problema; ainda não se descreve o problema, pois ainda não se sabe qual é; está em fazer de observação para identificá-lo.

  • Errado. Identificação dos dados não é na fase de entendimento do negócio. Isso fica na fase de compreensão dos dados.