SóProvas


ID
4863934
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere à mineração de dados, julgue o item a seguir.


No modelo CRISP-DM, a fase na qual se planejam todas as atividades para carga dos dados é denominada entendimento dos dados.

Alternativas
Comentários
  • No modelo CRISP-DM, a fase na qual se planejam todas as atividades para carga dos dados é denominada preparação dos dados

  • Concordo com o colega Icaro silva, a questão parece se referir mais à preparação dos dados, que sua definição, segundo o material do exponencial é: abranger as atividades para construir o conjunto de dados finais a partir do dados brutos iniciais.

  • Ciclo de vida (NÃO linear) de um projeto de Mineração de Dados:

    Entendimento do Negócio -> Entendimento dos Dados -> Preparação dos Dados -> Modelagem -> Teste e Avaliação -> Implantação 

    Carga dos Dados fica na Preparação dos Dados!

  • Gabarito - Errado . Acredito que fase na qual se planejam todas as atividades para carga dos dados é a Preparação dos Dados.

    Modelo CRISP-DM

    1 – Entendimento do Negócio: essa fase busca entender qual problema o negócio quer resolver

    2 – Entendimento dos Dados :coleta inicial dos dados busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes.

    3 – Preparação dos Dados: inclui tarefas como seleção de tabelas, integração, transformação, limpeza e organização de dados

    4 – Construção do Modelo: Também chamada de Modelagem, nessa fase ocorre a seleção das técnicas, ferramentas e

    algoritmos a serem utilizados, como também a elaboração e execução da modelagem sobre o conjunto de dados preparado na fase anterior.

    5 – Teste e Avaliação: avaliar os resultados da modelagem. Avalia se as etapas atingiram os objetivos do negócio.

    6 – Implantação/Implementação: Também chamada de desenvolvimento, essa fase busca colocar o modelo para funcionar

    Fonte: PDF Prof. Diego Carvalho.

  • O planejamento das atividades é realizado na fase de entendimento de negócio.

    A fase de entendimento dos dados visa identificar os dados relevantes das diferentes fontes de dados. A fase de entendimento dos dados começa com uma coleta inicial de dados e prossegue com atividades para se familiarizar com os dados, identificar problemas de qualidade de dados, descobrir novos insights sobre os dados ou detectar subconjuntos interessantes para formar hipóteses para informações ocultas. O analista deve ser claro e conciso sobre a descrição da tarefa de mineração de dados para que os dados mais relevantes possam ser identificados e deve construir uma compreensão adequada das fontes de dados e das variáveis existentes.

    exponencial concursos

  • Quais são as etapas do processo?

    A metodologia CRISP DM define o ciclo de vida do projeto, dividindo-o em seis etapas, que vamos conhecer agora:

    Entendimento do problema

    A primeira coisa a ser feita é entender de fato qual o problema a ser resolvido, buscando todos os detalhes sobre o impacto dele na empresa e quais os objetivos em relação ao trabalho.

    Compreensão dos dados

    Essa etapa consiste em organizar e documentar todos os dados que se encontram disponíveis. É aqui que começa de fato o trabalho de mineração de dados, pois o profissional deve ser capaz de identificar quais são os dados importantes para a resolução do problema.

    Nesse momento, o lado investigativo deve entrar em campo, para que os dados revelem problemas, soluções e tendências dos negócios.

    Preparação dos dados

    Agora que os dados já foram identificados, documentados e analisados, é hora de aplicar a parte técnica de análise deles. Agora, serão preparadas as databases e definidos os formatos e questões técnicas da análise.

    Nessa etapa, é feita a escolha dos dados que serão trabalhados e de como eles serão cruzados para resolver o problema da empresa.

    Modelagem

    É nesta fase que são aplicadas de fato as técnicas de Data Mining, com base nos objetivos identificados no primeiro momento.

    A partir de agora, a mineração de dados pode ser associada a análises preditivas, para que a empresa prepare-se para o futuro, resolvendo a questão principal.

    Como? Os dados minerados podem ser usados para alimentar algoritmos que preveem as tendências dos negócios.

    Avaliação

    Agora, na verdade, entra o que é feito após o trabalho propriamente dito. Trata-se de um momento muito importante, pois é quando serão acompanhados os resultados em relação aos objetivos e também à aplicação dos conhecimentos obtidos com o Data Mining.

    Isso pode ser feito por meio de reuniões, onde os dados e insights são apresentados para os envolvidos nas tomadas de decisão.

    Implementação dos modelos na empresa

    Aqui, é a hora da verdade, onde tudo que foi obtido de conhecimento dos dados são entregues de forma a ser aplicada. A partir disso, podem ser mudados os processos dentro da organização e criados novos produtos — tudo com base em dados, garantindo, assim, o sucesso dos negócios.

  • ERRADO

    Oque é um modelo CRISP-DM?

     É um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.

    Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

    Entender os Dados: recolhimento de dados e inicio de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo. (resposta da questão)

    Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

    Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

    Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • Errado

    Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo atual.

  • Trata-se de etapa preparação de dados:

    Preparação de dados: Seleciona; integra; limpa; formata; constrói e descreve.

  • ETAPAS DA MINERAÇÃO DE DADOS CRISP-DM

    Empreendimento dos negócios: nesta etapa, o foco é entender qual o objetivo que se deseja atingir com a mineração dos dados.

    Entendimento dos dados: as fontes fornecedoras dos dados podem vir de diversos locais e possuir diversos formatos.

    Preparação dos dados: devido às diversas origens possíveis, é comum que os dados não estejam preparados para que os métodos de mineração de dados sejam aplicados diretamente.

    Modelagem: é nesta fase que as técnicas (algoritmos) de mineração serão aplicadas. A escolha da(s) técnica(s) depende dos objetivos desejados.

    Avaliação: testes e validações, visando obter a confiabilidade nos modelos, devem ser executados (cross validation, suplied test set, use training set, percentage split), e indicadores para auxiliar a análise dos resultados precisam ser obtidos (matriz de confusão, índice de correção e incorreção de instâncias mineradas, estatística kappa, erro médio absoluto, erro relativo médio, precisão, F-measure, entre outros).

    Distribuição: Após executado o modelo com os dados reais e completos, é necessário que os envolvidos conheçam os resultados. 

  • Agora fica um monte de pasp*alho floodando os comentarios praticamente copiando e colando a mesma coisa!!! Isso é frustrante(pra não dizer patetico!!!).

    Mas, mudando de assunto, vcs notaram q os cursinhos entraram em conflito sobre essa questao???(nem eles se entendem!!!)

    Segundo uma fonte q citaram ai, de um tal de Prof. Diego Carvalho, ele diz q "Acredito que fase na qual se planejam todas as atividades para carga dos dados é a Preparação dos Dados".

    Aí vem o Exponencial, e diz q "O planejamento das atividades é realizado na fase de entendimento de negócio".

    Volta o cão arrependido(o Otári*o aqui!!!) e faz mais uma pesquisa. Dessa vez, encontra o GranCursos, q diz q é na fase de Preparação dos Dados.

    O ruim desse tipo de **portaria** eh q, talvez por ser um assunto novo, a literatura não especifica o q realmente ocorre. Por exemplo, fui atrás dessa fonte[1], e tudo o q eles dizem é isso:

    Entendimento dos Dados: Entendido o negöcio, os dados necessårios å mineraqäo devem ser avaliados em termos de estrutura, relacionamentos, qualidade, quantidade e acesso;

    Preparacao dos Dados: Um algoritmo de aprendizado de måquina, assim como de qualquer tipo de anålise de dados, requer dados organizados, limpos, selecionados.

    Bem, aqui temos um problema grave q requer solução. Afinal, quem está certo? Que tal irmos atras de fontes confiaveis pra resolver esse abacaxi???

    Fonte:

    [1] Introdução à Ciencia de Dados: mineração de dados e big data, Amaral, Fernando

  • O que é um modelo CRISP-DM?

    É um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.

    Ciclo de vida (NÃO linear) de um projeto de Mineração de Dados:

    Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

    Entender os Dados: recolhimento de dados e início de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase. 

    Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

    Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

  • Além da fase de Entendimento dos Dados, temos a de Preparação dos Dados que vem a seguir.

  • ERRADO

    Trata-se da Preparação dos Dados (terceira etapa do Modelo CRISP-DM):

    • essa fase inicia uma coleta inicial de dados, ocorre o planejamento de todas as atividades para carga dos dados, além da limpeza de inconsistências.

    Creio que na fase de Entendimento do Negócio exista uma visão ampla, ainda não focada nos dados em si, alguns exemplos são: definir os objetivos, os requisitos, os problemas e elaborar um plano para alcançar esses objetivos e solucionar os problemas.

  • No modelo CRISP-DM, a fase na qual se planejam todas as atividades para carga dos dados é denominada Preparação dos dados e não entendimento dos dados.

    Cross Industry Standard Process for Data Mining CRISP-DM

    CRISP-DM pode ser traduzido como Processo Padrão Inter-Indústrias para Mineração de Dados.

    É um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.

    Fases

    Ѻ   Entender o Negócio

    Ѻ   Entender os Dados

    Ѻ   Preparação dos Dados

    Ѻ   Modelagem

    Ѻ   Avaliação

    Ѻ   Implantação

  • ERRADO

    É na fase de prepração de dados.

    Fases do CRISP DM: EE PM ADI

    Entendimento do negócio

    Entendimento dos dados

    Preparação dos dados

    Modelagem

    Avaliação

    Desenvolvimento/Implantação (execução)

  • Após a obtenção dos dados (entender os dados), as atividades e os planos baseados nos dados são realizados (preparação dos dados). Ou seja, falou em planejar com os dados, é preparação. Falou em obter? entender os dados.

  • PREPARAÇÃO DOS DADOS

  • Gente, essa é uma típica questão CESPE que pode ser qualquer coisa. Não acho relevante para o estudo de outras bancas. Se cair novamente...sabemos a resposta, mas essa resposta objetivamente não se encontra no CRISP-DM.

    Talvez a GRANDE RESPOSTA é que o CRISP-DM, assim como outros modelos da área de TI, não são fechados e nem necessariamente sequenciais...não existe "planejar todas as atividades" em uma única fase/etapa em um modelo como esse. E creio que por isso a questão esteja errada. Os planejamentos costumam ser iterativos e incrementais. O CRISP-DM não é modelo da disciplina de Administração.

    Os Professores não chegaram a um consenso, pois não há resposta no modelo.