SóProvas


ID
4863955
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere à mineração de dados, julgue o item a seguir.


O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.

Alternativas
Comentários
  • Mineração de Dados faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs) que possui 5 FASES: 

    Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação 

    Como diz a questão, nessa fase ocorre a diminuição da quantidade de dados que serão analisados!

  • O pré-processamento é um conjunto de atividades que envolvem preparação, organização e estruturação dos dados. Trata-se de uma etapa fundamental que precede a realização de análises e predições.

    Essa etapa é de grande importância, pois será determinante para a qualidade final dos dados que serão analisados. Ela pode, inclusive, impactar no modelo de previsão, gerado a partir dos dados.

    Gabarito: Correto.

  • Certo.

    O processo de KDD envolve os seguintes passos:

    1. entendimento do domínio da aplicação e identificação do objetivo do processo de KDD;

    2. seleção: criação de um conjunto-alvo de dados;

    3. pré-processamento: limpeza de dados e operações básicas como remoção de ruído, tratamento para a falta de dados etc.;

    4. transformação: encontrar características úteis para representar os dados, conforme o objetivo definido e realizar a redução ou transformação da dimensionalidade;

    5. mineração de dados: casar os objetivos do processo de KDD com um método particular de mineração de dados e realizar a análise exploratória e seleção de modelo e hipótese, buscando padrões de interesse;

    6. interpretação: interpretar e avaliar os padrões minerados, podendo retornar a passos anteriores

    caso seja necessário;

    7. agir a partir do conhecimento descoberto.

  • O processo de Mineração de Dados pode ser dividido em algumas etapas, entre elas está a mencionada na questão - pré-processamento - que envolve tarefas de limpeza dos dados, tais como aplicação de filtros, seleção e construção de atributos, preenchimento de valores faltantes, tratamento de ruídos, entre outras. O objetivo dessa fase é tornar os dados estatisticamente de melhor qualidade para extração de padrões.

  • Complementando os excelentes comentários: fiquem atentos, a diminuição dos dados não é o único objetivo.

    CESPE 2020 - O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.

    É necessário lidar com o “lixo” nos dados, interpretando com cuidado para não eliminarmos falsos positivos.

  • Perdão mas acho a questão mal-formulada, o objetivo não é necessariamente a diminuição da quantidade de dados, e sim a filtragem dos dados pela sua qualidade.

    Caso todos os dados sejam de qualidade e sem problemas, o dataset pode ficar igual.

    Achei um pouco mal-formulada.

  • Assertiva C

    O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.

  • PARABÉNS A QUEM ERROU, afinal, se não existem ruídos ou informações não relevantes e , por outro lado, existem campos faltantes, é no pré processamento que pode ocorrer a complementação, geralmente com valores médios. Ou seja, pode ocorrer, inclusive, o aumento de dados.

  • CERTO

    Vamos lá, o volume de dados usado na mineração costuma ser alto, com isso, os dados originais podem ser convertidos em dados menores, sem perder a representatividade dos dados originais. (na etapa de pré-processamento)

    Isso permite que os dados sejam executados com mais eficiência, possuindo mais qualidade no resultado.

  • correto, entre as características da preparação de dados (pré-processamento ), cujo objetivo é definir metas e incluir conhecimento relevante , para isso é preciso uma limpeza de dados (diminuir variáveis, retirar dados que possam provocar distorções e ruídos)

  • PRÉ-PROCESSAMENTO:

    • REMOÇÃO ERROS
    • COLETAR INFORMAÇÃO
    • DECIDIR ESTRATÉGIAS
  • GAB: C

    PEGA A VISÃO MENOR

    PRE-PROCESSAMENTO:

    • CONSOME MAIOR PARTE DO TEMPO
    • OBJETIVA AUMENTAR A QUALIDADE DOS DADOS POR MEIO DA APLICACAO DE FILTROS E ELIMINACAO DE PALAVRAS E REPETICOES
  • Mineração de Dados é parte de um

    processo maior de pesquisa chamado de

    Busca de Conhecimento em Banco de

    Dados (KDD).

    1º Seleção de dados;

    2º Limpeza de dados;

    3º Enriquecimento;

    5º Mineração de dados;

    6º Relatório e exibição da informação

    descoberta.

  • PRÉ-PROCESSAMENTO é a etapa de preparação dos dados, incluindo limpeza e tratamento. É necessário lidar com o “lixo” nos dados, interpretando com cuidado para não eliminarmos falsos positivos. Também é preciso saber o que fazer com valores ausentes;

    Direção Concursos

  • Gabarito deveria ser errado.

    "O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras."

    Questão que seria correta:

    É objetivo da etapa de pré-processamento diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.

    Uma mudança sutil que faz toda a diferença!

    Examinadores não, asnos!

  • "A etapa de pré-processamento diz respeito a um conjunto de atividades preparatórias que, em função da abordagem funcional que será adotada pela análise de informações não estruturadas, utiliza algoritmos de naturezas diferentes, mas com objetivos maiores em comum: DIMINUIR A QUANTIDADE DE DADOS a ser processado, DIMINUIR A ambigüidade das expressões lingüísticas e estruturar as informações como tuplas. 

    O esforço em diminuir a quantidade de informações a ser processada surge do fato dos algoritmos que se destina a tratar documentos textuais se basearem no processamento palavra a palavra

    Assim, Diminuir a quantidade de elementos significa então diminuir diretamente o tempo de execução das estruturas de controle desses algoritmos. Nessa categoria, encontram-se os eliminadores de palavras (Stopwords) e filtros em geral. "

  • Eu acho que o examinador forçou um pouco a barra ao dizer que a diminuição da quantidade de dados é o objetivo da etapa de pré-processamento. O pré-processamento se destina a eliminar erros, inconsistências e incompletudes dos dados originais, brutos. Isso geralmente acaba sim reduzindo o tamanho do conjunto de dados, então o item foi considerado correto, embora eu discorde do gabarito.

  • Mineração de Dados faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs) que possui 5 FASES: 

    Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação 

    Como diz a questão, nessa fase ocorre a diminuição da quantidade de dados que serão analisados!

  • vou tentar exemplificar aqui no QC, quando você vai buscar questões nos filtros e seleciona direito administrativo e aplica o filtro, aparecem 50 mil questões. agora se você adiciona a banca cespe ao filtro o que acontece? 8 mil questões. Então a medida que você coloca os filtros isso vai diminuindo e diminuindo a quantidade de questões.

  • R: CERTO

    2. Pré-Processamento – Operações básicas de limpeza e pré-processamento dos dados, remoção de ruídos (outliers), eliminação de registros duplicados, consideração de sequências temporais, etc.

    Fonte: GRAN CURSOS

  • Mineração de Dados faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs) que possui 5 FASES: 

    Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação 

  • CEEEESSPEEE...O Objetivo é mesmo Diminuir ou seria Filtrar???

  • CESPOU!

  • 1) SELEÇÃO: é um processo de seleção de dados relevantes. Ex: carros populares

    2) PRÉ-PROCESSAMENTO: operações de limpeza, remoção de ruídos (outliers), eliminação de registros duplicados.

    Ex: carro popular valorado em R$200.000

    3) TRANSFORMAÇÃO: etapa que consiste na redução de informações sem perda de precisão. Ex: carro valorado em R$200.001 retira-se o 1 centavo para facilitar no processo.

    4) MINERAÇÃO DE DADOS: aqui aplicam-se todas as técnicas de data mining

    5) INTERPRETAÇÃO E AVALIAÇÃO: relação intrínseca com a inteligência (aplicação da sabedoria)

  • Se vc errou acreditando que a redução da quantidade de dados é a consequência e não o objetivo, vc está no caminho certo.

  • CERTO

    A etapa de pré-processamento diz respeito a um conjunto de atividades preparatórias que utiliza algoritmos de naturezas diferentes, mas com objetivos maiores em comum: diminuir a quantidade de dados a ser processado, diminuir a ambiguidade das expressões linguísticas e estruturar as informações como tuplas. Eu diria que reduzir a quantidade de dados a serem analisados é um objetivo secundário, mas – de acordo com alguns autores – ainda é um dos objetivos da etapa de pré-processamento.

    Fonte: material estratégia.

  • Essa questão caberia recurso sim. Até pq chegaram ao cúmulo de repetir a mesma pergunta, NA MESMA PROVA, e colocar o conceito diferente (dessa vez o correto). Vejam abaixo:

    Q1621341

    Ano: 2020 Banca: CESPE / CEBRASPE Órgão: Ministério da Economia Prova: CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da Informação - Ciência de Dados

    O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.

    Resposta: Certo

  • quando fala "o objetivo" limita demais.