SóProvas


ID
4864030
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de conceitos, premissas e aplicações de big data, julgue o item subsequente.


O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.

Alternativas
Comentários
  • Gab.: Certo

    #Pré-Processamento de Dados:

    Os dados brutos são aqueles que ainda não foram processados para o uso e podem conter problemas de incompletude, inconsistência e ruído, os quais futuramente atrapalharão no processo de análise e mineração desses dados.

    As principais tarefas de pré-processamento são:

    - Limpeza

    - Seleção

    - Integração

    - Redução

    - Transformação

    - Discretização

  • CERTO

    O pré-processamento é um conjunto de atividades que envolvem preparação, organização e estruturação dos dados. Trata-se de uma etapa fundamental que precede a realização de análises e predições.

  • O pré-processamento de dados é um conjunto de técnicas de mineração de dados usadas para transformar dados brutos em formatos úteis e eficientes.

    GABARITO: CORRETO.

  • Correto! Técnicas de pré-processamento de dados visam corrigir inconsistências e ruídos, solucionar incompletudes de dados ou mesmo reduzir o volume de dados a ser analisado ou minerado, ao se utilizar técnicas como a agregação de dados. Esse processo pode envolver diferentes tarefas, a depender das características do processo de mineração e do próprio conjunto de dados.

  • GABARITO CORRETO

    Eu não sei se entendi bem a questão, mas qualquer erro me informem pf.

    >> Com o processo de Data Mining (Mineração de Dados) esse está incluído em um processo maior que é A DESCOBERTA DE CONHECIMENTO.

    Essa descoberta de conhecimento é realizada através de dados que passam por um processo específico, que abrange: (1) Seleção; (2) Pré-processamento; (3) Transformação; (4) Data Mining; (5) Interpretação e Avaliação

    (2) Na segunda etapa de Pré-processamento será a limpeza e o pré-processamento dos dados. Operações básicas incluem a remoção de eventuais erros, coleta de informações, decidir estratégias para lidar com campos de dados ausentes, entre outros.

  • pré-processamento

    → remoção de erros, dados ausentes

    → integração: defined as heterogeneous data from multiple sources combined

  • Descoberta de conhecimento (KDD)

    1- Seleção -> Seleciona os dados/as variáveis que eu quero analisar

    2- Pre-processamento -> Como os dados que eu selecionei são brutos, é preciso fazer uma limpeza, eliminar erros, inconsistências, etc.

    3- Transformação -> Aqui vou transformar os dados para poder fazer a mineração.

    4- Mineração de dados-> Uso técnicas e algoritmos para descobrir padrões úteis de dados

    5- Interpretação e avaliação -> Interpreto o que a mineração me trouxe, dos vários padrões, seleciono os que são úteis para mim.

  • correto, entre as características da preparação de dados (pré-processamento ), cujo objetivo é definir metas e incluir conhecimento relevante , para isso é preciso uma limpeza de dados (diminuir variáveis, retirar dados que possam provocar distorções e ruídos)

  • GABARITO: CORRETO.

    Sim o Pré-Processamento a grosso modo melhora a qualidade dos Dados

    PRF 1.499 Vagas disponíveis pra vocês, uma já é minha.

    Vamos a luta estamos vivos !!

    PRF Brasil...

  • BIG DATA

    Grande banco de dados.

    Engloba todos os tipos de dados.

    Dados estruturados ou não estruturados.

    Para melhor proveito, usa-se Data Mining e Data Warehouse.

    Os dados possuem "5V's":

    Volume -> Grande quantidade.

    Variedade -> São variados.

    Velocidade -> São criados de uma forma extremamente rápida.

    Valor -> Devem possuir valor, ou seja, deve agregar conhecimento.

    Veracidade -> Devem ser verídicos, verdadeiros.

    __________

    Faz o simples que dá certo!

  • Crisp-DM é o processo utilizado para realizar projetos de mineração de dados e se baseia nas seguintes fases:

    1- Entendimento do negócio

    2- Entendimento dos dados

    3- Preparação dos dados ou Pré-processamento

    4- Modelagem

    5- Avaliação

    6- Implantação

    No caso em questão a questão está falando do Pré-processamento nesta fase ocorre a preparação dos dados para a fase de modelagem. De forma bem simples de falar, essa fase pega os dados brutos, ou seja, dados sem nenhuma organização às vezes faltando ou com erros, organiza-os e melhora a qualidade para a próxima fase.... (obs: Questão muito aprofundada talvez não caia questões desse tipo na PF)

  • Pensei que fosse questão de Contabilidade .

  • O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.

    CERTO

    • Dados brutos coletados precisam ser previamente "filtrados" antes de uma análise mais específica;
    • O "filtro" refina os dados brutos para que possam estar viáveis para a análise;
    • Incompletudes indicam ausências de dados, inconsistências as divergências e ruídos a inadequação;
    • O pré-processamento transforma dados possíveis em dados viáveis, após refinar.

    "A disciplina é a maior tutora que o sonhador pode ter, pois ela transforma o sonho em realidade."

  • Pré-Processamento é a segunda fase de data mining que ocorre à analise de outliers e a limpeza de dados.

  • O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.

    O processo de Data Mining (Mineração de Dados) está incluído em um processo maior que é A DESCOBERTA DE CONHECIMENTO o qual é realizada através de dados que passam por um processo específico, que abrange as seguintes etapas:

    1-    Seleção:

    Seleciona os dados e as variáveis que se quer analisar

    2-    Pré-processamento:

    Etapa em que é feito uma limpeza para eliminar erros, inconsistências, etc, dos dados brutos.

    3-    Transformação:

    Transformar os dados para poder fazer a mineração.

    4-    Mineração de dados:

    É aplicada técnicas e algoritmos para descobrir padrões úteis de dados

    5-    Interpretação e avaliação:

    Para seleciono os que são úteis

  • GABARITO - CERTO

    Pré-Processamento --> Limpeza de Dados

  • Eu errei ,,, mas pronta para o ataque...cespe

  • "Pré-processamento = lapidar o diamante", rsrs

    Ouvi isso de algum professor e não esqueci,

    O pré-processamento transforma dados possíveis em dados viáveis, após refinar.

  • As técnicas de pré-processamento buscam melhorar a qualidade dos dados e, consequentemente, da eficiência e resultados da mineração.

    Gabarito certo. ✅

  • CERTO

    Trata-se da 2 fase do KDD

    • Pré-Processamento (limpeza): processo de limpar, corrigir ou remover dados inconsistentes, além de identificar anomalias - outliers.

    obs: se a Mineração de dados for feita em um Data Warehouse (sistema de gerenciamento de dados) a etapa de Pré-Processamento já foi feita pelo D.W

  • MINERAÇÃO DE DADOS:

    faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs)

    processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis

    Possui 7 FASES

    Entendimento do domínio da aplicação e identificação do objetivo do processo de KDD;

    Seleção: criação de um conjunto-alvo de dados;

    Pré-processamento: limpeza de dados e operações básicas como remoção de ruído, tratamento para a falta de dados etc.;

    Transformação: encontrar características úteis para representar os dados, conforme o objetivo definido e realizar a redução ou transformação da dimensionalidade;

    Mineração de dados (data mining): casar os objetivos do processo de KDD com um método particular de mineração de dados e realizar a análise exploratória e seleção de modelo e hipótese, buscando padrões de interesse;

    Interpretação: interpretar e avaliar os padrões minerados, podendo retornar a passos anteriores caso seja necessário;

    Agir a partir do conhecimento descoberto.

  • AGORA VAI UMA DICA!!!

    Para quem vai fazer PF e PCDF o professor Rani Passos do ESTRATEGIA CONCURSOS fez uma mentoria de RETA FINAL voltada nas matérias de Programação Python e R, Banco de Dados, Teoria Geral de Sistemas, Teoria da Informação, Sistemas de Informação, Big Data, Mineração de Dados, entre outros assuntos relacionados a TI (Tecnologia da Informação). Equivalente a 33% das questões no último concurso da PF. Estou fazendo e está me ajudando muito nessa reta final, certamente é decisivo dar um foco nesses assuntos na reta final. Fica a sugestão.

    Receba 30% de desconto usando o cupom PF30

    Link do site: https://go.hotmart.com/Y51566726H

    FORÇA E HONRA, PERTENCEREMOS!!!

  •  

    O processo de mineração de dados é dividido em 5 etapas:

    - Seleção;

    - Pré-processamento;

    - Transformação;

    - Data Mining;

    - Interpretação e avaliação.

     

    Seleção

    - Selecionar ou segmentar dados de acordo com critérios definidos.

    - Ex: Todas as pessoas que são proprietárias de carros é um subconjunto de dados determinados.

     

    Pré-processamento

    - remoção de eventuais erros, coleta de informações, decidir estratégias para lidar com campos de dados ausentes, remover informações desnecessárias etc..

    - Ex: O sexo de um paciente gestante.

    - Reconfiguração dos dados para assegurar formatos consistentes(identificação).

     

    Transformação

    - Transforma-se os dados em formatos utilizáveis. Esta depende da técnica Data Mining usada.

    - Ex: rede neural -> converter valor literal em valor numérico.

    - Disponibilizar os dados de maneira usável e navegável.

     

    Data Mining

    - É a verdadeira extração dos padrões de comportamento dos dados.

    - Utilizam-se algoritmos e técnicas para extrair possíveis padrões úteis de dados

       

     Interpretação e Avaliação

    - Identificado os padrões pelo sistema, estes são interpretados em conhecimentos, os quais darão suporte a tomada de decisões humanas.

    - Ex: Tarefas de previsões e classificações.

  • -Esse Processo de DESCOBERTA DE CONHECIMENTO(KDD) possui 5 fases: 

    (1) Seleção: Selecionar um conjunto de dados – ou se concentrar em um subconjunto de variáveis ou amostras de dados – no qual a descoberta será realizada.

    (2) Pré-processamentoLimpeza e o pré-processamento dos dados. Operações básicas incluem a remoção de eventuais erros, coleta de informações, decidir estratégias para lidar com campos de dados ausentes, entre outros. 

    (3) Transformação: Os dados são transformados e consolidados em formas apropriadas à mineração, sumarizando-os ou agregando-os

    (4) Data Mining: Utilizam-se algoritmos e técnicas para extrair possíveis padrões úteis de dados.

    (5) Interpretação e Avaliação: teremos a descoberta de diversos padrões que serão interpretados e avaliados em busca de padrões realmente interessantes e úteis, além de suas possíveis explicações ou interpretações.

  • Minimiza-se os erros e informações faltantes com a realização de pré-processamento, mas garantir ausência de inconsistências e ruído é utópico.