-
Mineração de Dados faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs) que possui 5 FASES:
Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação
Como diz a questão, nessa fase ocorre a diminuição da quantidade de dados que serão analisados!
-
O pré-processamento é um conjunto de atividades que envolvem preparação, organização e estruturação dos dados. Trata-se de uma etapa fundamental que precede a realização de análises e predições.
Essa etapa é de grande importância, pois será determinante para a qualidade final dos dados que serão analisados. Ela pode, inclusive, impactar no modelo de previsão, gerado a partir dos dados.
Gabarito: Correto.
-
Certo.
O processo de KDD envolve os seguintes passos:
1. entendimento do domínio da aplicação e identificação do objetivo do processo de KDD;
2. seleção: criação de um conjunto-alvo de dados;
3. pré-processamento: limpeza de dados e operações básicas como remoção de ruído, tratamento para a falta de dados etc.;
4. transformação: encontrar características úteis para representar os dados, conforme o objetivo definido e realizar a redução ou transformação da dimensionalidade;
5. mineração de dados: casar os objetivos do processo de KDD com um método particular de mineração de dados e realizar a análise exploratória e seleção de modelo e hipótese, buscando padrões de interesse;
6. interpretação: interpretar e avaliar os padrões minerados, podendo retornar a passos anteriores
caso seja necessário;
7. agir a partir do conhecimento descoberto.
-
O processo de Mineração de Dados pode ser dividido em algumas etapas, entre elas está a mencionada na questão - pré-processamento - que envolve tarefas de limpeza dos dados, tais como aplicação de filtros, seleção e construção de atributos, preenchimento de valores faltantes, tratamento de ruídos, entre outras. O objetivo dessa fase é tornar os dados estatisticamente de melhor qualidade para extração de padrões.
-
Complementando os excelentes comentários: fiquem atentos, a diminuição dos dados não é o único objetivo.
CESPE 2020 - O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.
É necessário lidar com o “lixo” nos dados, interpretando com cuidado para não eliminarmos falsos positivos.
-
Perdão mas acho a questão mal-formulada, o objetivo não é necessariamente a diminuição da quantidade de dados, e sim a filtragem dos dados pela sua qualidade.
Caso todos os dados sejam de qualidade e sem problemas, o dataset pode ficar igual.
Achei um pouco mal-formulada.
-
Assertiva C
O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.
-
PARABÉNS A QUEM ERROU, afinal, se não existem ruídos ou informações não relevantes e , por outro lado, existem campos faltantes, é no pré processamento que pode ocorrer a complementação, geralmente com valores médios. Ou seja, pode ocorrer, inclusive, o aumento de dados.
-
CERTO
Vamos lá, o volume de dados usado na mineração costuma ser alto, com isso, os dados originais podem ser convertidos em dados menores, sem perder a representatividade dos dados originais. (na etapa de pré-processamento)
Isso permite que os dados sejam executados com mais eficiência, possuindo mais qualidade no resultado.
-
correto, entre as características da preparação de dados (pré-processamento ), cujo objetivo é definir metas e incluir conhecimento relevante , para isso é preciso uma limpeza de dados (diminuir variáveis, retirar dados que possam provocar distorções e ruídos)
-
PRÉ-PROCESSAMENTO:
- REMOÇÃO ERROS
- COLETAR INFORMAÇÃO
- DECIDIR ESTRATÉGIAS
-
GAB: C
PEGA A VISÃO MENOR
PRE-PROCESSAMENTO:
- CONSOME MAIOR PARTE DO TEMPO
- OBJETIVA AUMENTAR A QUALIDADE DOS DADOS POR MEIO DA APLICACAO DE FILTROS E ELIMINACAO DE PALAVRAS E REPETICOES
-
Mineração de Dados é parte de um
processo maior de pesquisa chamado de
Busca de Conhecimento em Banco de
Dados (KDD).
1º Seleção de dados;
2º Limpeza de dados;
3º Enriquecimento;
5º Mineração de dados;
6º Relatório e exibição da informação
descoberta.
-
PRÉ-PROCESSAMENTO é a etapa de preparação dos dados, incluindo limpeza e tratamento. É necessário lidar com o “lixo” nos dados, interpretando com cuidado para não eliminarmos falsos positivos. Também é preciso saber o que fazer com valores ausentes;
Direção Concursos
-
Gabarito deveria ser errado.
"O objetivo da etapa de pré-processamento é diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras."
Questão que seria correta:
É objetivo da etapa de pré-processamento diminuir a quantidade de dados que serão analisados, por meio da aplicação de filtros e de eliminadores de palavras.
Uma mudança sutil que faz toda a diferença!
Examinadores não, asnos!
-
"A etapa de pré-processamento diz respeito a um conjunto de atividades preparatórias que, em função da abordagem funcional que será adotada pela análise de informações não estruturadas, utiliza algoritmos de naturezas diferentes, mas com objetivos maiores em comum: DIMINUIR A QUANTIDADE DE DADOS a ser processado, DIMINUIR A ambigüidade das expressões lingüísticas e estruturar as informações como tuplas.
O esforço em diminuir a quantidade de informações a ser processada surge do fato dos algoritmos que se destina a tratar documentos textuais se basearem no processamento palavra a palavra.
Assim, Diminuir a quantidade de elementos significa então diminuir diretamente o tempo de execução das estruturas de controle desses algoritmos. Nessa categoria, encontram-se os eliminadores de palavras (Stopwords) e filtros em geral. "
-
Eu acho que o examinador forçou um pouco a barra ao dizer que a diminuição da quantidade de dados é o objetivo da etapa de pré-processamento. O pré-processamento se destina a eliminar erros, inconsistências e incompletudes dos dados originais, brutos. Isso geralmente acaba sim reduzindo o tamanho do conjunto de dados, então o item foi considerado correto, embora eu discorde do gabarito.
-
Mineração de Dados faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs) que possui 5 FASES:
Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação
Como diz a questão, nessa fase ocorre a diminuição da quantidade de dados que serão analisados!
-
vou tentar exemplificar aqui no QC, quando você vai buscar questões nos filtros e seleciona direito administrativo e aplica o filtro, aparecem 50 mil questões. agora se você adiciona a banca cespe ao filtro o que acontece? 8 mil questões. Então a medida que você coloca os filtros isso vai diminuindo e diminuindo a quantidade de questões.
-
R: CERTO
2. Pré-Processamento – Operações básicas de limpeza e pré-processamento dos dados, remoção de ruídos (outliers), eliminação de registros duplicados, consideração de sequências temporais, etc.
Fonte: GRAN CURSOS
-
Mineração de Dados faz parte de um processo maior de descoberta de conhecimento - KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em BDs) que possui 5 FASES:
Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação
-
CEEEESSPEEE...O Objetivo é mesmo Diminuir ou seria Filtrar???
-
CESPOU!
-
1) SELEÇÃO: é um processo de seleção de dados relevantes. Ex: carros populares
2) PRÉ-PROCESSAMENTO: operações de limpeza, remoção de ruídos (outliers), eliminação de registros duplicados.
Ex: carro popular valorado em R$200.000
3) TRANSFORMAÇÃO: etapa que consiste na redução de informações sem perda de precisão. Ex: carro valorado em R$200.001 retira-se o 1 centavo para facilitar no processo.
4) MINERAÇÃO DE DADOS: aqui aplicam-se todas as técnicas de data mining
5) INTERPRETAÇÃO E AVALIAÇÃO: relação intrínseca com a inteligência (aplicação da sabedoria)
-
Se vc errou acreditando que a redução da quantidade de dados é a consequência e não o objetivo, vc está no caminho certo.
-
CERTO
A etapa de pré-processamento diz respeito a um conjunto de atividades preparatórias que utiliza algoritmos de naturezas diferentes, mas com objetivos maiores em comum: diminuir a quantidade de dados a ser processado, diminuir a ambiguidade das expressões linguísticas e estruturar as informações como tuplas. Eu diria que reduzir a quantidade de dados a serem analisados é um objetivo secundário, mas – de acordo com alguns autores – ainda é um dos objetivos da etapa de pré-processamento.
Fonte: material estratégia.
-
Essa questão caberia recurso sim. Até pq chegaram ao cúmulo de repetir a mesma pergunta, NA MESMA PROVA, e colocar o conceito diferente (dessa vez o correto). Vejam abaixo:
Q1621341
Ano: 2020 Banca: CESPE / CEBRASPE Órgão: Ministério da Economia Prova: CESPE / CEBRASPE - 2020 - Ministério da Economia - Tecnologia da Informação - Ciência de Dados
O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.
Resposta: Certo
-
quando fala "o objetivo" limita demais.