SóProvas


ID
119230
Banca
FCC
Órgão
TRF - 4ª REGIÃO
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Sobre data mining, é correto afirmar:

Alternativas
Comentários
  • Alternativa (a) Segundo Wikipédia, "é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados". Usando padrões e técnicas de reconhecimento, como alg géneticos, cluster e outros.
  • A) CertoB) Data mining requer interação com analistas humanos, pois deve-se entender os dados os quais puros não dizem muito acerca do domínio de aplicação.C) Os dados devem ser tratados de forma igual, não se pode desconsiderar dados genéricos e privilegiar dados específicos que podem se tratar de bias, outliers, missing values, etc.D) Data mining é um processo e não um banco de dados.E) Data mining pode ser utilizado a partir de qualquer tipo de repositório.
  • A letra "a" é uma pegadinha boa pois geralmente a primeira vista costumamos associar o Datamining com Datawarehouse e esta questão fala sobe "análise de grandes quantidades de dados armazenados em bancos de dados" o que leva a pensar que estaria errado pois poderia deveria ser "análise de grandes quantidades de dados armazenados em Datawarehouses". Mas como o Datamining é uma técnica independente do repositório como o colega colocou, então está correta esta colocação.
  • desconsiderar aquilo que é generico e considerar aquilo que é especifico(setorial) = DATA MART
  • É importante notar que as palavras padrões, tendências ou dados brutos sempre estão relacionadas com MD.

  • Data mining é o prcesso de analisar, processar e transformar dados para analisá-los e descobrir padroes e tendencias. geralmente se valoriza o que é generico e se desconsidera o que for ocasional.

  • Na Economia, mais precisamente na Econometria, o processo de Data Mining deve sempre ser visto com certa ressalva. Se um modelo econométrico, que segundo a teoria econômica é descrito por Yi = B0 + B1X1i + B2X2i + ui, tiver acrescido a variável X3 por método de Data Mining simplesmente porque R² ou teste F apresentam melhoras, pode não ser razão suficiente. O Data Mining pode trazer relações espúrias em seus resultados.

  • a) Perfeito! Já achamos nossa resposta. A mineração de dados visa encontrar padrões e relacionamentos previamente ocultos através da análise dos dados armazenados. Isso é realizado através de técnicas da informática (inclusive aprendizado de máquina com reconhecimento de padrões), da estatística e da matemática. CERTA

    b) Essa é uma das falácias da mineração de dados. Ela requer supervisão humana em suas etapas, inclusive ao final, para a avaliação dos resultados e a melhoria do processo. ERRADA

    c) Para encontrar padrões a ideia é ser capaz de criar regras genéricas a partir de ocorrências específicas. Assim, a generalização é justamente o objetivo, não sendo de forma alguma descartada. ERRADA

    d) Data mining não é um banco de dados, mas um processo que envolve várias técnicas distintas. A descrição na assertiva é a de um data warehouse. ERRADA

    e) O DW é uma fonte muito boa para a mineração de dados, mas não é a única. Essa é um erro que costuma aparecer bastante em provas! ERRADA

    Gabarito: A 

  • (b) Errado. Eles funcionam de forma semiautomática, necessitando de interferência humana;

    (c) Errado. Informações precisam ser pré-processadas e, não, simplificadas – nada de desconsiderar informações genéricas;

    (d) Errado. Data Mining não é um banco de dados;

    (e) Errado. Essa é uma falácia comum! Não é obrigatório utilizar um Data Warehouse, apesar de ser o mais comum. 

    Fonte: estratégia pdf

  • Tá, eu acertei, mas às vezes acho que as bancas em geral cobram muitos conceitos "ctrl+c, ctrl+v", retirados de contextos específicos. No item a, que é o correto, o trecho "entre as informações de uma empresa" evidencia isso. Ora, data mining obviamente pode ser implementado em qualquer entidade, então seu conceito não se limita ao ambiente empresarial. Não necessariamente se deve tratar de uma empresa. Questão de péssima qualidade.

  • GAB: A

    Sobre o assunto:

     Data Mining é o processo de explorar grande quantidade de dados para extração não-trivial de informação implícita desconhecida.

     Data Mining é uso de teorias, métodos, processos e tecnologias para organizar uma grande quantidade de dados brutos para identificar padrões de comportamentos em determinados públicos.

     Data Mining é a categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados.

     Data Mining é o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de padrões, estatísticas e matemáticas.

     Data Mining constitui em uma técnica para a exploração e análise de dados, visando descobrir padrões e regras, a princípio ocultos, importantes à aplicação.

     Data Mining é o conjunto de ferramentas que permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa (fuzzy), dentre outras.

     Data Mining é o conjunto de ferramentas e técnicas de mineração de dados que têm por objetivo buscar a classificação e o agrupamento (clusterização) de dados, bem como identificar padrões.

     Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre variáveis e novos subconjuntos de dados.

     Data Mining consiste em explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar padrões, como regras de associação ou sequências temporais, para detectar relacionamentos entre estes.

     Data Mining é o conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização.

     Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

     Data Mining é o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis. (PF).

     Data Mining é um método computacional que permite extrair informações a partir de grande quantidade de dados.

    Fonte: comentários colegas do qc.