SóProvas


ID
1460224
Banca
FCC
Órgão
CNMP
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Em relação às ferramentas de Data Discovery e os fundamentos de Data Mining, é correto afirmar:

Alternativas
Comentários
  • b) Data Mining é o processo de descobrir conhecimento em banco de dados, que envolve várias etapas. O KDD – Knowledge Discovery in Database é uma destas etapas, portanto, a mineração de dados é um conceito que abrange o KDD.

    Corrigindo...


    b) KDD é o processo de descobrir conhecimento em banco de dados, que envolve várias etapas. O Data Mining é uma destas etapas, portanto, o KDD é um conceito que abrange o Data Mining.

    Alguém comenta as outras?
    []'s
  • Gabarito A. Deixando as outras assertivas corretas:

    b) KDD é o processo de descobrir conhecimento em banco de dados, que envolve várias etapas. O Data Mining é uma destas etapas, portanto, o KDD é um conceito que abrange o Data Mining.

    c) A etapa de Data Miningz do KDD consiste em aplicar técnicas que auxiliem na busca de relações entre os dados. De forma geral, existem três tipos de técnicas: Estatísticas, Exploratórias e Intuitivas. Todas são devidamente experimentadas e validadas para o processo de mineração.

    d) Os dados podem ser não estruturados (bancos de dados, CRM, ERP), estruturados (texto, documentos, arquivos, mídias sociais, cloud) ou uma mistura de ambos (emails, SOA/web services, RSS). As ferramentas de Data Mining mais completas possuem conectividade para todas essas origens de dados de forma segura e controlada.

    e) Estima-se que, atualmente, em média, 80% de todos os dados disponíveis são do tipo não-estruturado. Existem diversas ferramentas open source e comerciais de Data Discovery. Dentre as open source está a InfoSphere Data Explorer e entre as comerciais está a Vivisimo da IBM.

    Vamos em frente!

  • Apenas uma observação ao excelente comentário do colega Sérgio Raulino, a questão trocou os conceitos de dados estruturados, não estruturados e semiestruturados:

    d) Os dados podem ser estruturados (bancos de dados, CRM, ERP),não estruturados (texto, documentos, arquivos, mídias sociais, cloud) ou uma mistura de ambos (emails, SOA/web services, RSS). As ferramentas de Data Mining mais completas possuem conectividade para todas essas origens de dados de forma segura e controlada.

  • Não conhecia essa tal de Lógica Nebulosa... acabei descobrindo que é a lógica fuzzy

    lógica difusa ou lógica fuzzy é uma extensão da lógica booleana que admite valores lógicos intermediários entre o FALSO (0) e o VERDADEIRO (1); por exemplo o valor médio 'TALVEZ' (0,5). Isto significa que um valor lógico difuso é um valor qualquer no intervalo de valores entre 0 e 1. Este tipo de lógica engloba de certa forma conceitosestatísticos principalmente na área de Inferência.
    (Fonte: A preferida da FCC: Wikipédia)
  • kdd é gênero. datamining é espécie.

  • Complementando o comentário do colega Sérgio Raulino:

    d) Os dados podem ser estruturados (bancos de dados, CRM, ERP), não-estruturados (texto, documentos, arquivos, mídias sociais, cloud) ou uma mistura de ambos (emails, SOA/web services, RSS). As ferramentas de Data Mining mais completas possuem conectividade para todas essas origens de dados de forma segura e controlada.

  • A lógica difusa ou lógica fuzzy é uma extensão da lógica booleana que admite valores lógicos intermediários entre o FALSO (0) e o VERDADEIRO (1); por exemplo o valor médio 'TALVEZ' (0,5). Isto significa que um valor lógico difuso é um valor qualquer no intervalo de valores entre 0 e 1. Este tipo de lógica engloba de certa forma conceitos estatísticos principalmente na área de Inferência.

    (Fonte: Wikipédia)

  • a) É isso mesmo! A mineração de dados visa descobrir padrões e relacionamentos ocultos nos conjuntos de dados, sendo um processo multidisciplinar que envolve as áreas de estatística, matemática e computação. Dentro da computação, podem ser empregadas algumas técnicas avançadas, como as citadas. CERTA

    b) O KDD, na verdade, é todo um processo de descoberta de conhecimento nos bancos de dados. Dessa maneira, a mineração de dados é uma das etapas desse processo, e não o contrário. ERRADA

    c) Já vimos na questão anterior que a mineração de dados é um conceito menor que o KDD. O KDD abrange a mineração de dados, e não o contrário. Além disso, costumamos dividir as tarefas da mineração em descritivas e preditivas, e nem sempre utilizamos todas elas no mesmo processo. A escolha da abordagem de mineração é uma etapa importante desse processo. ERRADA

    d) O erro da questão foi inverter os exemplos de dados estruturados com os de não estruturados. Bancos de dados, CRM, ERP são exemplos de dados estrturados, enquanto que texto, documentos, arquivos, postagens em mídias sociais e arquivos na nuvem de modo geral costumam ser dados como exemplos de dados não estruturados. ERRADA

    e) Tanto nas organizações quanto na internet, a maioria esmagadora dos dados é do tipo não estruturado. Isso impõe vários desafios para a obtenção de informações úteis para a tomada de decisão, problema que várias ferramentas e técnicas tentam atacar. Veja que não precisamos conhecer as aplicações mencionadas para responder a alternativa. ERRADA

    Gabarito: A

  • Gabarito: A.

    Sobre "lógica nebulosa": Ela é multivalorada. Trabalha com um conjunto possíveis de respostas, sendo considerada, por alguns autores, como extensão da lógica booleana (verdadeiro ou falso).

    Bons estudos!