SóProvas


ID
2382709
Banca
ESPP
Órgão
MPE-PR
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Data Mining refere-se à busca de informações relevantes, ou “à descoberta de conhecimento”, a partir de um grande volume de dados. Assim como a descoberta de conhecimento no ramo da inteligência artificial, a extração de dados tenta descobrir automaticamente modelos estatísticos a partir dos dados. O conhecimento obtido a partir de um banco de dados pode ser representado em regras. Duas importantes classes de problemas de extração de dados são as:

Alternativas
Comentários
  • Classificação (supervisionado) - Procura identificar a existência de HIERARQUIA em um conjunto pré-existente de eventos ou transações, você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva).

    Regras de associação - Relaciona a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.

    Ex: quando uma mulher compra uma bolsa em uma loja, ela está propensa a comprar sapatos na mesma loja.

  • GAB: E

    COMO DECORAR CRISP-DM

    IMAGINA UM VENDEDOR DE RUA NO BRÁS. DAÍ UMA PESSOA AVISA PRA ESSE VENDEDOR QUE O RAPA (POLICIA) ESTÁ CHEGANDO PRA APREENDER O PRUDUTO DELE.

    A PESSOA AVISA:

    Ei Ei PM AÍ!

    • ENTENDIMENTO DE NEGOCIO
    • ENTENDIMENTO DE DADOS
    • PREPARACAO
    • MODELAGEM
    • AVALICAO
    • IMPLANTACAO

  • Fases do processo de Data Mining

    Preparação: Constrói um banco de dados separado, coleta o dado que será garimpado, defini os metadados, atenta para a qualidade dos dados, carrega o banco de dados para o processo de mining.

    Mineração: Cria os modelos de data mining, Defini amostras ou população, Seleciona dados para treinar o modelo, Defini a formatação requerida pelas ferramentas.

    Análise: técnicas para o processo de garimpagem de dados: associação, classificação e agregação.

    Aplicação: depois de definido e testado o modelo, a aplicação se dá pela utilização daqueles algoritmos ajustados em situações reais de sistemas.

    Alternativa: E