SóProvas


ID
137050
Banca
FGV
Órgão
Senado Federal
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Considerando as diferentes técnicas de mineração de dados, não é correto afirmar que:

Alternativas
Comentários
  • Essa definição da letra A, refere-se ao conceito de SUPORTE.

  • As regras de associação encontram-se entre um dosmais importantes tipos de conhecimento que podem ser minerados em bases de dados. Estas regras representam padrões de relacionamento entre itens de uma base de dados. Uma de suas típicas aplicações é a análise de transações de compras (market basket analysis)

  • Considero uma questão de tópicos avançados em Data Mining. Contudo, o conceito posto na letra "A" refere-se ao conceito de suporte e não confiança, como colocado. Vejam os dois conceitos abaixo:

    Várias métricas podem ser utilizadas para avaliar as regras (de associação) e identificar quais são interessantes. As restrições mais utilizadas são limiares mínimos de suporte e confiança.

    O suporte sup(X) de um conjunto X é definido como a proporção de transações da base de dados que contém esse conjunto. A confiança de uma regra é definida . Por exemplo, a regra  tem uma confiança de  na base de dados, o que significa que para 50% das transações que contém leite e pao a regra está correta. A confiança pode ser interpretada como uma estimativa de probabilidade , a probabilidade de encontrar o RHS da regra nas transações sobre a condição que essas transações também contenham LHS.2
    Os calculos acima referem-se a tabela de transações abaixo:
    Exemplo de base de dados com 4 itens e 5 transações. transação  leite  pão  manteiga  cerveja  1 1 1 0 0 2 0 1 1 0 3 0 0 0 1 4 1 1 1 0 5 0 1 0 0 fonte: http://pt.wikipedia.org/wiki/Regras_de_associação.
  • eu não encontrei erro na D, caso alguém saiba pode ajudar?

  • Suporte/prevalência = Frequência com que uma coisa ocorre -->

    Ex: 70% das compras de uma farmácia são de fraldas.

      

    Confiança = Probabilidade de relação entre entre itens -->

    Ex: Comprou uma televisão então existe uma probabilidade de comprar também um suporte de TV

     

    A questão diz:

    a) em Regras de Associação, confiança refere-se a quantas vezes uma regra de associação se verifica no conjunto de dados analisado.

     

    No caso, seria o SUPORTE, que diz a frequência com que uma coisa ocorre.

  • a) Este é o suporte! A confiança é a quantidade de vezes que a regra é verificada, dado que o evento antecedente ocorre. ERRADA

    b) Essas são técnicas citadas de análise multivariada, que é um tipo de análise estatística que pode ser empregada na mineração de dados, com o objetivo de se analisar o comportamento de mais de uma variável de resultado. O item é um pouco avançado, geralmente não há cobrança desse tipo em concursos que não são da área de TI! CERTA

    c) Na clusterização, podem ser usados vários métodos distintos para se medir a semelhança entre os itens, de modo a agrupá-los. Há muitos métodos avançados de se fazer isso, o que inclui esses tipos de medidas de correlação, distância ou associação. CERTA

    d) A classificação é um exemplo de um processo de aprendizado supervisionado, já que há um conjunto de dados de treinamento, a partir do qual o algoritmo é aplicado e a máquina consiga "aprender" a classificar a os demais registros nas classes predefinidas. No caso da clusterização (agrupamento), não há classes predefinidas nem conjunto de treinamento - o algoritmo irá determinar quais dados devem ser colocados em grupos iguais ou diferentes. CERTA

    e) Correto! Essa é a definição da regressão segundo Elmasri e Navathe. É como se fosse uma classificação, em que os rótulos de classe são os resultados possíveis para o evento a ser previsto. CERTA

  • O erro está na altenativa A. tenta confundir o candidato com os conceitos de suporte e confiança do algoritmo de regras de associação:

    refere-se ao conceito de suporte e não confiança, como colocado.

    O suporte que define quão frequente a regra acontece no banco de dados e a confiança que é a força da regra. 

    O Suporte é uma medida objetiva para avaliar o interesse de uma regra de associação. Representa a porcentagem de transações (%) de um banco de dados de transações onde a regra se verifica. 

    A Confiança é outra medida objetiva para regras de associação que mede o grau de certeza de uma associação. Em termos estatísticos, trata-se simplesmente da probabilidade condicional P (Y | X), isto é, a porcentagem de transações contendo os itens de X que também contêm os itens de Y.