SóProvas


ID
638173
Banca
FUMARC
Órgão
PRODEMGE
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Analise as afrmativas abaixo em relação às técnicas de mineração de dados.
I. Regras de associação podem ser usadas, por exem- plo, para determinar, quando um cliente compra um produto X, ele provavelmente também irá comprar um produto Y.

II. Classifcação é uma técnica de aprendizado supervisionado, no qual se usa um conjunto de dados de treinamento para aprender um modelo e classifcar novos dados.

III. Agrupamento é uma técnica de aprendizado supervisionado que particiona um conjunto de dados em grupos.
Assinale a alternativa VERDADEIRA:

Alternativas
Comentários
  • Classificação é a estratégia que consiste na busca por uma função que consiga mapear (classificar) uma determinada ocorrência em uma dentre um conjunto finito e pré-definido de classes. A construção do modelo segundo esta estratégia, pressupõe o conhecimento prévio das possíveis classes e a correta classificação dos exemplos usados na modelagem. Várias são as aplicações para este tipo de abordagem, em análise de risco por exemplo, o objetivo pode ser o de classificar um potencial cliente entre as classes de excelente, bom ou mau pagador.

    Agregação (ou clustering ou agrupamento) consiste na busca de similaridades entre os dados tal que permita definir um conjunto finito de classes ou categorias que os contenha e os descreva. A principal diferença entre esta abordagem e classificação é que em agregação não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem. Descobrir grupos homogêneos de clientes é uma das possíveis aplicações e pode ser usada para ajudar na definição da estratégia de marketing a ser adotada.

    Associação por outro lado, consiste em identificar fatos que possam ser direta ou indiretamente associados. Esta estratégia é geralmente usada em aplicações onde se busca identificar itens que possam ser colocados juntos em um mesmo pacote de negociação. Por exemplo, a constatação de que vendas de cerveja e de fraldas descartáveis apresentam um comportamento ascendente às sextas-feiras pode levar à construção de uma hipótese que associe ambos os itens a um tipo especial de cliente. Associação também pode ser usada para avaliar a existência de algum tipo de relação temporal entre os itens constantes de uma base de dados.

    Regressão consiste na busca por uma função que represente, de forma aproximada, o comportamento apresentado pelo fenômeno em estudo. A forma mais conhecida de regressão é a linear, por exemplo, uma reta que minimiza o erro médio entre todos os valores considerados, mas também pode ser não linear.

    Predição envolve uma componente temporal, isto é, representa aquela classe de problemas nos quais estamos interessados em prever o comportamento ou valor futuro de uma determinada variável com base em valores anteriores desta mesma variável (mono-variável) ou em valores anteriores da variável de interesse e de outras variáveis (multi-variável).
  • Apenas acrescentando:
    Pelo texto do colega acima, quando é dito que na agregação "não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem", isto caracteriza uma técnica de aprendizado NÃO-SUPERVISIONADO, o que está em desacordo com a afirmativa III, tornando-a falsa.
  •  (III) Errado. Agrupamento é uma técnica de aprendizado não-supervisionado.  

    Mais conhecido como CLUSTERS.

  • supervisionado = classificação

    não supervisionado = clustering (agrupamento)