-
Os métodos tradicionais de Data Mining são:Classificação: associa ou classi?ca um item a uma ou várias classes categóricas pré-de?nidas.Análise de Agrupamento (Cluster): associa um item a uma ou várias classes categóricas (ou clusters), em que as classes são determinadas pelos dados, DIVERSAMENTE DA CLASSIFICAÇÃO EM QUE AS CLASSES SÃO PRÉ-DEFINIDAS.Sumarização: determina uma descrição compacta para um dado subconjunto. As medidas de posição e variabilidade são exemplos simples de sumarização.Modelos de Relacionamento entre Variáveis: associa um item a uma ou mais variáveis de predição de valores reais, consideradas variáveis independentes ou exploratórias.Modelo de Dependência: descreve dependências signi?cativas entre variáveis. Modelos de dependência existem em dois níveis: estruturado e quantitativo.Regras de Associação: determinam relações entre campos de um banco de dados. A idéia é a derivação de correlações multivariadas que permitam subsidiar as tomadas de decisão.Análise de Séries Temporais: determina características seqüenciais, como dados com dependência no tempo. Seu objetivo é modelar estado do processo extraindo e registrando desvios e tendências no tempo.Referência: http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf
-
"a classificação é aplicada quando nenhum grupo foi ainda definido"
Na classificação os grupos já estão definidos, já no agrupamento esses grupos são descobertos.
Agrupamento é um tipo de classificação a qual descobre os grupos e é chamada também de classificação não-supervisionada (conjunto de treinamento não possui rótulos).
Na classificação, chamada também de classificação supervisionada, o conjunto de treinamento possui classes. Esse conjunto de treinamento é utilizado para gerar um modelo o qual avaliará novos dados, rotulando-os.
-
O conceito esta invertido.
Bons estudos!!!
-
Primeiro eu classifico p depois separar em grupos.
-
ERRADO. Conceitos invertidos!!!!
Na classificação você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva - supervisionada).
No agrupamento há apenas a separação de dados constantes no seu banco (descritivo - não supervisionada). O objetivo não é classificar novas informações!!!
-
No datamining, o agrupamento e a classificação funcionam de maneira similar: a classificação reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes; o agrupamento é aplicada quando nenhum grupo foi ainda definido
-
ERRADO
Agrupamento (CLAUSTERING): não supervisionado.
Os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.
àClassificação: supervisionado.
Suporte / Prevalência: Trata-se da frequência com que um conjunto de itens específico ocorre no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto (Ex: 50% das compras realizadas em um mercado contém arroz e refrigerante).
Confiança / Força: Trata-se da probabilidade de que exista uma relação entre itens (Ex: 70% dos clientes que compram fraldas também compram cerveja).
-
[1] [2] É EXATAMENTE O QUE ELE DISSE, SÓ QUE TUDO AO CONTRÁRIO.
FONTE:
[1] CONCURSEIRO QUASE NADA
[2] KIKO
-
Classificação: você recebe classes pré-definidas e a partir delas continua o aprendizado, de maneira supervisionada, informando tipos e critérios para se construir algumas "subclasses".
Agrupamento/Aglomeração: você recebe dados brutos e sem qualquer classificação anterior. Nisso, os dados que se ligam por semelhança e aproximação, definidos pelo algoritmo de mineração, são separados em grupos (clusters).
-
Conceitos invertidos sobre clusterização e classificação
-
(destrinchando a questão p/ melhor compreensão/revisão)
No datamining, o agrupamento e a classificação funcionam de maneira similar:
o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes (CERTO);
o objetivo não é classificar , estimar ou predizer o valor de uma variável, ela apenas identifica (descreve) os grupos de dados similares, não necessitando que os registros sejam previamente categorizados (aprendizado não-supervisionado).
a classificação é aplicada quando nenhum grupo foi ainda definido. (ERRADO).
os parâmetros são pré-estabelecidos na classificação (grupos pré-definidos c/ posterior classificação supervisionada em classes/categorias .
AVANTE