-
Suporte mínimo e confiança mínima são fatores considerados relevantes, para que uma regra de associação seja avaliada.
Suporte é calculado através da freqüência que a transação ocorre no banco de dados, com determinado conjunto de itens, e dividido pelo
número total de transações.
Se o percentual do suporte gerado for baixo, sugere que não existe evidência expressiva que os itens em X ∪ Y ocorram juntos, considerando que o conjunto de itens ocorre em uma pequena fração de transações (ELMASRI, 2005).
Suporte = X ∪ Y / número total de registros
A confiança da regra é calculada de forma semelhante ao suporte, porém a divisão é feita considerando apenas a freqüência em que X ocorre.
Confiança = X ∪ Y / número de registro com X
-
Segundo Elmasri e Navathe, 6ª Edição:
Em geral,, qualquer regra de associação tem a forma LHS (lado esquerdo ou left-hand side) => RHS (lado direito ou right-hand side), onde LHS e RHS são conjuntos de itens. O conjunto LHS U RHS é o chamado itemset, o conjunto dos itens comprados pelos clientes.
O suporte para uma regra HS => RHS é com relação ao itemset; ele se refere à frequencia com que um itemset específico ocorre no banco de dados. Ou seja, o suporte é o percentual de transações que contêm todos os itens no itemset LHS U RHS.
A confiança é com relação à implicação mostrada na regra. A confiança da regra LHS => RHS é calculada como o suporte(LHS U RHS)/suporte(LHS). Podemos pensar nela como a probabilidade de que os itens no RHS sejam comprados, dado que os itens no LSH são comprados por um cliente. Outro termo para confiança é força da regra.
-
CERTO
Só um complemento ao colega acima ainda segundo NAVATHE. (PRIMEIRA PARTE)
Segundo Navathe(2011,p.698),"Como o termo indica, mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados."
Segundo Navathe(2011,p.700),"É comum descrever o conhecimento descoberto durante a mineração de dados da seguinte forma: regras de associação, hierarquias de classificação, padrões sequenciais, padrões dentro de série temporal e agrupamento."
Bibliografia:
SISTEMAS DE BANCO DE DADOS. 6 EDIÇÃO 2011. NAVATHE
-
Regras de Associação - Relaciona a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.
Ex: Quando uma mulher compra uma bolsa em uma loja, ela está propensa a comprar sapatos na (mesma loja).
.
.
TRC
-
Gab: CERTO
Uma regra de associação deve satisfazer alguma medida de interesse do analista de dados. As duas principais medidas de interesse são: Suporte e Confiança
SUPORTE: Trata-se da FREQUÊNCIA com que um conjunto de itens específico ocorre no banco de dados
CONFIANÇA: Trata-se da PROBABILIDADE de que exista uma relação entre itens.
-
CERTO
Vamos supor que foi criada uma regra de associação para determinar que se um indivíduo compra Toddy, ele também comprará leite.
Suporte= Quantas vezes Toddy e leite se encontram juntos? Ou seja, o que "suporta" sua decisão em criar essa regra de associação???
Confiança= Posso confiar que, se o cara comprar Toddy, ele comprará leite? Trata-se de uma probabilidade condicional. Qual é a chance de, dado que ele comprou Toddy, ele comprar leite?
-
Comentário: Mineração de dados é o ato de extrair e explorar dados. Esses dados que serão explorados não estão apenas em um único banco de dados específico. Esses dados estão espalhados por todo o mundo, que vão desde um site na internet com variadas informações, como o facebook, por exemplo, até mesmo na análise do comportamento de pessoas. Ou seja, a mineração de dados explora, basicamente, tudo que existe no mundo. A mineração de dados, representado pelo termo em Inglês Data Mining, é um PROCESSO, uma ação, que analisa uma grande quantidade de dados e não um banco de dados em si.
A mineração de dados pode buscar um grande volume de informações, presente em todos os locais, e colocar isso dentro de um banco de dados, mas não podemos considerar mineração de dados como um banco de dados em si
-
As regras de associação são uma técnica popular para descobrir
relacionamentos interessantes entre variáveis em grandes bancos de
dados. Para que uma regra de associação seja de interesse de um analista de
dados, ela deve obedecer a alguma medida de interesse.
Duas medidas comuns são o suporte e a confiança.
❖ Suporte ou prevalência: frequência que um conjunto de itens
específico ocorre no banco de dados, ou seja, o percentual de
transações que contém todos os itens em um dado conjunto. Ex.: 30%
das compras realizadas em um supermercado contém fraldas e cervejas.
❖ Confiança ou força: probabilidade de que exista relação entre itens.
Ex.: 70% dos clientes que compram fraldas também compram cerveja.
Gabarito: Certo.
-
O data mining (mineração de dados) se refere à extração ou descoberta de novas informações de grandes quantidades de dados. A frequência e o suporte são informações relevantes para verificação da informação que será entendida a partir dos dados.