Questão By the book...
Um conjunto de técnicas de natureza estatística é utilizado nos processos de data mining, normalmente embutidos em softwares dedicados a essas aplicações. As principais são:
- Árvore de decisão (Answer/Decision Tree).
- Análise de conglomerados (Cluster Analysis).
- Redes neurais: não é exatamente uma técnica estatística, mas um recurso matemático/computacional que pode ser usado na aplicação delas.
- Análise de regressão (linear e não linear).
- Métodos preditivos com séries temporais.
fonte: BI2 - Barbieri (2001, pág 140)
Gabarito Letra A
instagram: @papirobizurado
Técnicas estatísticas empregadas nos processos de data mining:
Árvore de decisão (Answer/Decision Tree): é uma técnica que, a partir de uma massa de dados, cria e organiza regras de classificação e decisão em formato de diagramas de árvores, que vão classificar suas observações ou predizer resultados futuros.
Análise de conglomerados (Cluster Analysis): identifica a existência de diferentes grupos dentro de um conjunto de dados e, constatada essa existência, agrupar os elementos estudados de acordo com as semelhanças entre si, considerando-se as características analisadas.
Análise de regressão (linear e não linear): é a técnica mais utilizada em data mining devido à sua facilidade de execução e de interpretação. Processa as informações de uma base de dados para determinar um modelo que represente o relacionamento entre as variáveis em estudo. Os principais objetivos são: sumariação dos dados, predição, controle e estimação.
Métodos preditivos com séries temporais: São técnicas estatísticas utilizadas no cálculo de previsão de um conjunto de observações, dados seus valores ao longo do tempo.
Alternativa: A