Peço licença e replico comentário para melhor visualização.
Data Warehouse: coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão.
O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP).
São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados.
A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.
Data Mart: é um banco de dados multidimensional de escopo departamental (ou seja, abrange apenas um determinado departamento).
“Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehouse setorial” (Kimball).
As diferenças entre o Data Mart e o Data Warehouse são apenas com relação ao tamanho e ao escopo do problema a ser resolvido.
Data Mining (ou Mineração de dados): define uma série de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse ou Data Mart à procura de padrões e tendências a respeito dos dados armazenados.
Processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis.
Objetivos do Data Mining:
* conhecer o comportamento de certos atributos no futuro;
* possibilitar a análise de determinados padrões de eventos;
* categorizar perfis individuais ou coletivos de interesse comercial;
* apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa.
As técnicas mais conhecidas de Data Mining são: Descrição de Classes, Associação, Classificação, Previsão e Agrupamento (também conhecida como “clustering”).
Alia-se a estas técnicas ainda, algumas ferramentas estatísticas como Regressão Linear, Modelo Linear Generalizado e Análise de Correlação.