Data mining é o processo de exploração e análise, por meios automáticos ou semiautomáticos,
de um conjunto grande de dados com o objetivo de descobrir padrões e regras
significativos (Berry e Linoff, 1997).
O data warehouse é uma coleção de dados não volátil, crescente no tempo, integrada e
orientada ao negócio para dar suporte a decisões gerenciais (Inmon, 1996). É a fonte de dados
para consulta da organização (Kimball, 1998).
Ele tem as seguintes características (Berson e Smith, 1997):
• É um banco de dados projetado para análise, que usa dados de várias aplicações.
• É projetado para um pequeno número de usuários com interações longas.
• É usado basicamente para leitura.
• É atualizado periodicamente (principalmente com adição de dados).
• Contém dados atualizados e históricos para fornecer informações do fluxo do negócio no
tempo.
• É formado por poucas e grandes tabelas.
• Destina-se à realização de consultas que resultam em um conjunto grande de dados e
geralmente envolvem leituras de tabelas inteiras e vários relacionamentos.
http://www.anpad.org.br/diversos/trabalhos/EnANPAD/enanpad_2000/ADI/2000_ADI444.pdf