ETL, do inglês Extract Transform Load (Extração Transformação Carga),
são ferramentas de software cuja função é a extração de dados de
diversos sistemas, transformação desses dados conforme regras de
negócios e por fim a carga dos dados geralmente em um Data Mart e um Data Warehouse,
porém nada impede que também seja para enviar os dados para um
determinado sistema da organização. A extração e carga são obrigatórias
para o processo, sendo a transformação/limpeza opcional, mas que são
boas práticas, tendo em vista que os dados já foram encaminhados para o
sistema de destino. É considerada uma das fases mais críticas do Data
Warehouse e/ou Data Mart.
Os projetos de data warehouse consolidam dados de diferentes fontes. A maioria dessas fontes tendem a ser bancos de dados relacionais ou arquivo de texto (texto plano),
mas podem existir outras fontes. Um sistema ETL tem que ser capaz de se
comunicar com as bases de dados e ler diversos formatos de arquivos
utilizados por toda a organização. Essa pode ser uma tarefa não trivial,
e muitas fontes de dados podem não ser acessadas com facilidade.