Transformação
O estágio de transformação aplica uma série de regras ou funções aos dados extraídos para derivar os dados a serem carregados. Algumas fontes de dados necessitarão de muito pouca manipulação de dados.
Em outros casos, podem ser necessários um ou mais de um dos seguintes tipos de transformação:
Seleção de apenas determinadas colunas para carregar (ou a seleção de nenhuma coluna para não carregar)
Tradução de valores codificados (se o sistema de origem armazena 1 para sexo masculino e 2 para feminino, mas o data warehouse armazena M para masculino e F para feminino, por exemplo), o que é conhecido como limpeza de dados.
Codificação de valores de forma livre (mapeando “Masculino”,“1” e “Sr.” para M, por exemplo)
Derivação de um novo valor calculado (montante_vendas = qtde * preço_unitário, por exemplo)
Junção de dados provenientes de diversas fontes
Resumo de várias linhas de dados (total de vendas para cada loja e para cada região, por exemplo)
Geração de valores de chaves substitutas (surrogate keys)
Transposição ou rotação (transformando múltiplas colunas em múltiplas linhas ou vice-versa)
Quebra de uma coluna em diversas colunas (como por exemplo, colocando uma lista separada por vírgulas e especificada como uma cadeia em uma coluna com valores individuais em diferentes colunas).
Fonte: https://pt.wikipedia.org/wiki/Extract,_transform,_load