SóProvas


ID
137227
Banca
CESGRANRIO
Órgão
Casa da Moeda
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

Uma empresa deseja criar uma base de dados para apoio à tomada de decisão. As informações corporativas encontram- se em 4 bancos de dados distintos e possuem representações diferentes para atributos de uma pessoa física. Por exemplo, em determinado banco de dados, uma pessoa física do sexo masculino é representada por um atributo com valor M, enquanto que em outro banco de dados, com valor 1.
Em que etapa de um procedimento de ETL para essa base de dados deve ocorrer uma padronização desse tipo de valor?

Alternativas
Comentários
  • ETL é acrônimo inglês para Extract Transform Load que também é conhecido nacionalmente como ETC (Extração, Transformação e Carga).ETL é o processo de extrair dados de um banco de dados realizando as modificações necessárias para tornar possível a inserção destes dados num outro banco de dados de propósito especial: o WD (data Warehouse)Um processo ETL é subdividido em três etapas distintas: extração, transformação e carga.ExtraçãoA extração de dados consiste na retirada dos dados de outros bancos de dados para depois inseri-los no WD. Neste processo que as fontes de dados são definidas. As fontes de dados podem provir de bancos de dados diferentes portanto é indispensável adotar uma fonte como padrão.TranformaçãoA limpeza dos dados consiste em verificar a compatibilidade dos dados extraídos, descartando informações redundantes ou desnecessárias. Entretanto, muitas vezes é necessário realizar algumas transformações, pois os dados podem provir de bancos de dados que utilizam padrões diferentes (por exemplo, um determinado banco usa H para designar o sexo masculino e M para o feminino, já outro usa M para designar o sexo masculino e F para o feminino) e nesse caso deve-se pré-estabelecer qual formatação será adotada como padrão de entrada para o WD, ou seja, a transformação é o processo de uniformização dos dados provenientes de fontes e formatos distintos.CargaA carga é a fase na qual os dados são inseridos no DW, portanto este processo é extremamente complexo pois é nesta fase que se deve garantir a integridade dos dados armazenados no WD.
  • Limpeza, Ajustes e Consolidação (ou também chamada transformação): É nesta etapa que realizamos os devidos ajustes, podendo assim melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes. Em ETL, frequentemente, é necessário limpar, ajustar e consolidar os dados antes de realizar sua carga. Nesse estágio de transformação, aplicam-se regras ou funções aos dados extraídos para ajustar os dados a serem carregados. A limpeza trata de vários tipos de erros, como, por exemplo, valores ilegais, ou que não obedeçam às regras de integridade da base, e erros de ortografia.