SóProvas


ID
1308919
Banca
CESPE / CEBRASPE
Órgão
ANTAQ
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de ferramentas de BI (business intelligence), julgue o próximo item.

O Módulo de ETL (extract transform load), dedicado à extração, carga e transformação de dados, coleta informações em fontes como sistemas ERP, arquivos com extensão TXT e planilhas Excel.

Alternativas
Comentários
  • Gabarito: CORRETA

    Na questão foi alterado a ordem, mas foi considerada correta.

    ETL, na prática, são ferramentas de software cuja função é a extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e, por fim, a carga dos dados em um Data Mart ou um Data Warehouse.

  • foi alterado a ordem mas ele não disse (nessa ordem)

     

    correta

  • A etapa de extração do módulo de ETL de um sistema de Business Intelligence se dedica a coletar dados de diversas fontes para posterior transformação e carregamento na base de destino. Você pode ter achado que a assertiva estava errada por dizer que são coletadas informações de diferentes fontes, mas a questão foi considerada correta. 

    Acontece que as bancas não costumam focar muito nesse aspecto formal da diferença entre dado, informação e conhecimento em questões que não dizem respeito a esse assunto. Então, minha recomendação é: a não ser que a questão trate explicitamente da diferença entre esses conceitos ou o erro seja muito óbvio, você pode considerar a diferença como sendo irrelevante para a resposta.

  • ETL faz a coleta em todo e qualquer tipo de dado na Origem,

  • ETL é o processo mais crítico e demorado na construção de um Data Warehouse, uma vez que

    consiste na extração dos dados de fontes homogêneas ou heterogêneas; na transformação e

    limpeza destes dados; e na carga dos dados no DW. Pessoal, as decisões estratégicas – aquelas

    mais importantes de uma organização – são tomadas com base nas informações geradas através

    dos dados armazenados no Data Warehouse.

  • A técnica denominada ETL extrai dados de diversas fontes - homogêneos e/ou heterogêneos, dados estruturados e não estruturados.

  • GABARITO CORRETO!

    .

    .

    ACRESCENTANDO:

    Existem três tipos primários de paralelismos implementados em aplicações de ETL:

    Dados: Pela divisão de um único arquivo sequencial em arquivos de dados menores para permitir acesso em paralelo.

    Pipeline: Permitindo a execução simultânea de diversos componentes no mesmo fluxo de dados.

    Um exemplo seria a leitura de um valor no registro 1 e ao mesmo tempo juntar dois campos no registro 2.

    Componente: A execução simultânea de múltiplos processos em diferentes fluxos de dados no mesmo job. A classificação de um arquivo de entrada concomitantemente com a de duplicação de outro arquivo seria um exemplo de um paralelismo de componentes.