SóProvas


ID
3361978
Banca
CESPE / CEBRASPE
Órgão
TJ-PA
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Assinale a opção que indica um processo de extração e transformação de dados em um data warehouse.

Alternativas
Comentários
  • Resposta letra D.

    ETL ( Extract transform load)

    O ETL é uma ferramenta que trabalha basicamente em 5 etapas:

    1- Indentificação dos dados

    2- Limpeza

    3- Transformação (colocar os dados "falando a mesma lingua". As vezes um fala 6 e o outro meia dúzia)

    4- Carregamento (Geralmente em um Data Warehouse)

    5- Atualização dos dados

  • Big Data é o termo em Tecnologia da Informação (TI) que trata sobre grandes conjuntos de dados que precisam ser processados e armazenados.

    OLTP, do inglês "On-line Transaction Processing", é o termo usado para se referir aos sistemas transacionais, ou seja, os sistemas operacionais das organizações. São utilizados no processamento dos dados de rotina que são gerados diariamente através dos sistemas informacionais da empresa e dão suporte às funções de execução do negócio organizacional.

    OLAP, do inglês "On-line Analytical Processing", trata da capacidade de analisar grandes volumes de informações nas mais diversas perspectivas dentro de um Data Warehouse (DW). O OLAP também faz referência às ferramentas analíticas utilizadas no BI para a visualização das informações gerenciais e dá suporte para as funções de análises do negócio organizacional.

    ETL, Essa sigla significa Extração, Transformação e Carga (em inglês Extract, Transform and Load) e trata da sistematização do tratamento e limpeza dos dados oriundos dos diversos sistemas organizacionais 

    fonte:canaltech

  • ETL - é a sigla para extraction , transform and load _ extração , transformação e carga . Esses são processos que se precisa aplicar aos dados ao sistemas da empresa para se criar um data mart ou data warehouse .

    A extração corresponde a coleta dos dados nos sistemas de origens , geralmente , operacionais .

    A transformação é o processo de adequar esses dados dos formatos mas adequados ao DW , respeitando - se as regras de negócio .

    E a carga é o processo final , de incluir os dados no DW.

  • ETL é a sigla para “Extraction, Transform and Load” - Extração, Transformação e Carga. 

    Esses são os processos que se precisa aplicar aos dados dos sistemas da empresa para se criar um Data Mart ou um Data Warehouse. 

    A extração corresponde à coleta dos dados nos sistemas de origem, geralmente operacionais. 

    A transformação é o processo de adequar esses dados aos formatos mais adequados ao DW, respeitando-se as regras de negócio. 

    E a carga é o processo final, de incluir os dados no DW.

    EXPONENCIAL CONCURSOS

  • A questão exige do candidato conhecimentos acerca da construção de um Data Warehouse (DW):

    "Um data warehouse é um repositório central de informações que podem ser analisadas para tomar decisões mais fundamentadas. Os dados fluem de sistemas transacionais, bancos de dados relacionais e de outras fontes para o data warehouse, normalmente com uma cadência regular. Analistas de negócios, cientistas de dados e tomadores de decisões acessam os dados por meio de ferramentas de inteligência de negócios (BI), clientes SQL e outros aplicativos de análise" (grifou-se) (Amazon, 2020) [1].

    Vamos então para análise das alternativas:

    A) INCORRETA.  De acordo com a definição do Gartner, Big data são dados com maior variedade que chegam em volumes crescentes e com velocidade cada vez maior. Isso é conhecido como os três Vs (Oracle, 2020) [2]. Ou seja, como o próprio nome sugere, Big data está associado a uma enorme coleção de dados.

    É preciso destacar que o Big data se refere tanto a dados estruturados, ou seja, aqueles que podem ser armazenados de maneira estruturada, que contém uma certa organização, geralmente são encontrados em banco de dados relacionais, quanto a dados não estruturados, que não possuem uma formatação específica e ainda a dados semiestruturados que podem possuir certo grau de estrutura.

    Contudo, Big Data é comumente associado a dados não estruturados e semiestruturados.

    B) INCORRETA.  Podemos definir assim OLAP:

    "OLAP pode ser entendido como uma tecnologia para manipular e analisar um grande volume de dados sob múltiplas perspectivas. Dentro do contexto de Business Inteligente, ferramentas OLAP são utilizadas para apoiar as empresas na análise de suas informações, visando obter novos conhecimentos que são empregados na tomada de decisão" (grifou-se) (WIKIPEDIA, 2020) [3]; (DEVMEDIA, 2007) [4].
    Ademais, de acordo com Microsoft (2018) [5], OLAP  "é uma tecnologia que organiza bancos de dados comerciais grandes e dá suporte à análise complexa. Ele pode ser usado para executar consultas analíticas complexas sem prejudicar sistemas transacionais" (grifou-se)

    Ou seja, o OLAP está associado à fase de ANÁLISE DE DADOS e não à extração de dados para popular um DW.

    C) INCORRETA.  OLTP (Online Transaction Processing ou Processamento de Transações em Tempo Real) são sistemas encarregados de registrar todas as transações contidas em uma determinada operação organizacional, como, por exemplo, " um sistema de transações bancárias que registra todas as operações efetuadas em um banco, caixas de multibanco, reservas de viagens ou hotel on-line, Cartões de Crédito" (WIKIPEDIA, 2020) [6]

    Conforme, Microsoft (2019) [7], "os sistemas OLTP registram as interações de negócios conforme elas ocorrem na operação diária da organização e dão suporte à consulta desses dados para criar inferência" (grifou-se)

    Ou seja, o OLTP tem um foco maior no ambiente operacional da organização, já OLAP é voltada a um nível gerencial. Além disso, ao contrário do OLAP, em um sistema OLTP os dados apresentam grande volatilidade.

    D) CORRETA.  ETL, sigla para Extract Transform Load, como o nome já indica, são ferramentas responsáveis por: extração de dados de diversos sistemas; transformação desses dados, de acordo com as regras de negócio e; carregamento dos dados geralmente para um Data Mart e/ou Data Warehouse (WIKIPEDIA, 2020) [8]

    E) INCORRETA.
    Machine Learning (ML), ou no português Aprendizado de Máquina, pode ser entendido como um método de análise dados que automatiza a criação de modelos analíticos. ML é um ramo da inteligência artificial, baseado na ideia de que os sistemas PODEM APRENDER COM OS DADOS, IDENTIFICAR PADRÕES e TOMAR DECISÕES com o mínimo de intervenção humana (grifou-se) (SAS, 2020) [9]

    Por exemplo, uma empresa com um Data Warehouse que armazene dados de sua operação, pode usar técnicas de ML na análise dos seus dados, com objetivo de auxiliá-la no processo de tomada de decisões.

    GABARITO DO PROFESSOR: LETRA D.


    REFERÊNCIAS: [1] Amazon. Data Warehouse, 2020. Disponível em: site oficial do Amazon Web Service. Acesso em: 17/7/2020; [2] Oracle. O Que é Big Data? Disponível em: site oficial da Oracle. Acesso em 17/7/2020. [3] WIKIPEDIA. OLAP. Disponível em: página da Wikipedia na língua portuguesa. Acesso em 17/7/2020; [4] DEVMEDIA, 2007. Um estudo sobre as ferramentas OLAP. Disponível em: site do Devmedia. Acesso em: 17/7/2020; [5] Microsoft. OLAP (processamento analítico online), 2018. Disponível em: site da Azure Microsoft. Acesso em: 17/7/2020; [6] WIKIPEDIA. OLTP. Disponível em: página da Wikipedia na língua portuguesa. Acesso em 17/7/2020;  [7] Microsoft.  OLTP (processamento de transações online), 2019. Disponível em: site da Azure Microsoft. Acesso em: 17/7/2020; [8] WIKIPEDIA. Extract, transform, load. Disponível em: página da Wikipedia na língua portuguesa. Acesso em 17/7/2020; [9] SAS. Machine Learning.  Disponível em: página da empresa SAS. Acesso em 17/7/2020
  • Gabarito: Alternativa D

    ETL (Extract, Transform and Load) são ferramentas de software cuja função é a extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e por fim o carregamento dos dados geralmente para um Data Mart e/ou Data Warehouse, porém nada impede que também seja para enviar os dados para um determinado sistema da organização.

    As etapas de Extração e Carregamento são obrigatórias, já a de transformação/limpeza é opcional (mas é uma boa prática). 

    Um sistema ETL tem que ser capaz de se comunicar com as bases de dados e ler diversos formatos de arquivos utilizados por toda a organização. Não é uma tarefa trivial.

  • Letra (d)

    ETL (do inglês Extraction, Transform and Load) é um procedimento realizado em dados provenientes de diferentes fontes (bancos transacionais, usualmente) antes de serem carregados nos Data Warehouses e Data Marts

    Como o próprio nome indica, é dividido em três fases:

    -> Extrair: aqui os dados são extraídos das diversas fontes;

    -> Transformar: muitos autores incluem dentro desta etapa o processo de limpeza e preparação. Aqui são tratadas inconsistências e os dados são padronizados;

    -> Carregar: nesta etapa, os dados são carregados nos repositórios dos Data Warehouses e Data Marts.

  • O professor que comentou a questão fez uma verdadeira aula.

  • Gab.: D

    ETL = Extração, Transformação e Carga (em inglês Extract, Transform and Load) 

    O processo de extração, limpeza e carga (load) dos dados é feito na área de transformação (Staging Area).

  • parace que to vendo o cespe dizer que ETL é feito em data mining ou big data

    cuidado para não confundir

  • ETL- Ele é o processo mais crítico e demorado na construção de um Data Warehouse, uma vez que consiste na extração dos dados de fontes homogêneas ou heterogêneas; na transformação e limpeza destes dados; e na carga dos dados no DW. Pessoal, as decisões estratégicas – aquelas mais importantes de uma organização – são tomadas com base nas informações geradas através dos dados armazenados no Data Warehouse.

    pdf estratégia

  • Extraction -> (Staging area) -> Transformation -> Loading. ETL

    Processo demorado, mas de grande valor para a inserção de dados em um DW.