SóProvas


ID
241648
Banca
CESPE / CEBRASPE
Órgão
MPU
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de data warehousing, data mining e OLAP (online
analytical processing
), julgue os itens que se seguem.

Dados para a formação de data warehouses podem ser provenientes de e-mails, conversas de telefone, documentos, planilhas. A abordagem linguística utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa.

Alternativas
Comentários
  • Essa descrição me parece compatível com Data Mining, portanto: Errada!
  • Toda a questão está correta exceto por um único trecho.  A definição dada se refere a abordagem temática e não a abordagem linguística(a qual é mais complexa e pouco flexível pois é embasada na língua em que se escreve). Tanto a abordagem lingística como a abordagem temática são aplicadas no processo de entendimento dos dados não estruturados antes dos mesmos serem inseridos(carregados) no datawarehouse.
  • Vamos quebrar a questão em dois itens:

    1. Dados para a formação de data warehouses podem ser provenientes de e-mails, conversas de telefone, documentos, planilhas.

    Item CERTO (eu também não sabia disso ).

    Vejam [1]:

    “A arquitetura do DW 2.0™ propõe, conforme mencionado, a incorporação de dados não-estruturados no processo de Data Warehousing. Esses dados podem ser provenientes de e-mails, conversas de telefone, documentos, planilhas, etc. Devido à natureza destes dados, que têm como essência o texto livre, incorporá-los simplesmente no mundo analítico, segundo Inmon, criaria um universo de análise muito pouco produtivo, sendo necessário que estes textos passem por uma série de tratamentos antes de serem incorporados efetivamente. É preciso separar o conteúdo realmente relevante para a empresa.”

     

    2. A abordagem linguística utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa.

    Item ERRADO.

    O que o item trouxe foi a descrição da abordagem TEMÁTICA [1]:

    “A abordagem lingüística trata o texto de acordo com a língua na qual ele está escrito, sendo sua utilização muito complexa e pouco flexível (uma análise deve ser feita para cada língua). A abordagem temática utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa.”

     

    Referência:

    [1] Uma abordagem multifacetada para exploração integrada de dados estruturados e não-estruturados em ambientes OLAP:http://teses2.ufrj.br/15/teses/735155.pdf

  • fonte aleatória ein, não dava para a banca tirar tudo de uma referência, tipo o Data Warehouse Toolkit? nunca ouvi falar nisso...