SóProvas


ID
271018
Banca
CESPE / CEBRASPE
Órgão
PREVIC
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens a seguir, relativos aos sistemas de suporte a decisão.

Um banco de dados pode conter objetos de dados que não sigam o padrão dos dados armazenados. Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção, para que não induzirem a erros na mineração.

Alternativas
Comentários
  • Usualmente, os dados corporativos que irão compor as dimensões e a tabela de fatos estão armazenados de forma distribuída, em diversas fontes. Devido a esta distribuição, os dados podem variar, por exemplo, com relação ao formato, unidade de medida, dentre outros. Esta variedade pode gerar incoerências (não uniformidade) nos valores extraídos das fontes, exemplos: erros de digitação, ausência de dados, incoerência entre os metadados, entre outros. Uma vez que ocorram incoerências, para permitir uma análise consistente a base de um DW, são necessárias transformações. Estas
    transformações são consideradas uma etapa importante no processo de alimentação de um DW, uma vez que uma análise sobre dados não uniformes pode levar a informações inconsistentes, as quais não refletem a verdadeira realidade de uma corporação e, consequentemente, podem levar a decisões erradas.

    http://www.comp.ime.eb.br/techreports/repositorio/2010_01.pdf

    As informações corporativas podem existir de inúmeras formas, inclusive armazenadas de forma não padronizadas (não-uniforme), no entanto antes que ocorra processos de mineração o mecanismo ETL deve atuar de forma a eliminar tais inconsistências.
  • Um banco de dados pode conter dados que não apresentam o comportamento geral da maioria. Estes dados são denominados outliers
    Mesmo que esses dados possam ser considerados exceções eles são úteis na detecção de fraudes e na análise de eventos raros.
    Exemplo: Podemos detectar o uso fraudulento de cartões de crédito ao descobrir que certos clientes efetuam compras de valor extremamente alto, fora de seu padrão habitual de gastos. 
  • Se a questão estivesse se referindo a outliers ai sim justificaria a questão estar errada. No meu entendimento a questão esta correta.
  • Acho que a questão deveria estar CERTA (desconsiderando a pequena imprecisão de sintaxe no final, que não invalidaria a questão: "para que não induzirem a erros na mineração")

    Semanticamente está tudo certo:
    "Um banco de dados pode conter objetos de dados que não sigam o padrão dos dados armazenados". (nenhum problema até aqui, em um banco de dados pode haver qualquer tipo de dados, independente de seguir padrão dos outros ou não)

    "Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção" (perfeito! De fato os dados que não seguem o padrão são tratados como exceção, e essa exceção tem até nome: OUTLIERS)

    "para não induzirem a erros na mineração" (os outliers são tratados separadamente (como exceção), se um outlier for considerado como sendo de um grupo e não como sendo exceção, isso seria um erro da mineração)
  • Alguém pode dizer exatamente o trecho que está errado? Entendi as explicações, mas ainda não consegui entender a questão completamente. Obrigado :)

  • Segundo Elmasri e Navathe (6ª Edição, Cap. 28, Pag. 699):

    "A descoberta de conhecimento nos bancos de dados, abreviada como KDD (Knowledge Discovery in Databases), normalmente abrange mais que a mineração de dados. O processo de descoberta do conhecimento envolve seis fases: seleção de dados, limpeza de dados, enriquecimento, transformação ou codificação de dados, mineração de dados e o relatório e exibição da informação descoberta"

    Alguns autores realizam a fusão das fases limpeza de dados e enriquecimento, chamando apenas de pré-processamento.

    A análise de outliers é realizada dentro da fase de pré-processamento e não na fase de mineração de dados.

    Apesar de considerar a questão mal formulada, acredito que o que está colocando a assertiva como errada é o fato de termos que entender mineração de dados como parte do processo de descoberta pelo conhecimento em banco de dados (KDD). Ao separarmos as fases do processo de descoberta do conhecimento em banco de dados, veremos que as exceções são tratadas antes da mineração dos dados.

  • Tiago Passos, o trecho errado está bem próximo da explicação do Thiago falou: outliers (ou exceções) não devem ser tratados como exceções para não induzirem a erros de mineração. Eles fazem parte do processo de descoberta da mineração. Eles não são descartáveis, como a questão deixou parecer.

  • o erro esta ( para que não induzirem a erros na mineração.) 

    na mineração existem varias etapas des dos dados fornecidos ate uma avaliação :

    as etapas são :seleção( dados escolhidos )

    pre-processamento(dados pre processados)

    transformção(dados transformados)

    MINERAÇÃO DE DADOS(padroes)

    e por fim avaliação onde terá o conhecimento desejado ..O CERTO SERIA QUE INDUZIRIA AO ERRO O CONHECIMENTO A AVALIAÇÃO FINAL. POIS A MINERAÇÃO DE DADOS E UMA ATIVIDADE DO PROCESSO.

    VA E VENÇA

  • No meu entendimento, busca-se o padrão, logo não serão tratadas como exceção, e sim descartadas...

  • Gabarito: Errado.

    Busca-se um padrão em uma grande quantidade de dados. Se são removidos dados ou tratados como exceções, o resultado em obter padrões não seria obtido de forma correta. Analisa-se aquilo que se tem no banco de dados.

    O exemplo prático é quando a tua operadora de cartão de crédito entra em contato com você porque detectou movimentações estranhas na sua conta. Essas compras geram dados anômalos frente aos demais, mas não são descartadas, pois ajudam o sistema a entender quando é você ou alguém que conseguiu fraudar seus dados.

    Bons estudos!

  • ERRADO. Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção, MAS NÃO PARA EIVTAR INDUZIMENTO A ERROS NA MINERAÇÃO. Pelo contrário, essas exceções são úteis na detecção de possíveis fraudes e na análise de eventos raros.

    Adsumus!

  • ERRADO. Nos métodos de mineração de dados, acontece o processo de limpeza dos dados , que consiste em retirar os dados que possam distorcer a análise

  • Gab. Errado

    1) Um banco de dados pode conter objetos de dados que não sigam o padrão dos dados armazenados. (Dada a diversidade de dados de que dispomos atualmente)

    2) Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção. (Outliers)

    3) para que não induzirem a erros na mineração. (Não há que se falar em erro ou indução, pelo contrário, essas exceções ajudam a minimizar os erros e tornar o padrão em questão mais uniforme, de forma que podem representar um evento inesperado ou que foje à regra daquele grupo específico, sendo tratadso com maior atenção que o normal.)

    #como exemplo, podemos analisar os gastos de uma pessoa com cartões de crédito. Ela segue um padrão de consumo e, inesperadamente, ocorre um excesso ou uma fuga de seus padrões habituais; estes, na mineração, podem demonstrar que houve fraude , roubo, clonagem e etc.

  • SABE AQUELA TV DE 5 MIL REAIS PARCELADA EM 12 VEZES SEM JUROS?

    OUT..COF COF..LIER

  • Objetos de dados que não seguem um padrão são conhecidos como anomalias (outliers). No

    contexto de mineração de dados, esses objetos de dados realmente são tratados como exceções

    ou distorções, mas não necessariamente para não induzir a erros de mineração. Na verdade, é

    comum que os dados anormais sejam justamente a razão para a mineração dos dados. Dados fora

    do padrão podem indicar uma variabilidade em uma medição, erros experimentais ou justamente

    um desvio de comportamento que está sendo procurado

  • KKKKKKKKKKKKKKK Cada um dá uma resposta diferente. A verdade é que ninguém sabe o erro dela.

    "Os dados não padronizados não são necessariamente descartados. Eles podem sim serem úteis na análise de mineração". Essa foi a explicação de um dos professores do AlfaCon, que eu discordo bastante. Em nenhum momento a questão fala que os dados serão descartados, fala que serão tratados como exceção, o que é correto, visto que são outliers. PARA MIM, o professor tentou passar um pano para essa questão.

  • Durante o processo de análise dos dados podemos encontrar alguns pontos discrepantes das distribuições, esses são denominados pela estatística de OUTLIERS, ou seja, pontos fora da curva de comportamento. Um outlier pode ser um dado a ser descartado por algum erro, ou pode ser o ponto procurado, por isso deve ser analisado no devido contexto que se espera.