SóProvas


ID
245242
Banca
CESPE / CEBRASPE
Órgão
TRT - 21ª Região (RN)
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de sistemas de suporte a decisão e data warehousing, julgue
os itens a seguir.

O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.

Alternativas
Comentários
  • Provavelmente entraram com recurso para essa questão.

    Data Mining é um processo semi-automático.

    Nas palavras de Silberschatz, Korth e Sudarshan ( Sistema de Banco de Dados, Pág 497)

    "Normalmente existe um componente manual para a mineração de dados, consistindo no pré-processamento dos dados para um formato aceitável aos algoritmos... Por esse motivo, a mineração de dados é na realidade um processo semi-automático na vida real."

    Talvez a banca tenha se baseado na última frase que ele disse:

    "Porém, em nossa descrição nos concentraremos no aspecto automático da mineração"

     

    Então a questão deveria ter sído formulada assim:

    Fora da vida real, o data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.

  • Concordo plenamente com o amigo. O data mining não é um método automático e sim semi-automático, já que exige a intervenção dos profissionais de TI e dos especialistas do domínio.
  • Segundo Berry e Linoff (1997), em Data Mining Techniques: For Marketing, Sales and Customer Suport; o data mining corresponde à exploração e análise, por meios automáticos e semi-automáticos, de grandes quantidades de dados a fim de descobrir  padrões e regras significativas.
     Na edição de 2011, dos mesmos autores, o conceito de data mining está como um processo de negócio  para explorar grandes quantidades de dados para descobrir padroões e regras significativas.
  • Concordo com T. Renegado. Inclusive no livro do Silberschatz é citado que existe um componente manual para a mineração de dados, que consiste no pré-processamento dos dados para um formato aceitável aos algoritmos en no pós-processamento de padrões descobertos para encontrar outros que poderiam ser úteis.  
  • Apenas acrescentando o excelente comentário do colega, como o processo do data mining pode ser considerado automático e semi-automático, a questão não nega o fato dele não ser semi-automático, ficaria errado caso fosse dito é um processo unicamente automático. Prova do CESPE tem disso galera, tem que ficar esperto, as vezes não mencionar uma informação não caracteriza erro.

    Bons estudos
  • Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.

    Gaba: CORRETO

  • Tem "discussão" a respeito de ser ou não automático, porque na realidade não é...rsss, mas tem autor renomado que publicou que DATA MINING é automático, então levo p prova CESPE.

     

    "Data Mining Techniques: For Marketing, Sales, and Customer Support

    1997 - A mineração de dados é a exploração e análise, por meios automáticos ou semiautomático, de grandes quantidades de dados a fim de descobrir padrões e regras significativas."

  • Cespe, é ou nao é automatico? se decide!

     

  • Melhor resposta é a do colega Frederico Diniz

    Apenas acrescentando o excelente comentário do colega, como o processo do Data Mining pode ser considerado automático e semi-automático, a questão não nega o fato dele não ser semi-automático, ficaria errado caso fosse dito é um processo unicamente automático. Prova do CESPE tem disso galera, tem que ficar esperto, as vezes não mencionar uma informação não caracteriza erro.

  • resumindo: briga de gigantes, autores renomados X autores renomados

  • Creio que hoje essa questão seria considerada errada pela mudança de posicionamento dos autores com relação a palavra AUTOMÁTICA. Hodiernamente considera-se uma falácia. Segue resumo extraído de comentários de colegas.

    FALÁCIAS DE DATA MINING:

     

    *Data mining é automático: pelo contrário, data mining é interativo, é um processo que requer supervisão

     

    *Data mining pode identificar problemas no negócio: ele pode encontrar padrões e fenômenos, identificar problemas deve ser feito por especialistas

     

    *Investimentos são recuperados rapidamente: não pode ser afirmado pois depende de inúmeros fatores

     

    *Software são intuitivos e simples: é mais importante conhecer os algorítmos e o negócio em si

  • Pessoas conjecturam muito que prova do cespe é isso ou aquilo. Provavelmente a verdade é que uma cambada de professores elabora questões baseados em livros diferentes, com entendimentos divergentes, jogam o gabarito que bem entendem, o candidato entra com recurso e o CESPE nega, para não se dar ao trabalho.

    Isso cheira a mais falta de organização e má-vontade na avaliação das questões do que algo pensado. Afinal, haveria alguém ou alguma autoridade/lei para fiscalizar concursos? Vocês já sabem a resposta.

  • Quem sabe, sabe: essa banca é muito prepotente, prefere anular uma questão a assumir o erro

  • Entendimento recente do cespe sobre o assunto:

    "Pode" ter processos automáticos( algoritmos) ou [semi-automáticos (regra)]

    (CESPE - 2014 - TJ-SE)

    Assim como o DataMining, os DataMarts são voltados para a obtenção de informações estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir da análise de dados oriundos de DataWarehouses.Errado

    -->Datamarts compôem um Dw .

    (CESPE - 2013 - SERPRO)

    Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante racionalização e potencialização por meio de dois componentes: organização e tecnologia. Errado

    (CESPE: TJ-ESProva 2011)

    Mineração de dados, em seu conceito pleno, consiste na realização, de forma manual, de sucessivas consultas ao banco de dados com o objetivo de descobrir padrões úteis, mas não necessariamente novos, para auxílio à tomada de decisão. Errada

  • 72% acertos ainda.

  • CERTO

    As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.

    O data mining consiste no processo virtual em que uma máquina realiza de maneira programada a prospecção e coleta de dados no ambiente eletrônico. 

    Ou seja, é uma forma ativa e automatizada de obter informação a partir da internet e de sistemas em rede.

  • O processamento pode ser automático e semiautomático, como o examinador não restringiu, logo, alternativa correta! Ainda, vale ressaltar que o processamento automático tem supervisão humana, mesmo que seja mínima.

  • AUTOMÁTICO OU SEMI-AUTOMÁTICO.

  • Falácias do DM segundo Larose

    1) apenas soltar uma ferramenta nos dados repositório é suficiente.

    NÃO, é necessário ação humana.

    2) autonomia da máquina, pouca ou zero supervisão humana.

    ERRADO! Necessita de interação! O homem recalibra a maquina até os dados fazerem sentido.

    3) a DM se paga rapidamente.

    NÃO, o CUSTO É ALTO com ferramentas e profissionais, leva tempo para obter resultados. NÃO É TRIVIAL.

    4) os pacotes de software de DM são intuitivos e fáceis de usar.

    Não, pois, DEMANDA CONHECIMENTO ESPECIALIZADO.

    5) a DM identificará as causas do negócio ou pesquisa de problemas.

    NÃO, quem identifica é o ser humano.

    6) a DM limpará um BD bagunçado automaticamente.

    NÃO, a limpeza / organização / filtragem deve ser feita anteriormente.

  • Berry Linoff

    • "A mineração de dados é o processo de exploração e análise, por meios automáticos ou semi-automáticos, de grandes quantidades de dados a fim de descobrir padrões e regras significativas ..."

    O próprio autor se arrependeu da definição, e na edição seguinte do livro (3 anos depois):

    • "Se há alguma coisa que lamentados, é a frase 'por meios automáticos ou semi-automáticos' ... porque sentimos que veio a haver muito foco sobre as técnicas automáticas e não o suficiente na exploração e análise de dados." 

    Falácia (segundo Larose): "O processo de Mineração de Dados é autônomo, exigindo pouco ou nenhuma supervisão humana." (afirmação falsa) -> Precisa SIM da interação do humano (processo Interativo)

    Entendimento atual, 

    apenas Automático = ERRADO 

    Automático e Semi-Automático = CERTO

    Livro: https://www.academia.edu/32136048/Data_Mining_Techniques_For_Marketing_Sales_and_Customer_Relat

    • A banca utilizou a classificação dos métodos segundo o autor Han et al

    (Pelo visto o Cespe trata "técnicas" e "algoritmos como sinônimos em data mining)

    • Árvore de Decisão 
    • Redes Neurais
    • Classificação Bayesiana
    • Classificação baseada em Regras
    • Classificação por regras de Associação
    • Aprendizado Tardio 

    etc...

  • Gabarito: certo

    ##CESPE - 2013 - INPI - Analista de Planejamento - Desenvolvimento e Manutenção de Sistemas

    O Data Mining possibilita descobrir padrões úteis de diferentes formas. Uma delas é por meio de classificação, utilizando-se o algoritmo ID3 que recebe como entrada um conjunto de tuplas para treinamento chamado exemplos e um atributo objetivo, que permite criar árvores de decisão. (CERTO)

  • certo

    então, data mining é automatico ou semi-automatico, a questão não restringiu dizendo ser apenas automático, por isso marquei correta, mas marquei com medo rsrs, na prova sei nao viu, pensaria bastante...

  • "De forma simplificada, a mineração de dados pode ser definida como um processo automático ou semiautomático de explorar analiticamente grandes bases de dados, com a finalidade de descobrir padrões relevantes que ocorrem nos dados e que sejam importantes para embasar a assimilação de informação importante, suportando a geração de conhecimento".

    Fonte: Introdução à Mineração de Dados - Silva, Peres, Boscarioli, 2016, p. 30

  • c-

    para enriquecer.

    algoritmos para classificacao data mining:

    • Decision Trees.
    • Logistic Regression.
    • Naive Bayes Classification.
    • k-nearest neighbors.
    • Support Vector Machine.