SóProvas



Questões de Data Mining


ID
101887
Banca
CESPE / CEBRASPE
Órgão
TCU
Ano
2007
Provas
Disciplina
Banco de Dados
Assuntos

Nos sistemas de suporte a decisão (SSD), os dados são coletados
em data warehouses e a análise de dados pode ser realizada por
meio de processamento analítico online (OLAP) e datamining.
Julgue os itens seguintes, sobre SSD, OLAP e datamining.

No datamining, o agrupamento e a classificação funcionam de maneira similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda definido.

Alternativas
Comentários
  • Os métodos tradicionais de Data Mining são:Classificação: associa ou classi?ca um item a uma ou várias classes categóricas pré-de?nidas.Análise de Agrupamento (Cluster): associa um item a uma ou várias classes categóricas (ou clusters), em que as classes são determinadas pelos dados, DIVERSAMENTE DA CLASSIFICAÇÃO EM QUE AS CLASSES SÃO PRÉ-DEFINIDAS.Sumarização: determina uma descrição compacta para um dado subconjunto. As medidas de posição e variabilidade são exemplos simples de sumarização.Modelos de Relacionamento entre Variáveis: associa um item a uma ou mais variáveis de predição de valores reais, consideradas variáveis independentes ou exploratórias.Modelo de Dependência: descreve dependências signi?cativas entre variáveis. Modelos de dependência existem em dois níveis: estruturado e quantitativo.Regras de Associação: determinam relações entre campos de um banco de dados. A idéia é a derivação de correlações multivariadas que permitam subsidiar as tomadas de decisão.Análise de Séries Temporais: determina características seqüenciais, como dados com dependência no tempo. Seu objetivo é modelar estado do processo extraindo e registrando desvios e tendências no tempo.Referência: http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf
  • "a classificação é aplicada quando nenhum grupo foi ainda definido"
    Na classificação os grupos já estão definidos, já no agrupamento esses grupos são descobertos.
    Agrupamento é um tipo de classificação a qual descobre os grupos e é chamada também de classificação não-supervisionada (conjunto de treinamento não possui rótulos).
    Na classificação, chamada também de classificação supervisionada, o conjunto de treinamento possui classes. Esse conjunto de treinamento é utilizado para gerar um modelo o qual avaliará novos dados, rotulando-os.
  • O conceito esta invertido.

    Bons estudos!!!
  • Primeiro eu classifico p depois separar em grupos.

  • ERRADO. Conceitos invertidos!!!!

     

    Na classificação você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva - supervisionada).

     

    No agrupamento há apenas a separação de dados constantes no seu banco (descritivo - não supervisionada). O objetivo não é classificar novas informações!!!

  • No datamining, o agrupamento e a classificação funcionam de maneira similar: a classificação reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes; o agrupamento é aplicada quando nenhum grupo foi ainda definido

  • ERRADO

    Agrupamento (CLAUSTERING): não supervisionado.

    Os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.

    àClassificação: supervisionado.

    Suporte / Prevalência: Trata-se da frequência com que um conjunto de itens específico ocorre no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto (Ex: 50% das compras realizadas em um mercado contém arroz e refrigerante).

    Confiança / Força: Trata-se da probabilidade de que exista uma relação entre itens (Ex: 70% dos clientes que compram fraldas também compram cerveja).

  • [1] [2] É EXATAMENTE O QUE ELE DISSE, SÓ QUE TUDO AO CONTRÁRIO.

    FONTE:

    [1] CONCURSEIRO QUASE NADA

    [2] KIKO

  • Classificação: você recebe classes pré-definidas e a partir delas continua o aprendizado, de maneira supervisionada, informando tipos e critérios para se construir algumas "subclasses".

    Agrupamento/Aglomeração: você recebe dados brutos e sem qualquer classificação anterior. Nisso, os dados que se ligam por semelhança e aproximação, definidos pelo algoritmo de mineração, são separados em grupos (clusters).

  • Conceitos invertidos sobre clusterização e classificação

  • (destrinchando a questão p/ melhor compreensão/revisão)

    No datamining, o agrupamento e a classificação funcionam de maneira similar:

    o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes (CERTO);

    o objetivo não é classificar , estimar ou predizer o valor de uma variável, ela apenas identifica (descreve) os grupos de dados similares, não necessitando que os registros sejam previamente categorizados (aprendizado não-supervisionado).

    a classificação é aplicada quando nenhum grupo foi ainda definido. (ERRADO).

    os parâmetros são pré-estabelecidos na classificação (grupos pré-definidos c/ posterior classificação supervisionada em classes/categorias .

    AVANTE


ID
104752
Banca
FCC
Órgão
TCM-PA
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Especificamente, um data mining onde as tendências são modeladas conforme o tempo, usando dados conhecidos, e as tendências futuras são obtidas com base no modelo possui a forma de mining

Alternativas
Comentários
  • tendencias futuras = preditivo
  • a) textual.Banco de dados textual é usado na indexação de textos usando estruturas de dados (árvores ou listas encadeadas). Uma boa referência para o assunto está aqui: http://homepages.dcc.ufmg.br/~nivio/cursos/pa02/seminarios/seminario3/seminario3.htmlb) flocos de neve.ou snow flake, é uma forma de estruturação de data warehouse. Outros exemplos são: estrela e cuboc) espacial.Desconheço esta opção * d) estrela.Vide letra b)e) preditivo.Nosso amigo já respondeu logo abaixo ;)
  • a) textual : Se trata do text mining que é o processo de obtenção de informação utilizando fontes de dados textuais. Aplicações em classificação automática de textos e busca de agrupamentos.

    b) termo não relacionado à mineração.

    c) espacial: Spatial data mining que é o processo de descoberta de padrões utilizando bancos de dados espaciais populados por mapas.

    d) termo não relacionado à mineração.

    e) preditivo: Certo. O objetivo é predizer o valor de um atributo particular baseados nos valores de outros atributos.

    obs: Existe também a forma de mining descritivo o qual deriva padrões que resumem relações implíticas nos dados (correlações, tendências, agrupamentos, trajetórias, anomalias).
  • "Predição - A data mining pode mostrar como certos atributos dos dados irão se comportar no futuro."

    Retirado do livro Elmasri e Navathe: Sistema de Bando de Dados, 4 ed, Conceitos de Data Mining, pág. 625.
  • Temos a descrição da modelagem preditiva, em que dados desconhecidos a respeito de valores futuros podem ser previstos através dos dados conhecidos.

    Gabarito: E

  • PREDICAO = PREVISAO


ID
119230
Banca
FCC
Órgão
TRF - 4ª REGIÃO
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Sobre data mining, é correto afirmar:

Alternativas
Comentários
  • Alternativa (a) Segundo Wikipédia, "é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados". Usando padrões e técnicas de reconhecimento, como alg géneticos, cluster e outros.
  • A) CertoB) Data mining requer interação com analistas humanos, pois deve-se entender os dados os quais puros não dizem muito acerca do domínio de aplicação.C) Os dados devem ser tratados de forma igual, não se pode desconsiderar dados genéricos e privilegiar dados específicos que podem se tratar de bias, outliers, missing values, etc.D) Data mining é um processo e não um banco de dados.E) Data mining pode ser utilizado a partir de qualquer tipo de repositório.
  • A letra "a" é uma pegadinha boa pois geralmente a primeira vista costumamos associar o Datamining com Datawarehouse e esta questão fala sobe "análise de grandes quantidades de dados armazenados em bancos de dados" o que leva a pensar que estaria errado pois poderia deveria ser "análise de grandes quantidades de dados armazenados em Datawarehouses". Mas como o Datamining é uma técnica independente do repositório como o colega colocou, então está correta esta colocação.
  • desconsiderar aquilo que é generico e considerar aquilo que é especifico(setorial) = DATA MART
  • É importante notar que as palavras padrões, tendências ou dados brutos sempre estão relacionadas com MD.

  • Data mining é o prcesso de analisar, processar e transformar dados para analisá-los e descobrir padroes e tendencias. geralmente se valoriza o que é generico e se desconsidera o que for ocasional.

  • Na Economia, mais precisamente na Econometria, o processo de Data Mining deve sempre ser visto com certa ressalva. Se um modelo econométrico, que segundo a teoria econômica é descrito por Yi = B0 + B1X1i + B2X2i + ui, tiver acrescido a variável X3 por método de Data Mining simplesmente porque R² ou teste F apresentam melhoras, pode não ser razão suficiente. O Data Mining pode trazer relações espúrias em seus resultados.

  • a) Perfeito! Já achamos nossa resposta. A mineração de dados visa encontrar padrões e relacionamentos previamente ocultos através da análise dos dados armazenados. Isso é realizado através de técnicas da informática (inclusive aprendizado de máquina com reconhecimento de padrões), da estatística e da matemática. CERTA

    b) Essa é uma das falácias da mineração de dados. Ela requer supervisão humana em suas etapas, inclusive ao final, para a avaliação dos resultados e a melhoria do processo. ERRADA

    c) Para encontrar padrões a ideia é ser capaz de criar regras genéricas a partir de ocorrências específicas. Assim, a generalização é justamente o objetivo, não sendo de forma alguma descartada. ERRADA

    d) Data mining não é um banco de dados, mas um processo que envolve várias técnicas distintas. A descrição na assertiva é a de um data warehouse. ERRADA

    e) O DW é uma fonte muito boa para a mineração de dados, mas não é a única. Essa é um erro que costuma aparecer bastante em provas! ERRADA

    Gabarito: A 

  • (b) Errado. Eles funcionam de forma semiautomática, necessitando de interferência humana;

    (c) Errado. Informações precisam ser pré-processadas e, não, simplificadas – nada de desconsiderar informações genéricas;

    (d) Errado. Data Mining não é um banco de dados;

    (e) Errado. Essa é uma falácia comum! Não é obrigatório utilizar um Data Warehouse, apesar de ser o mais comum. 

    Fonte: estratégia pdf

  • Tá, eu acertei, mas às vezes acho que as bancas em geral cobram muitos conceitos "ctrl+c, ctrl+v", retirados de contextos específicos. No item a, que é o correto, o trecho "entre as informações de uma empresa" evidencia isso. Ora, data mining obviamente pode ser implementado em qualquer entidade, então seu conceito não se limita ao ambiente empresarial. Não necessariamente se deve tratar de uma empresa. Questão de péssima qualidade.

  • GAB: A

    Sobre o assunto:

     Data Mining é o processo de explorar grande quantidade de dados para extração não-trivial de informação implícita desconhecida.

     Data Mining é uso de teorias, métodos, processos e tecnologias para organizar uma grande quantidade de dados brutos para identificar padrões de comportamentos em determinados públicos.

     Data Mining é a categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados.

     Data Mining é o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de padrões, estatísticas e matemáticas.

     Data Mining constitui em uma técnica para a exploração e análise de dados, visando descobrir padrões e regras, a princípio ocultos, importantes à aplicação.

     Data Mining é o conjunto de ferramentas que permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa (fuzzy), dentre outras.

     Data Mining é o conjunto de ferramentas e técnicas de mineração de dados que têm por objetivo buscar a classificação e o agrupamento (clusterização) de dados, bem como identificar padrões.

     Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre variáveis e novos subconjuntos de dados.

     Data Mining consiste em explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar padrões, como regras de associação ou sequências temporais, para detectar relacionamentos entre estes.

     Data Mining é o conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização.

     Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

     Data Mining é o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis. (PF).

     Data Mining é um método computacional que permite extrair informações a partir de grande quantidade de dados.

    Fonte: comentários colegas do qc.


ID
130135
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

No que concerne a tópicos avançados, julgue os itens
subseqüentes.

Software de inteligência empresarial, como mineração de dados, CRM e datawharehouse, por exemplo, aplicam métodos de inteligência artificial e robótica avançados para a representação e extração da informação em grandes bases de dados.

Alternativas
Comentários
  • Esta questão é específica para quem é da área de Informática, não deveria estar no tópico NOÇOES DE INFO
  • Errado

    O BI (Business Intelligence) Inteligência de Negócio ou Empresarial, consiste de uma vasta categoria de tecnologias e programas utilizados para extrair, armazenar, analisar e transformar grandes volumes de dados, produzindo um ambiente de conhecimento, onde há produção sistemática de informação gerencial, veloz e consistente, capaz de auxiliar empresas a tomarem as melhores decisões nos negócios, baseado em fatos reais, com profundidade suficiente para se descobrir as causas de uma tendência ou de um problema.

    Estes dados utilizados pelo BI são, geralmente, armazenados em um banco de dados próprio, extraído da base corporativa, e preparados para análises. Este banco de dados próprio é chamado de Data Warehouse.

    Utiliza-se SIM métodos de inteligência artificial, mas não de robótica avançada.

  • Robótica avançada "forçou a amizade"....
  • O erro dessa questão é tratar MINERAÇÃO DE DADOS como um software apenas. MINERAÇÃO DE DADOS é mais do que um software: é o processo de análise de conjuntos de dados que tem por objetivo a descoberta de padrões interessantes e que possam representar informações úteis.
  • penso também que generalizar CRM apurada por meio de inteligência artificial pode ter contribuído para a questão ser errada.

  • ROBÓTICA????? POR QUE MEUS DEUS, POR QUÊ????? (E o pior é descobrir que 45% das pessoas erraram essa questão ¬¬)

  • Resolvi "com o canto do olho" e acabei errando. Mas acho que chamar mineração de dados como software não invalida a questão, apesar de não ser o termo técnico correto, acho difícil fazer mineração sem algum software.  No livro do Silberschatz é citado que existe um componente manual para a mineração de dados, que consiste no pré-processamento dos dados para um formato aceitável aos algoritmos no pós-processamento de padrões descobertos para encontrar outros que poderiam ser úteis.  
    Acho que o que pegou mesmo foi a parte da robótica. 

    Se formos puristas demais, poderíamos marcar errado até pela palavra "Data warehouse" com grafia incorreta.
  • Parei de ler no CRM.

  • Questão complicada para análise.

    Sobre a questão do CRM, fiquei em dúvida, mas assim como o BPM e ERP, fazem parte da tecnologias do BI.

    Há uma forte tendência de que os produtos que compõem o sistema de BI de uma empresa passem, isoladamente, a prover funções extras que auxiliem na tomada de decisões. Por exemplo, todos os sistemas que funcionam numa perspectiva de organização da informação. Sendo assim temos:

    ERP – Enterprise Resource Planning (Sistema Integrado de Gestão Empresarial);

    CRM – Customer Relationship Management (Gestão de Relacionamento com o Cliente).

    BPM – Business Process Management (Gestão de Processos de Negócio)

    A globalização e a evolução da  têm mudado radicalmente a forma como as empresas e os seus consumidores se relacionam. Os consumidores têm um leque de opções de produtos e serviços que há alguns anos não era possível.

    Fonte:https://pt.wikipedia.org/wiki/Intelig%C3%AAncia_empresarial

    Outro argumento referente a tecnologia de CRM já possuir Inteligência Artificial e assim, estar enquadrado como Software de inteligência empresarial:

    Imagine se os aplicativos de negócios pudessem se beneficiar da IA sem nenhum esforço, recurso ou estrutura adicional? Esta é a essência do Salesforce Einstein: Inteligência Artificial incorporada na Plataforma da Salesforce. Com o Einstein, o CRM número 1 do mundo agora também será o CRM mais inteligente do mundo.

    Comentário do Produto Salesforce.

    Fonte: https://www.salesforce.com/br/products/einstein/overview/

  • inteligência artificial: sim

    robótica: não

    ERRADO!

    SE VC ERROU POR CAUSA DA ROBÓTICA, CLICA NO GOSTEI!

  • Os softwares de CRM, e data warehouse PODEM utilizar inteligência artificial. Mas não é necessário. De toda forma, a questão está errada pois esses softwares não usam robótica. Mineração de dados, por sua vez, não é um software, mas um processo para explorar grandes quantidades de dados à procura de padrões consistentes. 

  • galera, um outro erro da questao poderia ser qnd afirma que data mining refere-se à extração de informação em grandes bases de dados ? quando na verdade o que ocorre é EXTRAÇÃO DE DADOS ...

  • Os processos de inteligência empresarial (Business intelligence), como mineração de dados e CRM (Customer Relationship Management), bem como o datawharehouse aplicam métodos de inteligência artificial para a representação e extração da informação em grandes bases de dados.

  • Gabarito: Errado.

    Mineração de dados não é um software. É uma técnica que faz parte do KDD (Knowlege Discovery in Databases).

    Bons estudos!


ID
135517
Banca
CESPE / CEBRASPE
Órgão
EMBASA
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de sistemas de apoio à decisão, julgue os itens que se
seguem.

Data mining é o processo de extração de conhecimento de grandes bases de dados, sendo estas convencionais ou não, e que faz uso de técnicas de inteligência artificial.

Alternativas
Comentários
  • Gabarito Preliminar: C
    Gabarito Definitivo: E
    Deferido com alteração.
    O item não descreve corretamente o processo Data mining, fato que o torna errado.
  • Mineração de dados é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

    Esse é um tópico recente em ciência da computação mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões.

     

    Fonte: http://pt.wikipedia.org/wiki/Data_mining

  • O único texto que pode haver algum erro nesta questão está relacionada ao ponto "é o processo de extração de conhecimento".


    De acordo com Sistemas de Banco de Dados (Navathe - 4ª Edição)
     - Data Mining é aplicado em grandes bases de dados e em BD convencionais ou não (tópico 27.1)
     - Pode usar técnicas de IA (tópico 27.5.4).

    A definição de acordo com o autor é que "Data Mining é parte do processo (e não o processo) de descoberta de conhecimento (KDD), sendo a 5ª fase deste processo (tópico 27.1).


    BD -> Limpeza e Integração -> DW -> Seleção e Transformação -> Mineração -> Padrões -> Conhecimento

  • Concordo com a explicação do colega Andre Veras. O ponto X é saber qual o nível de abstração que o CESPE está esperando em cada questão! Dificuldades intrínsecas aos concursos públicos.

    Bons estudos.

  • abstraindo muito, acho q o erro é não citar o uso da ação humana, ficar apenas no " uso de técnicas de inteligência artificial". a ação humana é necessária. 

    se n for isso, realmente n tenho ideia do erro dessa frase. Por isso que amo cespe. hahaha

  • Acho que o erro se deve a "extração de conhecimento", dados não são conhecimento, dados são só dados.
    A mineração encontra padrões, anomalias e correlações; depois vem a análise dos dados... 
    Dados processados se tornam informação; informação assimilada se torna conhecimento.

  • Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.

    Gaba: ERRADO

  • Veja a Q678068. Essa questão fala 'No contexto de data mining'.

    Já esta fala como se fosse o processo de conhecimento geral. Concordo, pois, com o comentário do colega André Veras.

  • Questão exotérica(subjetividade level 99),o gabarito pode ser qualquer coisa a depender do humor do examinador.Basear-se por questões como essas pode levar ao erro de outras tantas que acertou no passado.

     

    Butina nela....bola p frente.

  • Acredito que o processo de extração de conhecimento, ao qual a questão se refere, é o KDD

     

    O dataminig é uma etapa desse processo e não o prcesso em si. (O todo é maior que a soma de suas partes) 

     

    Gabarito ERRADO

  • Senhores o erro está em dizer que o Data Mining é o processo de descoberta de conhecimento, o certo seria KDD no lugar de Data Mining. O DM é uma parte do processo.

  •  "é o processo de extração de conhecimento", dados não são conhecimento, dados são só dados.

    Data Mining é parte do processo (e não o processo) de descoberta de conhecimento (KDD)

    BD -> Limpeza e Integração -> DW -> Seleção e Transformação -> Mineração -> Padrões -> Conhecimento

    (CESPE / 2016) No contexto de data mining, o processo de descoberta de conhecimento em base de dados consiste na extração não trivial de conhecimento previamente desconhecido e potencialmente útil. (CERTA)

  • Data mining é o processo de extração de (dados) conhecimento de grandes bases de dados (DW - mais usado), sendo estas convencionais ou não (pode ser um BD transeunte tb - ex), e que faz uso de técnicas de inteligência artificial (famosa IA, uma entre várias ferramentas possíveis p/ esse processo).

    O concurseiro André Veras foi no cerne da questão, pois o data mining encontra padrões e tendências, a extração de conhecimento é feita por especialistas a partir dos dados validados e agrupados por esse processo.

    AVANTE

  • GAB: E

    • Data mining não se confunde com KDD
    • Data mining é o processo de extracao de dados e é uma etapa do KDD
    • KDD envolve Big Data, DM, DW... até chegar ao conhecimento final.
  • "Eu não vejo absolutamente nenhum erro nessa questão! Ele pode ou não ocorrer em grandes bases de dados, podem ser bases convencionais ou não e pode utilizar técnicas de inteligência artificial ou não, mas a banca a considerou falsa."

    Esse comentário é do Professor Diego Carvalho, basta ver o currículo do cara pra entender que mil vezes o comentário dele do que de um bando de Zé Ninguém que faz copia e cola do Google sem nem entender direito.

  • O erro da questão é dizer que a mineração de dados é um processo de extração de conhecimento. Na verdade, ele descobre informações a partir de dados para que, a partir dessas informações extraídas, possa ser criado o conhecimento.


ID
136213
Banca
ESAF
Órgão
MPOG
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Mineração de Dados

Alternativas
Comentários
  •  

    Técnicas de mineração de dados:
    Classificação
        Consiste em construir um modelo de algum tipo que possa ser aplicado a dados não classificados visando categorizá-los em classes. Lida com resultados discretos. Exemplo: identificar a forma de tratamento na qual um paciente está mais propício a responder, baseando-se em classes de pacientes que respondem bem a determinado tipo de tratamento médico.
     
    Estimativa (ou regressão)
        É usada para definir um valor para alguma variável contínua desconhecida como, por exemplo, receita, altura ou saldo de cartão de crédito. Lida com resultados contínuos. 
     
    Associação
        Consiste em identificar e descrever associações entre variáveis no mesmo item ou associações entre itens diferentes que ocorram simultaneamente, de forma freqüente em banco de dados. É também comum a procura de associações entre itens durante um intervalo temporal.
        O exemplo clássico é determinar quais produtos costumam ser colocados juntos em um carrinho de supermercado.
     
    Segmentação (ou Clustering/Clusterização)
        É utilizada para separar os registros de uma base de dados em subconjuntos ou clusters (agrupamentos), de tal forma que os elementos de um cluster compartilhem propriedades comuns, que servem para distinguir os elementos em outros  clusters, tendo como objetivo maximizar similaridade intra-cluster e minimizar similaridade inter-cluster. Exemplo: Clientes por região de um país.
     
    Sumarização
        A sumarização procura identificar e indicar características comuns entre um conjunto de dados. Essa tarefa é aplicada nos agrupamentos obtidos na tarefa de segmentação. Exemplo: Tabular o significado e desvios padrão para todos os itens de dados.
  • TEC:

     

    Segundo Witten et. al. [1], a mineração de dados é definida como o processo de descoberta de padrões em dados. O processo deve ser automático, ou semiautomático, e os padrões descobertos devem possuir um significado, de forma a trazer alguma vantagem. Os dados devem estar presentes em grandes quantidades.

     

    As formas mais comuns de mineração de dados são [2]:

    Associação: Correlacionar a ocorrência de um fato com outro.

    Associação negativa: Correlacionar a ocorrência de um fato à não ocorrência de outro.

    Classificação: Classificar os dados automaticamente, em grupos pré-definidos. Também chamado de aprendizado supervisionado.

    Padrões de sequencia: Encontrar fatos que acontecem frequentemente após outros.

    Padrões temporais: Encontrar padrões de comportamento em determinados períodos de tempo.

    Clusterização: Dividir os dados em grupos de elementos similares. Também chamado de aprendizado não supervisionado.

    Regressão: É um tipo específico de classificação, usado para tentar deduzir o valor de uma variável, baseado nos valores de outras variáveis.

    Agora vejamos as alternativas:

     

    a) é uma forma de busca sequencial de dados em arquivos.

    Errado. Mineração de dados não é um mecanismo de busca.


    b) é o processo de programação de todos os relacionamentos e algoritmos existentes nas bases de dados.

    Errado. Tudo errado.


    c) por ser feita com métodos compiladores, método das redes neurais e método dos algoritmos gerativos.

    Errado. Não existem os conceitos de métodos compiladores, nem de algoritmos gerativos. Já as redes neurais podem ser usadas na mineração de dados.


    d) engloba as tarefas de mapeamento, inicialização e clusterização.

    Errado. Não existem as tarefas de mapeamento e inicialização.


    e) engloba as tarefas de classificação, regressão e clusterização.

    Certo. Como visto acima, estas são formas de mineração de dados.

     

    [1] Data Mining. Witten et. al. Terceira edição. Página 60.

    [2] Fundamentals of Database Systems. Elmasri e Navathe. Sexta edição. Página 1039

  • O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.


ID
137050
Banca
FGV
Órgão
Senado Federal
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Considerando as diferentes técnicas de mineração de dados, não é correto afirmar que:

Alternativas
Comentários
  • Essa definição da letra A, refere-se ao conceito de SUPORTE.

  • As regras de associação encontram-se entre um dosmais importantes tipos de conhecimento que podem ser minerados em bases de dados. Estas regras representam padrões de relacionamento entre itens de uma base de dados. Uma de suas típicas aplicações é a análise de transações de compras (market basket analysis)

  • Considero uma questão de tópicos avançados em Data Mining. Contudo, o conceito posto na letra "A" refere-se ao conceito de suporte e não confiança, como colocado. Vejam os dois conceitos abaixo:

    Várias métricas podem ser utilizadas para avaliar as regras (de associação) e identificar quais são interessantes. As restrições mais utilizadas são limiares mínimos de suporte e confiança.

    O suporte sup(X) de um conjunto X é definido como a proporção de transações da base de dados que contém esse conjunto. A confiança de uma regra é definida . Por exemplo, a regra  tem uma confiança de  na base de dados, o que significa que para 50% das transações que contém leite e pao a regra está correta. A confiança pode ser interpretada como uma estimativa de probabilidade , a probabilidade de encontrar o RHS da regra nas transações sobre a condição que essas transações também contenham LHS.2
    Os calculos acima referem-se a tabela de transações abaixo:
    Exemplo de base de dados com 4 itens e 5 transações. transação  leite  pão  manteiga  cerveja  1 1 1 0 0 2 0 1 1 0 3 0 0 0 1 4 1 1 1 0 5 0 1 0 0 fonte: http://pt.wikipedia.org/wiki/Regras_de_associação.
  • eu não encontrei erro na D, caso alguém saiba pode ajudar?

  • Suporte/prevalência = Frequência com que uma coisa ocorre -->

    Ex: 70% das compras de uma farmácia são de fraldas.

      

    Confiança = Probabilidade de relação entre entre itens -->

    Ex: Comprou uma televisão então existe uma probabilidade de comprar também um suporte de TV

     

    A questão diz:

    a) em Regras de Associação, confiança refere-se a quantas vezes uma regra de associação se verifica no conjunto de dados analisado.

     

    No caso, seria o SUPORTE, que diz a frequência com que uma coisa ocorre.

  • a) Este é o suporte! A confiança é a quantidade de vezes que a regra é verificada, dado que o evento antecedente ocorre. ERRADA

    b) Essas são técnicas citadas de análise multivariada, que é um tipo de análise estatística que pode ser empregada na mineração de dados, com o objetivo de se analisar o comportamento de mais de uma variável de resultado. O item é um pouco avançado, geralmente não há cobrança desse tipo em concursos que não são da área de TI! CERTA

    c) Na clusterização, podem ser usados vários métodos distintos para se medir a semelhança entre os itens, de modo a agrupá-los. Há muitos métodos avançados de se fazer isso, o que inclui esses tipos de medidas de correlação, distância ou associação. CERTA

    d) A classificação é um exemplo de um processo de aprendizado supervisionado, já que há um conjunto de dados de treinamento, a partir do qual o algoritmo é aplicado e a máquina consiga "aprender" a classificar a os demais registros nas classes predefinidas. No caso da clusterização (agrupamento), não há classes predefinidas nem conjunto de treinamento - o algoritmo irá determinar quais dados devem ser colocados em grupos iguais ou diferentes. CERTA

    e) Correto! Essa é a definição da regressão segundo Elmasri e Navathe. É como se fosse uma classificação, em que os rótulos de classe são os resultados possíveis para o evento a ser previsto. CERTA

  • O erro está na altenativa A. tenta confundir o candidato com os conceitos de suporte e confiança do algoritmo de regras de associação:

    refere-se ao conceito de suporte e não confiança, como colocado.

    O suporte que define quão frequente a regra acontece no banco de dados e a confiança que é a força da regra. 

    O Suporte é uma medida objetiva para avaliar o interesse de uma regra de associação. Representa a porcentagem de transações (%) de um banco de dados de transações onde a regra se verifica. 

    A Confiança é outra medida objetiva para regras de associação que mede o grau de certeza de uma associação. Em termos estatísticos, trata-se simplesmente da probabilidade condicional P (Y | X), isto é, a porcentagem de transações contendo os itens de X que também contêm os itens de Y.


ID
141244
Banca
ESAF
Órgão
ANA
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

Para que uma empresa efetue a análise regular de dados gerados por visitantes do seu site Web, a fim de personalizar a propaganda para clientes individualmente, ela deve utilizar

Alternativas
Comentários
  • Mineração de dados ou DM (Data Mining) é o processo de análise de um conjunto de dados que tem por objetivo a descoberta de padrões interessantes e que possam representar informações úteis.
    No caso em questão a página irá armazenar os itens "clicados" pelo cliente e posteriormente a partir deste dados, analisar estatisticamente, por exemplo, qual a área que ele tem maior interesse (ex: tecnologias, artigos de cama mesa e banho, vestuário), de posse desse conhecimento, quando o cliente acessar depois de um tempo aparecerão propagandas de objetos dentro da área de interesse dele (ex: promoção de notebook). Só para fechar com chave de ouro, este tipo de propaganda chama-se marketing direto.

ID
144640
Banca
CESPE / CEBRASPE
Órgão
SECONT-ES
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens a seguir, a respeito de sistemas de suporte a
decisão.

A mineração de dados (data mining) é uma das etapas do processo de descoberta de conhecimento em banco de dados. Nessa etapa, pode ser executada a técnica previsão, que consiste em repartir os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros.

Alternativas
Comentários
  • Está errado o trecho "a técnica previsão", pois de acordo com a descrição do texto, a técnica correta seria classificação (não é mencionado se é supervisionado ou não-supervisionado o qual se trata da técnica de agrupamento).

    Para quem não entendeu, segue abaixo um resumo mais detalhado que esquematiza essas técnicas e o processo de descoberta:

    Etapas do processo de descoberta de conhecimento (Knowledge discovery in Database - KDD):
    Entrada de Dados -> Pré-processamento -> Mineração -> Pós-processamento -> Informação

    1. Pré-processamento
    (seleção de atributos, redução de dimensionalidade, normalização, amostragem)
    2. Mineração
    (Aplicação de algoritmos de aprendizado por máquina):
    Técnicas: < Classificação - Agrupamento - Anomalias - Associações >

    2.1
    Classificação,
    ou classificação supervisionada: O conjunto de treinamento já possui uma classe. E.g.: Predizer espécie de uma flor dadas as características dela.
    2.2 Agrupamento (Clustering):
    O conjunto de treinamento não possui classe e é aprendido automaticamente pelo algoritmo, e.g. descoberta de centróides.
    2.3 Anomalias (Anomaly Detection):
    Aprende um padrão e detecta casos que extrapolam esse padrão, e.g. análise de fraude em cartões de crédito.
    2.4 Associação (Association Analysis):
    Aprende padrão de associação entre certos atributos e deriva uma regra, e.g. market basket analysis no Walmart - quem compra cerveja compra fraldas.

    3. Pós-processamento

    (Filtragem de padrões, visualização, interpretação de padrões).

    Fonte: Tan et al, Introdução ao Data Mining.
  • Nesse caso Previsão = Pediçaõ é uma meta e não uma etapa. Portanto resposta: ERRADO

  • Creio que seria uma técnica de descrição e não de previsão...

  • É realmente uma das etapas do KDD(Knowledge Discovery in Databases – Descoberta de Conhecimento em Bancos de Dados). No entanto, a técnica de repartir os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros é, na verdade, a técnica de classificação e, não, previsão.

    Gabarito: Errado

  • Previsão é um dos objetivos da mineração de dados. Sendo eles: predição, identificação, classificação e otimização. (P I C O)

    Já o que está descrição é uma técnica - especificação de como descobrir padrões- PREDITIVA de CLASSIFICAÇÃO. Essa última consiste em: cada instância ser dividida em coleções de atributos, que visa estabelecer categorias pré definidas antes da análise de dados a partir de conjunto de outros dados, bem como a distribuição dos dados nas categorias estabelecidas.

  • Previsão é um dos objetivos da mineração de dados, assim como identificação, classificação e otimização

  • OBJETIVOS DA MINERAÇÃO DE DADOS:

    PREVISAO = DADOS NO FUTURO.

    IDENTIFICAÇÃO= IDENTIFICAR A EXISTÊNCIA DE UM ITEM.

    CLASSIFICAÇÃO= PARTICIONAR DADOS, COLOCANDO EM CLASSES OU CATEGORIAS.

    OTIMIZAÇÃO= OTIMIZAR O USO DE RECURSOS.

    • A questão citou previsão, mas colocou o conceito de classificação.

    FONTE: Estúdio aulas, Léo Matos.

  • Gabarito: Errado.

    Se vai particionar os dados, trata-se da classificação.

    Bons estudos!

  • GAB E

    Falou em diferentes classes ou categorias (classificação).

  • ERRADO

    • Trata-se da técnica de CLASSIFICAÇÃO: consiste em repartir os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros.

    Predição = "prever o futuro" , visa descobrir o VALOR FUTURO de um determinado atributo, de acordo com experiências anteriores.

  • Mas a classificação é preditiva ora bolas. E dentro da classificação temos a baseada em particionamento. Não entendi o erro dessa questão.


ID
144958
Banca
CESPE / CEBRASPE
Órgão
INMETRO
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

Quanto aos tópicos avançados em tecnologia da informação, julgue os itens a seguir.

Entre as operações típicas realizadas em uma organização que adota a abordagem de business intelligence, destaca-se o uso de mineração de dados e a construção de datawarehouses, ambas empregrando bancos de dados relacionais com elevado grau de normalização.

Alternativas
Comentários
  • menor grau de normalização;
  • Complementando:

    Além de possuir menor normalização. Não é apenas em banco de dados relacionais, mas pode ser em multidimensionais :)
  • DW é marcado por guardar um grande volume de dados e por ser um instrumento de tomada de decisões de alto desempenho. Nesse contexto,  um alto grau de normalização demandaria muitos joins entre tabelas, resultando em consultas complexas e onerosas do ponto de vista temporal. Desta forma, é mais viável gerar modelos de DW com baixo de grau de normalização.

  • Na verdade, as informações em um DW são altamente desnomalizadas, para facilitar a realização de consultas as mais variadas possíveis.

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: ERRADO

     

    datawarehouses "apenas armazena tudo de sem organizar/normalizar nada";

     

    o erro esta em ...empregrando bancos de dados relacionais com elevado grau de normalização

  • Cuidado galera, não é apenas o DW que possui baixo grau de normalização não....
    Ambas empregam - em geral - bancos de dados multidimensionais com baixo grau de normalização (alta redundância de dados).

  • Opa! Ambas empregam – em geral – bancos de dados multidimensionais com baixo grau de normalização (alta redundância de dados). 

  • Possuem um baixo grau de normalização.

  • NORMALIZAÇÃO = controle de redundância = repetição de informações.

  • APENAS PRA COMPLEMENTAR O COMENTÁRIO DO CHRISTIANO ROÇADOR.

    OUTRAS FORMAS DE REDUZIR A QUANTIDADE DE JOINS ENTRE AS TABELAS, SERIA A UTILIZAÇÃO DA ÁLGEBRA RELACIONAL.

    LECIONA NAVATHE, 6ª EDIÇÃO, PÁGINA 424:

    Uma das principais regras heurísticas é aplicar as operações SELECT e PROJECT antes de aplicar o JOIN ou outras operações binárias. Isso se deve ao tamanho do arquivo resultante de uma operação binária — tal como o JOIN —, que geralmente é uma função multiplicativa dos tamanhos dos arquivos de entrada. As operações SELECT e PROJECT reduzem o tamanho de um arquivo e, por isso, devem ser aplicadas antes de uma junção ou outra operação binária.

  • Gabarito: E

    Data warehouse

    • Dados desnormalizados (diferentemente dos BD relacionais)
    • Histórico
    • Não volátil
    • É um armazém de dados (dados estruturados, semiestruturados e não-estruturados)
    • Para consulta de dados
    • Orientando a assuntos
    • Integrado

    Data minig

    • Técnica utiliza para mineração de dados de um BD ou DW... (pode ser de outros)
    • Busca informações úteis
    • Informações novas (e não históricas, liga-te, macho)
    • Técnicas preditivas, descritivas, prescritivas e diagnósticas
  • DATA WAREHOUSE E NORMALIZAÇÃO. SE JOGAR NO WORD, DÁ ERRO DE SINTAXE.

  • Em 17/03/21 às 14:31, você respondeu a opção C.

    Em 13/04/21 às 08:16, você respondeu a opção E.

    Há um mês, olhava para uma questão dessa e tremia na base.

    Hoje, virou brincadeira de criança.

    Deus recompensa quem se esforça.

  • Ambas empregam – em geral – bancos de dados multidimensionais com baixo grau de

    normalização (alta redundância de dados).

  • e-

    Data warehouses often use denormalized or partially denormalized schemas (such as a star schema) to optimize query performance. OLTP systems often use fully normalized schemas to optimize update/insert/delete performance, and to guarantee data consistency.

    https://docs.oracle.com/cd/B10500_01/server.920/a96520/concept.htm


ID
153967
Banca
FCC
Órgão
MPE-RN
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

A inteligência do negócio (eventualmente mais conhecida como Business Intelligence)

I. é construída quando a arquitetura de TI especificamente orienta-se para os interesses ou especialidades do negócio de forma exclusiva.

II. utiliza ferramentas que consolidam, analisam e acessam vastas quantidades de dados para ajudar os usuários a tomar melhores decisões empresariais.

III. utiliza como principais ferramentas os softwares para consulta e relatórios de banco de dados, ferramentas para análise multidimensional de dados e o data mining.

IV. confere às empresas a capacidade de acumular informações; adquirir conhecimentos sobre clientes, concorrentes e operações internas; e mudar o comportamento de tomada de decisão a fim de alcançar maior lucratividade e outras metas corporativas.

Está correto o que se afirma em

Alternativas
Comentários
  • Eu acertei essa questão, mas confesso que achei a alternativa A) meio extremista. Alguém poderia comentá-la explicando o porque dela ser verdadeira?

    Abraço e bons estudos.
  • Também errei esta questão por achar a expressão "forma exclusiva" da alternativa "A" forte demais.
    Alguém sabe se esta questão foi pra recurso?
  • Errei essa questão por entender que se tratava da TI da organização e por ser de toda a organização não poderia a arquitetura de TI ser exclusiva da área de negócio. Porém, ao  analisar melhor (depois de saber do erro, hehehe), percebe-se que trata-se da arquitetura de TI para o BI e nesse sentido deve ser realmente específica para a área de negócio da organização, onde é possível gerar conhecimento e por consequêcia diferencial competitivo em relação às demais empresas concorrentes.
    Um exemplo de arquitetura de TI específica é ter um DW com dados específicos da área de negócio da empresa. BI não funciona bem com BD transacional ou ainda, qual o diferencial estratégico (conhecimento) que o BI fornecerá a uma empresa em relação aos seus concorrentes se analisar um DW sobre folha de pagamento.
  • I. é construída quando a arquitetura de TI especificamente orienta-se para os interesses ou especialidades do negócio de forma exclusiva.

    Texto base
    Inteligência empresarial
    (em inglês Business Intelligence), refere-se ao processo de coleta, organização, análise, compartilhamento e monitoramento de informações que oferecem suporte a gestão de negócios.

    Acredito que esta afirmação foi baseada no conceito de inteligência empresarial(Business Inteligence) retirado do wikipédia.
    http://pt.wikipedia.org/wiki/Intelig%C3%AAncia_empresarial
  • Considero a opção I mal escrita.
    É fato que a TI vive uma crise, pois muitas de suas iniciativas não são incentivadas pela área fim. BPM e GP, por exemplo, são iniciativas que geralmente partem da TI e conquistam os gestores da área fim. Assim, a TI dificilmente é exclusiva do negócio atualmente.
    Sobre a pção III.
    Cadê as ferramentas de ETL que não entram no grupo das principais?

    Mais que bons estudos, boa sorte!
  • O conceito de BI no item I pode até ser condizente com o conceito, mas também acho a forma "exclusiva" um pouco demais, pois no meu entender, uma equipe de BI, por gerar informações para o nível estratégico da empresa, pode estar de olho, além da concorrência, em negócios de outras áreas (e não só para a especialidade do negócio atual da empresa). Mas esse tipo de coisa não se encontra em livros...

  • "interesses ou especialidades do negócio" abrange praticamente tudo. Quem pode determinar, por exemplo, o que é e o que não é interesse de determinado negócio? Sendo assim, é uma afirmação que parece ser excludente, mas, na verdade, é abrange. No final, ela diz que a TI está orientada de forma exclusiva para TUDO.

  • I acredito se referir a característica ORIENTAÇÃO POR ASSUNTO.
  • A TI tem que estar alinhada ao negócio. Creio que seja isso. A palavra exclusiva que dá um pouco de medo de marcar correto, e também pelo que vemos na prática, mas deveria ser sempre voltado ao negócio (mesmo sendo uma área meio, que seja tudo para um fim estratégico e de negócio).

  • não concordo com a I, a TI está alinhada ao negócio, mas também pode influenciar o negócio [Aragon]


ID
191821
Banca
CESGRANRIO
Órgão
ELETROBRAS
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Em uma reunião sobre prospecção de novos pontos de venda, um analista de TI afirmou que técnicas OLAP de análise de dados são orientadas a oferecer informações, assinalando detalhes intrínsecos e facilitando a agregação de valores, ao passo que técnicas de data mining tem como objetivo

Alternativas
Comentários
  •  Data Mining ou Mineração de Dados consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados. O processo consiste basicamente em 3 etapas: exploração; construção de modelo ou definição do padrão; e validação/verificação.


ID
191824
Banca
CESGRANRIO
Órgão
ELETROBRAS
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

O processo de agrupamento de dados em data mining deve preencher alguns poucos requisitos. Qual requisito permite a análise de um subconjunto de dados que contém não apenas atributos numéricos, mas também atributos categóricos?

Alternativas
Comentários
  • Só encontrei algo relacionado no fórum TiMasters.
    Transcrevo:

    "
    Re: [timasters] [Questao] Data Mining - CESGRANRIO - 2010 - ELETROBRÁS - Analista de Sistemas - FUNCIONAL SAP-ERP
    Uai...

    O data mining é a mineração dos dados, ou seja, ele recupera os dados que
    lhe interessa.
    Se os dados (atributos) que interessa são tanto numéricos quanto categóricos
    (por categoria), esse data mining tem flexibilidade.

    Em uma empresa, pode haver muitos bancos de dados com muitas informações. No
    processo de Extract do DataWare House (ETL - extract, transform, load),
    dados são extraídos dos bancos de dados. Qualquer informação que pareça
    importante é recuperado. Essa flexibilidade é porque os dados recuperados
    podem ser tanto numéricos, nomes (Strings), textos e etc.
    2011/8/1 José Tiago Rolim <tiagorolim@...>
    "
  • GAB: A

    FLEXIBILIDADE: TRABALHAR COM VARIOS FORMATOS DE DADOS


ID
211030
Banca
CESPE / CEBRASPE
Órgão
MPU
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de data warehouse (DW) e data mining (DM), julgue os
próximos itens.

A tecnologia DM, que, atualmente, está totalmente integrada aos SGBD, permite a descoberta de informações, por meio de padrões ou regras existentes em banco de dados de grande volume, quando não se conhece o esquema do banco de dados.

Alternativas
Comentários
  • Errada, pois é preciso conhecer o esquema do banco de dados.

  • Um esquema do bancos de dados é uma coleção de objetos de um banco de dados que estão disponíveis para um determinado usuário ou grupo. Os objetos de um esquema são estruturas lógicas que se referem diretamente aos dados do banco de dados. Eles incluem estruturas, tais como tabelas, visões, seqüências, procedimentos armazenados, sinônimos, índices, agrupamentos e links de banco de dados. 
  • No livro do Navathe tem essa passagem:

    "As the term connotes, data mining refers to the mining or discovery of new information
    in terms of patterns or rules from vast amounts of data. To be practically useful, data
    mining must be carried out efficiently on large files and databases. To date, it is not wellintegrated
    with database management systems."

    Então o erro é que a DM não está totalmente integrada aos SGBDs
  • Pessoal a questão tocou em ponto polemico ao falar que Data Mining é totalmente integrado com SGBDs. Se a questão afirmasse apenas isso, não marcaria nem certo ou errado, pois provas do CESPE são muito subjetivas (a banca decide -.-).

    Porém se observarmos a passagem: "por meio de padrões ou regras existentes" Isso tornou a questão flagrantemente errada, pois o processo de Data Mining busca exatamente encontrar padrões e regras que, previamente, não existiam.

    Espero ter ajudado. Abraço!
  • A questão "morre" já no começo: "está totalmente integrada aos SGBD,"

    Segundo Navathe:

    "Embora alguns recursos de mineração de dados estejam sendo fornecidos em SGBD, ela não é bem integrada aos sistemas de gerenciamento de banco de dados"

    (Sistemas de Banco de Dados, 6 ed, pag 698).
  • É como Marcelo Souza informou acima, o erro da questão está em dizer que está totalmente integrada ao SGBD
  • Segundo[1], vários critérios são normalmente utilizados para classificar os SGBDs. O primeiro é o modelo de dados no qual o SGBD é baseado; o segundo é o número de usuários suportados pelo sistema; o terceiro critério é o número de locais sobre os quais o banco de dados está distribuído e o quarto critério é o custo. Hoje, temos SGBDs de código aberto (gratuito), como MySQI. e PostgreSQl.

    Os sistemas gigantes estão sendo vendidos em formato modular, com componentes para lidar com distribuição, replicação, processamento paralelo, capacidade móvel, e assim por diante. Além disso, recursos de data warehousing e mineração de dados, bem como o suporte para tipos de dados adicionais, estão disponíveis a um custo extra. E possível pagar milhões de dólares anualmente pela instalação e manutenção de grandes sistemas de banco de dados.

    O trecho em negrito já responde à pergunta. Apenas grandes bancos têm esse recurso plenamente integrado, mas não SGBDs de uma forma geral.

    Fonte:

    [1] SBD, E&N, 6ed.

  • A tecnologia DM, que, atualmente, está totalmente integrada aos SGBD, permite a descoberta de informações, por meio de padrões ou regras existentes em banco de dados de grande volume, quando não se conhece o esquema do banco de dados.

  • Será possível que eu vou ter que ler esse diabo de ''navathe''...?

  • ESSAS QUESTÕES TAXATIVAS TÊM UMA CARINHA DE ERRADA.

  • Segundo Navathe, página 698 - 6° ed.:

    • Embora alguns recursos de mineração de dados estejam sendo fornecidos em SGBDRs, ela não é bem integrada aos sistemas de gerenciamento de banco de dados.

    Q204362 - Existe uma integração total entre a tecnologia data mining e todos os SGBDs que permite a qualquer usuário, até mesmo aos que desconhecem o esquema de dados de um banco em SQL, descobrir informações nele existentes = E.

    Gabarito errado.


ID
211033
Banca
CESPE / CEBRASPE
Órgão
MPU
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de data warehouse (DW) e data mining (DM), julgue os
próximos itens.

As funções especiais ROLAP (OLAP relacional) e MOLAP (OLAP multidimensional), as extensões SQL e os métodos de junção (join) são ferramentas que podem ser utilizadas para aumentar a eficiência das consultas em bases de dados multidimensionais.

Alternativas
Comentários
  • Navathe, 6a Edição, página 729.
  • Procurei no livro que o colega citou só que na versão 3:

    Because data warehouses are free from the restrictions of the transactional environment there is an 
    increased efficiency in query processing. Among the tools and techniques used are: query 
    transformation, index intersection and union, special ROLAP (relational OLAP) and MOLAP 
    (multidimensional OLAP) functions, SQL extensions, advanced join methods, and intelligent scanning 
    (as in piggy-backing multiple queries).  

    Tenho uma observação, pois a questão cita "métodos de junção (join)" o que é diferente de métodos de junção avançados. Tudo bem que métodos de junção avançados são métodos de junção(!) mas isso dá margem para interpretação dúbia, pois utilizar join para "aumentar a eficiência das consultadas em bases de dados multidimensionais" não é, necessariamente, uma verdade. Ou seja, um select somente na fato é bem mais rápido do que fazer um select na fato com join na dimensão.


     
  • Fiquei com dúvida nessa questão, pois ela tratou os conceitos de ROLAP e MOLAP  como funções? Isso ficou estranho.
  • O Silberschatz trata MOLAP e ROLAP como sistemas e não como função. Mas enfim, CESPE é capciosa.  
  • ROLAP: possuem uma engenharia de acesso aos dados e análise OLAP com uma arquitetura um pouco diferente. Nesse caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no servidor. O que podemos notar nesse caso é que o processamento OLAP se dará somente no servidor. A principal vantagem dessa arquitetura é que ela permite analisar enormes volumes de dados, em contra partida uma grande quantidade de usuários acessando simultaneamente poderá causar sérios problemas de performance no servidor cau- sando, inclusive, o travamento do mesmo.

    Neste caso ROLAP não aumenta a eficiência das consultas

    por isso marquei errado, muito duvidosa essa questão
  • Questão sacana,

    MOLAP e ROLAP são modelos ou sistemas de implementação OLAP. Marquei errado por isso.

    Porém, no SQL existe as FUNÇOES MOLAP e ROLAP. O avaliador estava se referindo a estas funções.


  • Errei por achar que "join" não aumenta a eficiência das consultas e sim diminui :/

  • Também concordo com o colega abaixo, pois o join ocasiona a queda no desempenho de consultas.

  • Questão mal feita! De acordo com Navathe (6ª ed, página 729):

    "Como os data warehouses são livres de restrições do ambiente transacional, existe uma eficiência aumentada no processamento da consulta. Entre as ferramentas e técnicas usadas estão a transformação de consulta, interseção e união de índice; funções especiais ROLAP (OLAP relacional) e MOLAP (OLAP multidimensional); extensões SQL; métodos de junção avançados; e varredura inteligente (como no acréscimo de consultas múltiplas)."

    Ou seja, de acordo com o texto:

    A eficiência é aumentada não pelo uso das ferramentas citadas (join diminui o desempenho), mas porque o data warehouse é livre de restrições do ambiente transacional.

  • Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.

    Gaba: CERTO

  • GABARITO QUESTIONÁVEL. HAJA VISTA QUE UMA DAS VANTAGENS DE SE UTILIZAR BD MULTIDIMENSIONAL É O FATO DE REDUZIRMOS A QUANTIDADE DE JOINS ENTRE AS TABELAS.


ID
226321
Banca
CESGRANRIO
Órgão
EPE
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Uma empresa deseja realizar mineração de dados (data mining), principalmente para análise de seu cadastro de clientes. Qual software é apropriado para isso?

Alternativas
Comentários
  • WEKA = Software livre em java para mineração de dados
    Sharepoint Services = componente do Windows Server 2003 que ajuda empresas a aumentarem sua produtividade individual e em equipe, permitindo a criação de sites para compartilhar informações e obter colaboração em documentos.
    Crystal Reports = ferramenta que permite a criação de relatórios.
    ArcGIS =
    grupo de programas que constitui um sistema de informações geográfico.
    OpenID = sistema de identificação na qual a identidade do utilizador é dada por uma URL ou XRIque pode ser verificada por qualquer servidor executando o protocolo.

ID
229942
Banca
UFF
Órgão
UFF
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

O conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização é conhecido como:

Alternativas
Comentários
  • Data mining é a principal etapa do processo de descoberta de conhecimento em bases de dados, sendo responsável pela busca efetiva de conhecimento a partir da base de dados. Esta área descende fundamentalmente de três linhas a estatística clássica, a
    inteligência artificial e o aprendizado de máquina [Serra 2002].

    Essa combinação de práticas estatísticas, cálculos de probabilidade e princípios de inteligência artificial são usadas em conjunto para a busca de informações relevantes em uma coleção de dados por meio da utilização de data mining.

  • Gabarito: E

     

    Data Mining: Data Mining ou Mineração de Dados, se refere as ferramentas com capacidade de descoberta de conhecimento relevante dentro do DW. Encontram correlações e padrões dentro dos dados armazenados.

  • (Q290898) Ano: 2012 Banca: CESPE Órgão: TJ-AC Prova: Analista Judiciário - Análise de Sistemas

    O data mining possibilita analisar dados para obtenção de resultados estatísticos que poderão gerar novas oportunidades ao negócio. (C)

  • Para análise de padrão de comportamento, usa-se o Data Mining, embora outros tipos de mineração de dados possam ser usados, isoladamente ou não.


ID
236332
Banca
FCC
Órgão
TCE-SP
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

NÃO é um objetivo da mineração de dados (mining), na visão dos diversos autores,

Alternativas
Comentários
  • O Data Mining não produz efeitos no banco transacional. Ele faz uma filtragem (mineração) dos dados deste banco, que resulta numa base nova com dados específicos, pertinentes, não redundantes, que vão então, finalmente, auxiliar a organização a obter a partir daí informações úteis. Por exemplo: Saber que todo mundo que compra cerveja em um supermercado também compra fralda descartável. O supermercado coloca as fraldas perto das cervejas e a venda de fraldas aumenta. Não é o melhor exemplo, mas ilustra bem.

    Abraços
  • a) Essa é uma propriedade da normalização! A mineração de dados não visa modificar os dados nos bancos de dados transacionais para diminuir redundâncias, mas sim analisar os conjuntos de dados de forma a detectar padrões e relacionamentos ocultos. ERRADA

    b) Isso pode ser atingido através da modelagem preditiva. CERTA

    c) Os padrões sequenciais podem sim ser identificados e analisados com o auxílio de mineração de dados! CERTA

    d) A clusterização é uma técnica adequada para a realização dessa tarefa, pois irá agrupar os clientes que apresentam perfis semelhantes entre si, mas diferentes dos demais. CERTA

    e) Bem, como a mineração de dados permite subsidiar a tomada de decisão estratégica, para que esta seja mais eficiente, pode-se dizer que a decisão se torna mais precisa, eliminando desperdícios e maximizando resultados. CERTA

    Gabarito: A

  • OBJETIVOS do DATA MINING:

    P.I.C.O

    Previsão: possibilitar a análise de determinados padrões de eventos.

    Identificação: conhecer o comportamento de certos atributos no futuro.

    Classificação: categorizar perfis individuais ou coletivos de interesse comercial.

    Otimização: apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa.

  • (a) Errado, esse é o objetivo do processo de normalização – não há nenhuma relação com mineração

    de dados; (b) Correto, esse é objetivo de Previsão; (c) Correto, esse é o objetivo de identificação; (d)

    Correto, esse é o objetivo de classificação; (e) Correto, esse é o objetivo de Otimização.


ID
236335
Banca
FCC
Órgão
TCE-SP
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

A data mining apoia o conhecimento indutivo que pode ser representado por

I. Lógica proposicional.

II. Árvores de decisão.

III. Redes neurais.

IV. Redes semânticas.

Está correto o que consta em

Alternativas
Comentários

  • "A data Mining apóia o conhecimento indutivo, que descobre novas regras e padrões nos dados fornecidos.
    O conhecimento pode ser representado de muitas formas.
    Em um senso não estruturado, pode ser representado por regras ou por lógica proposicional.
    Em uma forma estruturada, pode ser representado por árvores de decisão, redes semânticas, redes neurais ou hierarquias de classes ou frames."


    Fonte: Sistema de Bando de Dados - Elmasri e Navathe - 4 ed, Conceitos de Data Mining, pág. 626.

ID
236338
Banca
FCC
Órgão
TCE-SP
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

No âmbito dos algoritmos associados ao mining, se houver um banco de dados com um número potencial pequeno de conjuntos de itens grandes, isto é, uns poucos milhares, então o suporte para todos eles pode ser testado em uma passagem usando a técnica específica de

Alternativas
Comentários
  • GAB: B

     

    Os métodos de particionamento buscam encontrar a melhor partição dos n objetos em k grupos. Normalmente os k clusters encontrados são de melhor qualidade do que os  k clusters produzidos pelos métodos hierárquicos. Estes métodos apresentam um maior desempenho e por isso os algoritmos que implementam esse método têm sido mais investigados e utilizados [NG 94]. Os métodos de particionamento mais utilizados são baseados em um ponto central (média dos atributos dos objetos – K-means) ou em um objeto representativo para o cluster (k-medoids).

     

     Fonte: NG, R. T.; HAN, J. Efficient and Effecctive Clustering Methods for Spatial Data Mining. In: Twentieth International Conference on Very Large Data Base, Santiago, 1994.

  • Aí vai mais uma retirada na integra do livro texto de referência:

    "Se tivermos um banco de dados com um número potencial pequeno de conjuntos de itens grandes, digamos, uns poucos milhares, então o suporte para todos eles pode ser testado em uma passagem usando a técnica de partição."

    Sistema de Bando de Dados - Elmasri e Navathe - 4 ed, Conceitos de Data Mining, pág. 632.

ID
236341
Banca
FCC
Órgão
TCE-SP
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Uma das abordagens de mining define que, se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada

Alternativas
Comentários
  • A regressão, para Elmasri (2005), é uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada regressão. Isto ocorre quando, ao invés de mapear um registro de dados para uma classe específica, o valor da variável é previsto (calculado) baseado em outros atributos do próprio registro. Para o autor, a descoberta da função para prever ou calcular a variável de destino é equivalente a uma operação de data mining
  • A FCC ama a definição de data mining do livro:
    Sistema de Banco de Dados. Ramez Elmasri, Shamkant B. Navathe. 4 ed.
    Cáp. 27: Conceitos de data mining
    pág. 639
    "Regressão é uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada regressão. Uma aplicação de regressão ocorre quando, em vez de mapear uma tupla de dados de uma relação para uma classe específica, o valor da variável é previsto baseado naquela tupla."
  • O enunciado ficou horrível de se entender.
  • Vivendo e aprendendo. Mas que dava para marcar categorização, isso dava!
  • Para quem tem a 6 edição  em vez da 4 citada pelo colega do livro do Navathe a resposta está na página 714, item 28.5.3 Regressão.

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-6 EDIÇÃO 2011

  • Técnicas e Tarefas de Mineração de Dados

    As tarefas básicas da mineração de dados, e seus respectivos objetivos principais, são:


    •  Classificação: predizer a classe de um item;
    •  Regressão: prever um valor numérico contínuo;
    •  Associação: encontrar padrões de ocorrências de dados associados;
    •  Análise de agrupamentos (Clusterização): encontrar grupos nos dados;
    •  Detecção de anomalias (Detecção de Desvio): encontrar alterações nos 
    dados.

     

    www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão

  • A regressão, segundo Elmasri & Navathe (2011), é um caso especial da classificação. Veja, em tradução livre, o que é dito no livro:

    A regressão é uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada regressão. Uma aplicação de regressão ocorre quando, em vez de mapear uma tupla de dados de uma relação para uma classe específica, o valor da variável é previsto baseado naquela tupla.

    Os autores dão um exemplo em que a função de regressão prevê o resultado de um exame médico futuro com base nos vários resultados de exames iguais que o paciente já realizou no passado.

    A questão é difícil, pois cobra a literalidade de um trecho de livro sem contexto algum. De qualquer forma, como é muito antiga, eu não espero que a cobrança seja mais nesse estilo. A FCC tem se afastado desse tipo de cobrança e elaborado provas menos “copia e cola”.

    Gabarito: D

  • Gabarito: D.

    A banca copiou e colou um trecho do livro do Navathe.

    A regressão é uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre as variáveis, que mapeia essas variáveis em uma variável de classe de destino, a regra é denominada regra de regressão.

    Fonte: Navathe (2011), Sistemas de Banco de Dados, 6a ed, pág. 714.

    Bons estudos!

  • A questão quer saber qual regra de classificação é uma função sobre variáveis que mapeia em uma classe destino.

    "Regressão é uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada regressão. Uma aplicação de regressão ocorre quando, em vez de mapear uma tupla de dados de uma relação para uma classe específica, o valor da variável é previsto baseado naquela tupla." Sistema de Banco de Dados. Ramez Elmasri, Shamkant B. Navathe. 4 ed pág. 639

    Sendo assim,

    Gab. D) Regressão


ID
236344
Banca
FCC
Órgão
TCE-SP
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Considere uma dada população de eventos ou novos itens que podem ser particionados (segmentados) em conjuntos de elementos similares, tal como, por exemplo, uma população de dados sobre uma doença que pode ser dividida em grupos baseados na similaridade dos efeitos colaterias produzidos. Como um dos modos de descrever o conhecimento descoberto durante a data mining este é chamado de

Alternativas
Comentários
  • Uma das técnicas estatísticas utilizadas em  Data Mining é Clustering  (Análise de Cluster,
    ou agrupamentos).  Clustering é um ramo da Estatística Multivariada que engloba
    métodos utilizados para descobrir estruturas em um conjunto complexo de dados. O
    objetivo principal de  clustering é separar objetos ou observações em classes naturais de
    forma que os elementos pertencentes a um mesmo grupo tenham um alto grau de
    semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos
    distintos, tenham pouca semelhança entre si (Andeberg, 1973).
    O atrativo dos métodos de  clustering para tarefas de mineração de dados é a sua
    habilidade de extrair estruturas diretamente dos dados, sem nenhum conhecimento
    prévio. Métodos de  clustering para  Data Mining, são utilizados com modificações em
    relação aos algoritmos tradicionais, sobretudo visando aumentar sua eficiência, diante
    da quantidade de objetos a serem classificados no contexto de  Data Mining (Ng e Han,
    1994) (Koperski, et al., 1997) (Zhang et al., 2001).
  • O maravilha mais uma questão retirada literalmente de uma bibliografia consagrada

    Vamos lá:
    "Clustering(Agrupando) - uma dada população de eventos ou novos itens particonados(segmentados) em conjunto de elementos 'similares' . Exemplos:(1) \uma população de dados sobre o tratamento de uma doença pode ser dividida em grupos baseados na similiaridade dos efeitos colaterais produzidos.(...)" - Sistemas de banco de Dados - Elmasri e Navathe 4ª ed pag 627

    Fácil para quem estudou pelo livro e fez seu "bizurado" resumo

    Vamos a oração do concurseiro de TI

    "Senhor me dê sabedoria para descobrir o material correto a ser estudado,
    recursos para adquiri-los
    paciencia para estuda-los
    Tire de mim toda a vontade de pesquisar no Goggle
    e me mantenha firme nas bibliografias corretas

    Amém"

  • Apenas para complementar...  A diferença entre "cluestering" e "classificação":

    - Agregação(ou clustering ou agrupamento) consiste na busca de similaridades entre os dados tal que permita definir um conjunto finito de classes ou categorias que os contenha e os descreva. A principal diferença entre esta abordagem e classificação é que em agregação não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem. Descobrir grupos homogêneos de clientes é uma das possíveis aplicações e pode ser usada para ajudar na definição da estratégia de marketing a ser adotada.
  • Gostei da oração kkkkkkkk

  • Realmente, fiquei na dúvida entre classificação e clustering.

    Apesar de ter estudado o data mining pelo livro do Elmasri, eu aprendi somente o conceito de classificação e agrupamento (clustering), sabendo diferenciar que no caso do agrupamento (clustering) as classificações são feitas de forma automática, também chamada de classificação não supervisionada. Em outras palavras, não se tem conhecimento prévio dos grupos possíveis de classificação e o próprio mining através do agrupamento realiza a classificação sozinho.

    Em nenhum momento eu li na questão as palavras-chaves: segmentação automática, segmentação não supervisionada, segmentação sem conhecimento prévio...

    Portanto, continuo entendendo que a resposta correta dessa questão seja a letra c) classificação.

  • Letra D

     

    Palavras-Chaves para ajudar na resposta:


    Classificação = CLASSE, CATEGORIA, CATEGORIZAR
    Estimação = USO DE VALORES NÚMERICOS, ESTIMAR VALOR
    Predição = MAPEAMENTO de valores ASSOCIADOS aos dados
    Clustering = APROXIMAR REGISTROS SIMILARES
    Associação = ATRIBUTOS RELACIONADOS

  • Análise de Clusters (Agrupamentos)
    • Consiste em identificar agrupamentos de objetos, estes que identificam uma classe.
    • Trabalha sobre dados onde as etiquetas das classes não estão definidas.
    • Conhecido também por aprendizado não supervisionado e, às vezes, chamado de classificação por estatísticos e de segmentação por pessoas de marketing.

     

    Tipos de Agrupamento
    • Algoritmos Particionais:
    – Construir diversas partições e avaliá-las com algum critério
    • Algoritmos Hierárquicos:
    – Criar uma decomposição hierárquica de um conjunto de objetos utilizando algum critério

     

    Fonte: Itnerante

  • A técnica da mineração de dados que divide os elementos de dados em grupos de acordo com sua similaridade é a clusterização, também conhecida como análise de agrupamentos ou de conglomerados. É uma técnica relacionada ao aprendizado não supervisionado e seus grupos não são definidos a priori.

    Gabarito: D

  • Falou em divisão em grupos similares, marca clusterização sem medo.

  • O enunciado não deixa claro se as classes de mapeamento são pré ou pós definidas. Mas como é literal do livro-base do assunto, não tem o que discutir. Imagino eu que, no livro, esteja melhor contextualizado o parágrafo.


ID
245242
Banca
CESPE / CEBRASPE
Órgão
TRT - 21ª Região (RN)
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de sistemas de suporte a decisão e data warehousing, julgue
os itens a seguir.

O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.

Alternativas
Comentários
  • Provavelmente entraram com recurso para essa questão.

    Data Mining é um processo semi-automático.

    Nas palavras de Silberschatz, Korth e Sudarshan ( Sistema de Banco de Dados, Pág 497)

    "Normalmente existe um componente manual para a mineração de dados, consistindo no pré-processamento dos dados para um formato aceitável aos algoritmos... Por esse motivo, a mineração de dados é na realidade um processo semi-automático na vida real."

    Talvez a banca tenha se baseado na última frase que ele disse:

    "Porém, em nossa descrição nos concentraremos no aspecto automático da mineração"

     

    Então a questão deveria ter sído formulada assim:

    Fora da vida real, o data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.

  • Concordo plenamente com o amigo. O data mining não é um método automático e sim semi-automático, já que exige a intervenção dos profissionais de TI e dos especialistas do domínio.
  • Segundo Berry e Linoff (1997), em Data Mining Techniques: For Marketing, Sales and Customer Suport; o data mining corresponde à exploração e análise, por meios automáticos e semi-automáticos, de grandes quantidades de dados a fim de descobrir  padrões e regras significativas.
     Na edição de 2011, dos mesmos autores, o conceito de data mining está como um processo de negócio  para explorar grandes quantidades de dados para descobrir padroões e regras significativas.
  • Concordo com T. Renegado. Inclusive no livro do Silberschatz é citado que existe um componente manual para a mineração de dados, que consiste no pré-processamento dos dados para um formato aceitável aos algoritmos en no pós-processamento de padrões descobertos para encontrar outros que poderiam ser úteis.  
  • Apenas acrescentando o excelente comentário do colega, como o processo do data mining pode ser considerado automático e semi-automático, a questão não nega o fato dele não ser semi-automático, ficaria errado caso fosse dito é um processo unicamente automático. Prova do CESPE tem disso galera, tem que ficar esperto, as vezes não mencionar uma informação não caracteriza erro.

    Bons estudos
  • Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.

    Gaba: CORRETO

  • Tem "discussão" a respeito de ser ou não automático, porque na realidade não é...rsss, mas tem autor renomado que publicou que DATA MINING é automático, então levo p prova CESPE.

     

    "Data Mining Techniques: For Marketing, Sales, and Customer Support

    1997 - A mineração de dados é a exploração e análise, por meios automáticos ou semiautomático, de grandes quantidades de dados a fim de descobrir padrões e regras significativas."

  • Cespe, é ou nao é automatico? se decide!

     

  • Melhor resposta é a do colega Frederico Diniz

    Apenas acrescentando o excelente comentário do colega, como o processo do Data Mining pode ser considerado automático e semi-automático, a questão não nega o fato dele não ser semi-automático, ficaria errado caso fosse dito é um processo unicamente automático. Prova do CESPE tem disso galera, tem que ficar esperto, as vezes não mencionar uma informação não caracteriza erro.

  • resumindo: briga de gigantes, autores renomados X autores renomados

  • Creio que hoje essa questão seria considerada errada pela mudança de posicionamento dos autores com relação a palavra AUTOMÁTICA. Hodiernamente considera-se uma falácia. Segue resumo extraído de comentários de colegas.

    FALÁCIAS DE DATA MINING:

     

    *Data mining é automático: pelo contrário, data mining é interativo, é um processo que requer supervisão

     

    *Data mining pode identificar problemas no negócio: ele pode encontrar padrões e fenômenos, identificar problemas deve ser feito por especialistas

     

    *Investimentos são recuperados rapidamente: não pode ser afirmado pois depende de inúmeros fatores

     

    *Software são intuitivos e simples: é mais importante conhecer os algorítmos e o negócio em si

  • Pessoas conjecturam muito que prova do cespe é isso ou aquilo. Provavelmente a verdade é que uma cambada de professores elabora questões baseados em livros diferentes, com entendimentos divergentes, jogam o gabarito que bem entendem, o candidato entra com recurso e o CESPE nega, para não se dar ao trabalho.

    Isso cheira a mais falta de organização e má-vontade na avaliação das questões do que algo pensado. Afinal, haveria alguém ou alguma autoridade/lei para fiscalizar concursos? Vocês já sabem a resposta.

  • Quem sabe, sabe: essa banca é muito prepotente, prefere anular uma questão a assumir o erro

  • Entendimento recente do cespe sobre o assunto:

    "Pode" ter processos automáticos( algoritmos) ou [semi-automáticos (regra)]

    (CESPE - 2014 - TJ-SE)

    Assim como o DataMining, os DataMarts são voltados para a obtenção de informações estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir da análise de dados oriundos de DataWarehouses.Errado

    -->Datamarts compôem um Dw .

    (CESPE - 2013 - SERPRO)

    Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante racionalização e potencialização por meio de dois componentes: organização e tecnologia. Errado

    (CESPE: TJ-ESProva 2011)

    Mineração de dados, em seu conceito pleno, consiste na realização, de forma manual, de sucessivas consultas ao banco de dados com o objetivo de descobrir padrões úteis, mas não necessariamente novos, para auxílio à tomada de decisão. Errada

  • 72% acertos ainda.

  • CERTO

    As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.

    O data mining consiste no processo virtual em que uma máquina realiza de maneira programada a prospecção e coleta de dados no ambiente eletrônico. 

    Ou seja, é uma forma ativa e automatizada de obter informação a partir da internet e de sistemas em rede.

  • O processamento pode ser automático e semiautomático, como o examinador não restringiu, logo, alternativa correta! Ainda, vale ressaltar que o processamento automático tem supervisão humana, mesmo que seja mínima.

  • AUTOMÁTICO OU SEMI-AUTOMÁTICO.

  • Falácias do DM segundo Larose

    1) apenas soltar uma ferramenta nos dados repositório é suficiente.

    NÃO, é necessário ação humana.

    2) autonomia da máquina, pouca ou zero supervisão humana.

    ERRADO! Necessita de interação! O homem recalibra a maquina até os dados fazerem sentido.

    3) a DM se paga rapidamente.

    NÃO, o CUSTO É ALTO com ferramentas e profissionais, leva tempo para obter resultados. NÃO É TRIVIAL.

    4) os pacotes de software de DM são intuitivos e fáceis de usar.

    Não, pois, DEMANDA CONHECIMENTO ESPECIALIZADO.

    5) a DM identificará as causas do negócio ou pesquisa de problemas.

    NÃO, quem identifica é o ser humano.

    6) a DM limpará um BD bagunçado automaticamente.

    NÃO, a limpeza / organização / filtragem deve ser feita anteriormente.

  • Berry Linoff

    • "A mineração de dados é o processo de exploração e análise, por meios automáticos ou semi-automáticos, de grandes quantidades de dados a fim de descobrir padrões e regras significativas ..."

    O próprio autor se arrependeu da definição, e na edição seguinte do livro (3 anos depois):

    • "Se há alguma coisa que lamentados, é a frase 'por meios automáticos ou semi-automáticos' ... porque sentimos que veio a haver muito foco sobre as técnicas automáticas e não o suficiente na exploração e análise de dados." 

    Falácia (segundo Larose): "O processo de Mineração de Dados é autônomo, exigindo pouco ou nenhuma supervisão humana." (afirmação falsa) -> Precisa SIM da interação do humano (processo Interativo)

    Entendimento atual, 

    apenas Automático = ERRADO 

    Automático e Semi-Automático = CERTO

    Livro: https://www.academia.edu/32136048/Data_Mining_Techniques_For_Marketing_Sales_and_Customer_Relat

    • A banca utilizou a classificação dos métodos segundo o autor Han et al

    (Pelo visto o Cespe trata "técnicas" e "algoritmos como sinônimos em data mining)

    • Árvore de Decisão 
    • Redes Neurais
    • Classificação Bayesiana
    • Classificação baseada em Regras
    • Classificação por regras de Associação
    • Aprendizado Tardio 

    etc...

  • Gabarito: certo

    ##CESPE - 2013 - INPI - Analista de Planejamento - Desenvolvimento e Manutenção de Sistemas

    O Data Mining possibilita descobrir padrões úteis de diferentes formas. Uma delas é por meio de classificação, utilizando-se o algoritmo ID3 que recebe como entrada um conjunto de tuplas para treinamento chamado exemplos e um atributo objetivo, que permite criar árvores de decisão. (CERTO)

  • certo

    então, data mining é automatico ou semi-automatico, a questão não restringiu dizendo ser apenas automático, por isso marquei correta, mas marquei com medo rsrs, na prova sei nao viu, pensaria bastante...

  • "De forma simplificada, a mineração de dados pode ser definida como um processo automático ou semiautomático de explorar analiticamente grandes bases de dados, com a finalidade de descobrir padrões relevantes que ocorrem nos dados e que sejam importantes para embasar a assimilação de informação importante, suportando a geração de conhecimento".

    Fonte: Introdução à Mineração de Dados - Silva, Peres, Boscarioli, 2016, p. 30

  • c-

    para enriquecer.

    algoritmos para classificacao data mining:

    • Decision Trees.
    • Logistic Regression.
    • Naive Bayes Classification.
    • k-nearest neighbors.
    • Support Vector Machine.

ID
271018
Banca
CESPE / CEBRASPE
Órgão
PREVIC
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens a seguir, relativos aos sistemas de suporte a decisão.

Um banco de dados pode conter objetos de dados que não sigam o padrão dos dados armazenados. Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção, para que não induzirem a erros na mineração.

Alternativas
Comentários
  • Usualmente, os dados corporativos que irão compor as dimensões e a tabela de fatos estão armazenados de forma distribuída, em diversas fontes. Devido a esta distribuição, os dados podem variar, por exemplo, com relação ao formato, unidade de medida, dentre outros. Esta variedade pode gerar incoerências (não uniformidade) nos valores extraídos das fontes, exemplos: erros de digitação, ausência de dados, incoerência entre os metadados, entre outros. Uma vez que ocorram incoerências, para permitir uma análise consistente a base de um DW, são necessárias transformações. Estas
    transformações são consideradas uma etapa importante no processo de alimentação de um DW, uma vez que uma análise sobre dados não uniformes pode levar a informações inconsistentes, as quais não refletem a verdadeira realidade de uma corporação e, consequentemente, podem levar a decisões erradas.

    http://www.comp.ime.eb.br/techreports/repositorio/2010_01.pdf

    As informações corporativas podem existir de inúmeras formas, inclusive armazenadas de forma não padronizadas (não-uniforme), no entanto antes que ocorra processos de mineração o mecanismo ETL deve atuar de forma a eliminar tais inconsistências.
  • Um banco de dados pode conter dados que não apresentam o comportamento geral da maioria. Estes dados são denominados outliers
    Mesmo que esses dados possam ser considerados exceções eles são úteis na detecção de fraudes e na análise de eventos raros.
    Exemplo: Podemos detectar o uso fraudulento de cartões de crédito ao descobrir que certos clientes efetuam compras de valor extremamente alto, fora de seu padrão habitual de gastos. 
  • Se a questão estivesse se referindo a outliers ai sim justificaria a questão estar errada. No meu entendimento a questão esta correta.
  • Acho que a questão deveria estar CERTA (desconsiderando a pequena imprecisão de sintaxe no final, que não invalidaria a questão: "para que não induzirem a erros na mineração")

    Semanticamente está tudo certo:
    "Um banco de dados pode conter objetos de dados que não sigam o padrão dos dados armazenados". (nenhum problema até aqui, em um banco de dados pode haver qualquer tipo de dados, independente de seguir padrão dos outros ou não)

    "Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção" (perfeito! De fato os dados que não seguem o padrão são tratados como exceção, e essa exceção tem até nome: OUTLIERS)

    "para não induzirem a erros na mineração" (os outliers são tratados separadamente (como exceção), se um outlier for considerado como sendo de um grupo e não como sendo exceção, isso seria um erro da mineração)
  • Alguém pode dizer exatamente o trecho que está errado? Entendi as explicações, mas ainda não consegui entender a questão completamente. Obrigado :)

  • Segundo Elmasri e Navathe (6ª Edição, Cap. 28, Pag. 699):

    "A descoberta de conhecimento nos bancos de dados, abreviada como KDD (Knowledge Discovery in Databases), normalmente abrange mais que a mineração de dados. O processo de descoberta do conhecimento envolve seis fases: seleção de dados, limpeza de dados, enriquecimento, transformação ou codificação de dados, mineração de dados e o relatório e exibição da informação descoberta"

    Alguns autores realizam a fusão das fases limpeza de dados e enriquecimento, chamando apenas de pré-processamento.

    A análise de outliers é realizada dentro da fase de pré-processamento e não na fase de mineração de dados.

    Apesar de considerar a questão mal formulada, acredito que o que está colocando a assertiva como errada é o fato de termos que entender mineração de dados como parte do processo de descoberta pelo conhecimento em banco de dados (KDD). Ao separarmos as fases do processo de descoberta do conhecimento em banco de dados, veremos que as exceções são tratadas antes da mineração dos dados.

  • Tiago Passos, o trecho errado está bem próximo da explicação do Thiago falou: outliers (ou exceções) não devem ser tratados como exceções para não induzirem a erros de mineração. Eles fazem parte do processo de descoberta da mineração. Eles não são descartáveis, como a questão deixou parecer.

  • o erro esta ( para que não induzirem a erros na mineração.) 

    na mineração existem varias etapas des dos dados fornecidos ate uma avaliação :

    as etapas são :seleção( dados escolhidos )

    pre-processamento(dados pre processados)

    transformção(dados transformados)

    MINERAÇÃO DE DADOS(padroes)

    e por fim avaliação onde terá o conhecimento desejado ..O CERTO SERIA QUE INDUZIRIA AO ERRO O CONHECIMENTO A AVALIAÇÃO FINAL. POIS A MINERAÇÃO DE DADOS E UMA ATIVIDADE DO PROCESSO.

    VA E VENÇA

  • No meu entendimento, busca-se o padrão, logo não serão tratadas como exceção, e sim descartadas...

  • Gabarito: Errado.

    Busca-se um padrão em uma grande quantidade de dados. Se são removidos dados ou tratados como exceções, o resultado em obter padrões não seria obtido de forma correta. Analisa-se aquilo que se tem no banco de dados.

    O exemplo prático é quando a tua operadora de cartão de crédito entra em contato com você porque detectou movimentações estranhas na sua conta. Essas compras geram dados anômalos frente aos demais, mas não são descartadas, pois ajudam o sistema a entender quando é você ou alguém que conseguiu fraudar seus dados.

    Bons estudos!

  • ERRADO. Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção, MAS NÃO PARA EIVTAR INDUZIMENTO A ERROS NA MINERAÇÃO. Pelo contrário, essas exceções são úteis na detecção de possíveis fraudes e na análise de eventos raros.

    Adsumus!

  • ERRADO. Nos métodos de mineração de dados, acontece o processo de limpeza dos dados , que consiste em retirar os dados que possam distorcer a análise

  • Gab. Errado

    1) Um banco de dados pode conter objetos de dados que não sigam o padrão dos dados armazenados. (Dada a diversidade de dados de que dispomos atualmente)

    2) Nos métodos de mineração de dados, esses objetos de dados são tratados como exceção. (Outliers)

    3) para que não induzirem a erros na mineração. (Não há que se falar em erro ou indução, pelo contrário, essas exceções ajudam a minimizar os erros e tornar o padrão em questão mais uniforme, de forma que podem representar um evento inesperado ou que foje à regra daquele grupo específico, sendo tratadso com maior atenção que o normal.)

    #como exemplo, podemos analisar os gastos de uma pessoa com cartões de crédito. Ela segue um padrão de consumo e, inesperadamente, ocorre um excesso ou uma fuga de seus padrões habituais; estes, na mineração, podem demonstrar que houve fraude , roubo, clonagem e etc.

  • SABE AQUELA TV DE 5 MIL REAIS PARCELADA EM 12 VEZES SEM JUROS?

    OUT..COF COF..LIER

  • Objetos de dados que não seguem um padrão são conhecidos como anomalias (outliers). No

    contexto de mineração de dados, esses objetos de dados realmente são tratados como exceções

    ou distorções, mas não necessariamente para não induzir a erros de mineração. Na verdade, é

    comum que os dados anormais sejam justamente a razão para a mineração dos dados. Dados fora

    do padrão podem indicar uma variabilidade em uma medição, erros experimentais ou justamente

    um desvio de comportamento que está sendo procurado

  • KKKKKKKKKKKKKKK Cada um dá uma resposta diferente. A verdade é que ninguém sabe o erro dela.

    "Os dados não padronizados não são necessariamente descartados. Eles podem sim serem úteis na análise de mineração". Essa foi a explicação de um dos professores do AlfaCon, que eu discordo bastante. Em nenhum momento a questão fala que os dados serão descartados, fala que serão tratados como exceção, o que é correto, visto que são outliers. PARA MIM, o professor tentou passar um pano para essa questão.

  • Durante o processo de análise dos dados podemos encontrar alguns pontos discrepantes das distribuições, esses são denominados pela estatística de OUTLIERS, ou seja, pontos fora da curva de comportamento. Um outlier pode ser um dado a ser descartado por algum erro, ou pode ser o ponto procurado, por isso deve ser analisado no devido contexto que se espera.


ID
276748
Banca
ESAF
Órgão
CVM
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Mineração de Dados é

Alternativas
Comentários
  • Prospecção de dados (português europeu) ou mineração de dados (português brasileiro) (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. 
    Ex. prático: Vestibular PUC-RJ

    Utilizando as técnicas da mineração de dados, um programa de obtenção de conhecimento depois de examinar milhares de alunos forneceu a seguinte regra: se o candidato é do sexo feminino, trabalha e teve aprovação com boas notas no vestibular, então não efetivava a matrícula. Estranho, ninguém havia pensado nisso. Mas uma reflexão justifica a regra oferecida pelo programa: de acordo com os costumes do Rio de Janeiro, uma mulher em idade de vestibular, se trabalha é porque precisa, e neste caso deve ter feito inscrição para ingressar na universidade pública gratuita. Se teve boas notas provavelmente foi aprovada na universidade pública onde efetivará matrícula. Claro que há exceções: pessoas que moram em frente à PUC, pessoas mais velhas, de alto poder aquisitivo e que voltaram a estudar por outras razões que ter uma profissão, etc.. Mas a grande maioria obedece à regra anunciada.




  • b)o processo de analisar de maneira semi- automática grandes bancos de dados para encontrar padrões úteis.

    O objetivo do data mining é descobrir, de forma automática ou semiautomática, o conhecimento que está "escondido" nas grandes quantidades de informações armazenadas nos bancos de dados da organização, permitindo agilidade na tomada de decisão. Uma organização que emprega o data mining é capaz de: criar parâmetros para entender o comportamento dos dados, que podem ser referentes a pessoas envolvidas com a organização; identificar afinidades entre dados que podem ser, por exemplo, entre pessoas e produtos e ou serviços; prever hábitos ou comportamentos das pessoas e analisar hábitos para se detectar comportamentos fora do padrão entre outros.

    Em termos gerais, segundo Elmasri e Navathe (2002), a técnica de data mining compreende os seguintes propósitos:

    • previsão – pode mostrar como certos atributos dentro dos dados irão comportar-se no futuro;

    • identificação – padrões de dados podem ser utilizados para identificar a existência de um item, um evento ou uma atividade;

    • classificação – pode repartir os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros;

    • otimização do uso de recursos limitados, como tempo, espaço, dinheiro ou matéria-prima e maximizar variáveis de resultado como vendas ou lucros sob um determinado conjunto de restrições.

     

     

  • RESPOSTA B

    >>Mineração de dados consiste em A) explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar padrões, como regras de associação ou sequências temporais, para detectar relacionamentos entre estes.

    #SEFAZ-AL #questão.respondendo.questões


ID
285952
Banca
FUNIVERSA
Órgão
SEPLAG-DF
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

A tomada de decisão nas organizações pode ser embasada em fontes de informações diferentes. Essas fontes podem incluir formatos e esquemas distintos para o armazenamento dos dados. Em relação ao exposto, assinale a alternativa correta.

Alternativas
Comentários
  • GABARITO E!

    A) Um data warehouse (DW) é uma coleção de informações que serve para apoiar na decisão. A grande diferença de um DW para um BD é que o banco de dados comum tradicionalmente armazena informações transacionais, já o DW armazena informações direcionadas ao apoio da decisão (ELMASRI e NAVATHE, 2005).

    B) Data Mining é a concepção de modelos computacionais capazes de identificar e revelar padrões desconhecidos, mas existentes entre dados pertencentes a uma ou mais bases de dados distintas (THOMÉ, 2002).

    C) O BI ajuda organizações a acessar informação sintetizada de forma fácil para a tomada de decisão. Nesse processo, o ato de transformar dados em informações úteis e significativas, terá como destino a distribuição destas informações para aqueles que realmente precisarão delas e que poderão tomar decisões corretas e na hora certa. Oliveira e Pereira (2008)

    D) OLAP (online analytical processing) é um termo utilizado para descrever a análise de dados complexos a partir do data warehouse. As ferramentas OLAP empregam as capacidades de computação distribuída para análises que requerem mais armazenamento e poder de processamento que as disponibilizadas por um desktop. Navathe (Sistemas de Bancos de Dados, 6 edição).

    E) O DW recebe constantemente dados históricos e em lotes, o que faz com que ele aumente seu tamanho gradativamente, gerando um grande problema. Esse problema consiste na necessidade de se desenvolver consultas nessas grandes quantidades de dados e mesmo assim, ter resultados rápidos e seguros, dessa forma faz-se necessário a utilização de técnicas de mineração de dados (TEOREY et al., 2007).

  • e-

    O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.


ID
287584
Banca
INSTITUTO CIDADES
Órgão
UNIFESP
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de Datamining, marque a alternativa correta:

Alternativas
Comentários
  • Na minha opnião a resposta correta é a letra C. Segundo o http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados
  • o problema da C é falar "pequenas" massas de dados
  • A primeira etapa do ciclo de Mineração de Dados é a seleção dos dados. Também achei o "pequenas massas" cabível. Marcaria "C".
  • A C está errada. Segundo Navathe(2011), mineração de dados refere-se a mineração ou descoberta de novas informações em termos de padrões ou regras com base em GRANDES QUANTIDADES de dados.Sistemas de Banco de Dados - 6ª Ed.Autor: Navathe; Elmasri, Editora: Pearson Education - BrInformação na página 698 do capítulo 28.
  • Gabarito A

    OLAP é um software cuja tecnologia de construção permite aos analistas de negócios, gerentes e executivos analisar e visualizar dados corporativos de forma rápida, consistente e principalmente interativa.

    A funcionalidade OLAP é inicialmente caracterizada pela análise dinâmica e multidimensional dos dados consolidados de uma organização permitindo que as atividades do usuário final sejam tanto analíticas quanto navegacionais.

    As ferramentas OLAP (do inglês, Online Analytical Processing) são geralmente desenvolvidas para trabalhar com banco de dados desnormalizados. Essas ferramentas são capazes de navegar pelos dados de um Data Warehouse, possuindo uma estrutura adequada tanto para a realização de pesquisas como para a apresentação de informações.


    http://vivianeribeiro1.wordpress.com/2011/07/12/o-que-e-olap/

  • Sendo mais objetivo ao mostras o motivo da alternativa "A" ser a correta, e aproveitando a resposta da Luana. 

    Enquanto as ferramentas OLAP visam permitir que gerentes e executivos analisem e visualizem dados corporativos de forma rápida, consistente e principalmente interativa; as técnicas de Data Mining tem por objetivo realçar correlações eventuais num volume importante de dados do sistema de informação para mostrar tendências.

    Espero ter ajudado!


ID
311830
Banca
FCC
Órgão
TRT - 14ª Região (RO e AC)
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

No contexto de DW, é uma categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados. Trata-se de

Alternativas
Comentários
  • Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
  • A opção correta é a letra E - data mining.

    Conforme:

    "O data mining ou mineração de dados é uma categoria de ferramentas de análise open-end. Ao invés de fazerem perguntas, os usuários entregam para a ferramenta grandes quantidades de dados em busca de tendências ou agrupamentos dos dados. Ferramentas de data mining utilizam-se das mais modernas técnicas de computação, como redes neurais, descoberta por regra, detecção de desvio, programação genética, para extrair padrões e associações de dados. " (Fonte: http://www.din.uem.br/~ia/a_multid/mineracao/tecnologia/warehouse.html, acesso em 21/06/2012)

    O data mining ou mineração de dados é uma categoria de ferramentas de análise open-end. Ao invés de fazerem perguntas, os usuários entregam para a ferramenta grandes quantidades de dados em busca de tendências ou agrupamentos dos dados. Ferramentas de data mining utilizam-se das mais modernas técnicas de computação, como redes neurais, descoberta por regra, detecção de desvio, programação genética, para extrair padrões e associações de dados. O data mining ou mineração de dados é uma categoria de ferramentas de análise open-end. Ao invés de fazerem perguntas, os usuários entregam para a ferramenta grandes quantidades de dados em busca de tendências ou agrupamentos dos dados. Ferramentas de data mining utilizam-se das mais modernas técnicas de computação, como redes neurais, descoberta por regra, detecção de desvio, programação genética, para extrair padrões e associações de dados. O data mining ou mineração de dados é uma categoria de ferramentas de análise open-end. Ao invés de fazerem perguntas, os usuários entregam para a ferramenta grandes quantidades de dados em busca de tendências ou agrupamentos dos dados. Ferramentas de data mining utilizam-se das mais modernas técnicas de computação, como redes neurais, descoberta por regra, detecção de desvio, programação genética, para extrair padrões e associações de dados.  
  • GABARITO E!

    O Data Mining apoia o conhecimento indutivo, que descobre novas regras e padrões nos dados fornecidos.

    (ELMASRI, NAVATHE, 2005).

    “Data Mining é a concepção de modelos computacionais capazes de identificar e revelar padrões desconhecidos, mas existentes entre dados pertencentes a uma ou mais bases de dados distintas”.

    (THOMÉ, 2002).

  • Data Mining (mineração de dados)

    São processos de análise de inferência e representa uma forma de busca de informação baseada em algoritmos que objetivam o reconhecimento de padrões escondidos nos dados.

    Busca correlações escondidas em altos volumes de dados.

    É o processo de explorar grandes quantidades de dados à procura de padrões consistentes.

    É usado para descobrir regras, identificar fatores e tendências-chave, descobrir padrões e relacionamentos ocultos em grandes bancos de dados para auxiliar a tomada de decisões.

    STAR SCHEMA (Esquema estrela)

    Abordagem que não recomenda a normalização das tabelas dimensão.

    Mais recomendável e tem maior desempenho;

    É a estrutura básica de um modelo de dados multidimensional.

    Possui uma grande entidade central denominada fato.

    ETL (EXTRACT – TRANSFORM – LOAD)

    Destina-se à extração, transformação e carga dos dados de uma ou mais bases de dados de origem para uma ou mais bases de dados de destino (data warehouse);

    Trabalha com toda a parte de extração de dados de fontes externas, transformação para atender às necessidades de negócios e carga dos dados dentro do Data Warehouse;

    É o processo mais crítico e demorado na construção de um DW. 80% do tempo de desenvolvimento de um DW consiste no processo de ETL.

    Slice and Dice: são operações para realizar navegação por meio de dados na visualização de um cubo. É a redução do escopo dos dados em análise.

    Operational Data Store (ODS): é o armazenamento intermediário dos dados, facilitando a integração dos dados do ambiente antes da sua atualização no Data Warehouse (DW).

    Alternativa: E

  • e-

    data mining é um processo de lapidar dados brutos e extrair conhecimento a partir deles. Este processo pode operar diretamente em fontes de dados brutas sob a qual deverá realizar uma severa etapa de pré-processamento de dados mas é recomendado a partir de uma fonte de dados já integrada e limpa, como, por exemplo um Data Warehouse.


ID
312052
Banca
CESPE / CEBRASPE
Órgão
TJ-ES
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens a seguir, a respeito de administração de dados e de
administração de banco de dados.

Mineração de dados, em seu conceito pleno, consiste na realização, de forma manual, de sucessivas consultas ao banco de dados com o objetivo de descobrir padrões úteis, mas não necessariamente novos, para auxílio à tomada de decisão.

Alternativas
Comentários
  • Mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
  • Mineração de dados, em seu conceito pleno, consiste na realização, de forma manual, de sucessivas consultas ao banco de dados com o objetivo de descobrir padrões úteis, mas não necessariamente novos, para auxílio à tomada de decisão.

    "Data mining se refere  à mineração de dados ou descoberta de novas informações em funções de padrões ou regras em grande quantidades e dados" Sistemas de Banco de Dados - Esmasri-Navathe.

    Dica:
    Data- mining, que não possibilita a interação do usuário na busca por informações úteis;
    OLAP permite ao usuário extrair informações de um data warehouse ou de um datamart, de forma customizada e interativa;
  • A mineração de dados é a exploração e análise, por meios automáticos ou semiautomático, de grandes quantidades de dados a fim de descobrir padrões e regras significativas.
  • O certo é semi-automático ou automático.
  • Definição: Michael Berry, Gordon Linoff


    2011 - A mineração de dados é um processo de negócio para explorar grandes quantidades de dados para descobrir padrões e regras significativas.


    1997 - A mineração de dados é a exploração e análise, por meios automáticos ou semi-automático, de grandes quantidades de dados a fim de descobrir padrões e regras significativas.

  • Sabe aquela notificação de um produto que você viu algumas horas atrás, aparecer denovo? Então, rsrs

  • "forma manual" pqp

    passou batido

  • Semiautomático ou automático.

    gabarito: errado.

  • ERRADO.

    A questão erra ao dizer que a mineração é feita na forma manual. Esse formato pode ser automatizado, principalmente quando há grande volume de dados.

  • Q315857

    Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante racionalização e potencialização por meio de dois componentes: organização e tecnologia.

    G: ERRADO

    Comentário do professor:

    Prezados,

    Vejamos o conceito de Datamining segundo Navathe, página 698 :

    Mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados.

    Em nada o Datamining está relacionado com automação de processos, portanto, questão errada.

    Fonte : Navathe, Sistemas de bancos de dados, 6º Edição.

    Q81745

    O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.

    G: CERTO

    TSC...

    complicado isso....

  • Quem faz mineração de dados manual é estagiário.

    O sistema faz de forma automática ou semiautomática.

  • Gabarito: errado

    >> Data mining não é manual, mas sim semiautomático ou automático, ademais possui característica da não trivialidade, que é descobrir padrões que ainda não são conhecidos:

    (CESPE / CEBRASPE - 2010)O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados.(certo)

  • ERRADO

    • (Automático ou Semi automático) é o processo que tem como objetivo encontrar padrões, irregularidades e regras, com o intuito de transformar os dados em informações relevantes para a tomada de decisão.
  • De forma manual num dá neh kkkkk

  • A questão erra ao dizer que a mineração é feita na forma manual. Esse formato pode ser automatizado, principalmente quando há grande volume de dados.


ID
320491
Banca
CESPE / CEBRASPE
Órgão
INMETRO
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

As técnicas de datamining incluem

Alternativas
Comentários
  • Segundo: Michael Berry, Gordon Linoff

    As tarefas adequadas para mineração de dados (não é limitado a essas):
    –Classificação
    –Clustering
    –Estimativa
    –Previsão
    –Agrupamento por afinidade
    –Descrição (description)

     

    Gabarito: E

  • análise de afinidade = associação 

  • Análise de Clusters (Análise de Agrupamentos)
    - Consiste em identificar agrupamentos de objetos, estes que identificam uma classe.
    - Trabalha sobre dados onde as etiquetas das classes não estão definidas.

     

    Classificação

    - É o processo de encontrar um conjunto de modelos que descrevem e distinguem classes ou conceitos.

     

    Previsão = Classificação Preditiva

    - Essaa tarefa realiza uma inferência sobre os dados atuais para fazer PREVISÕES sobre os mesmos. Usa variáveis para prever valores futuros ou desconhecidos de outras variáveis.

     

    Regras de Associação (análise de afinidade)
    -Relacionam a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.

     

     

    Fonte: Minhas anotações


ID
320509
Banca
CESPE / CEBRASPE
Órgão
INMETRO
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Assinale a opção correta, com relação às classes de datamining do ponto de vista de processo orientado.

Alternativas
Comentários
  • na duvida entre mais de uma alternativa, nas provas do cespe, escolha a pior e corra pro abraço.

    gab:C


ID
330169
Banca
FGV
Órgão
DETRAN-RN
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Sobre Data Mining, pode-se afirmar que:

Alternativas
Comentários
  •  mineração de dados  (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
  •  a) Refere-se à implementação de banco de dados paralelos.
    BDD
       b) Consiste em armazenar o banco de dados em diversos computadores.
    BDD
       c) Relaciona-se à capacidade de processar grande volume de tarefas em um mesmo intervalo de tempo.
    Multithreading, multiprogramação ou paralelismo cabem como resposta.
       d) Permite-se distinguir várias entidades de um conjunto.
    Não faço idéia do que se refere.
       e) Refere-se à busca de informações relevantes a partir de um grande volume de dados.
    ok.
  • data mining é o processo de analisar dados para criar conhecimento e descobrir padrões e tendencias úteis à tomada de decisao

  • GABARITO E!

    O Data Mining apoia o conhecimento indutivo, que descobre novas regras e padrões nos dados fornecidos.

    (ELMASRI, NAVATHE, 2005).

    “Data Mining é a concepção de modelos computacionais capazes de identificar e revelar padrões desconhecidos, mas existentes entre dados pertencentes a uma ou mais bases de dados distintas”.

    (THOMÉ, 2002).

  • Dentre as opções fornecidas, a única que está relacionada a data mining é a letra E. A mineração de dados visa identificar padrões e relacionamentos ocultos em grandes volumes de dados estruturados e não estruturados, o que está de acordo com o que é descrito na assertiva. Para diferenciar a mineração de dados de conceitos como data warehouse e business intelligence, lembre-se sempre que a mineração é mais voltada à descoberta, então termos como buscar, identificar ou encontrar muitas vezes serão indicativos que se trata de um processo desse tipo.

  • Valeu amigo, você é um amigo


ID
339688
Banca
COSEAC
Órgão
DATAPREV
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

“Mining é parte de um processo maior de conhecimento, que o processo consiste, fundamentalmente, na estruturação do banco de dados; na seleção, preparação e pré- processamento dos dados; na transformação, adequação e redução da dimensionalidade dos dados; e nas análises, assimilações, interpretações e uso do conhecimento extraído do banco de dados.”

O processomaior citado no início do texto é denominado:

Alternativas
Comentários
  • Para  Fayyad o KDD (Knowledge Discovery in Databases ou Descoberta de Conhecimento nas Bases de Dados)  refere-se a todo o processo de descoberta de conhecimento, e a Mineração de Dados a uma das atividades do processo.

    Processo KDD:

    Seleção dos dados > pré-processamento > transformação > mineração de dados  > Avaliação (padrões)  > Conhecimento

  • KDD - KNOWLEDGE DISCOVERY IN DATABASES

  • LETRA D

    A Mineração de Dados faz parte de um processo muito maior de descoberta de conhecimento chamada KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em Bancos de Dados). O processo de descoberta de conhecimento compreende cinco fases: 

    (1) Seleção; 

    (2) Pré-processamento; 

    (3) Transformação; 

    (4) Data Mining; 

    (5) Interpretação e Avaliação – alguns autores possuem uma classificação um pouco diferente.

    Fonte: Estratégia Concursos.

  • Letra D

    KDD (extração do conhecimento)

    Conceitos:

    “é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados.“ (FAYYAD, 1996).

    “é um processo não trivial de identificação de novos padrões válidos, úteis e compreensíveis.”

    ___________________

    Fases do KDD:

    (1) Seleção de dados: seleciona um conjunto de dados para serem ANALISADOS (estruturados, semi-estruturados, não-estruturados)

    (2) Pré-processamento (limpeza): eliminar ruídos, tuplas vazias, corrigir ou remover dados inconsistentes, identificar anomalias (outliers).

    (3) Transformação dos dados: transformação dos dados utilizando métodos como: Normalização, Agregação, Criação de novos atributos, e Sintetização dos dados.

    (4) Mineração de dados (data mining): é a fase MAIS importante do processo de KDD. Aplicam-se técnicas para extrair informações a partir de um grande volume de dados e transforma essas informações em conhecimento útil.

    (5) Interpretação / Avaliação: interpreta e avalia os padrões extraídos na etapa de Mineração de dados. (podendo retornar a qualquer fase anterior caso seja necessário)


ID
359746
Banca
CETAP
Órgão
DETRAN-RR
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Sobre Sistemas de Apoio à Decisão, leia os enunciados seguintes e marque a alternativa CORRETA:

I- O termo Business Inteligence (BI) nada mais é que uma série de conceitos e metodologias para auxiliar na tomada de decisões estratégicas nas empresas através principalmente de geração de relatórios gerenciais analíticos;

II- Um Data Warehouse é um banco de dados multidimensional grande, de escopo organizacional (ou seja, abrange toda a empresa) e reúne dados de todos os departamentos de forma a permitir a busca rápida de informações para auxiliar a tomada de decisões estratégicas;

III- Um Data Mart é um banco de dados multidimensional de escopo departamental, ou seja, abrange apenas um determinado departamento;

IV- Data Mining (Mineração de dados) é o termo usado para definir uma série de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse ou Data Mart;

V- Nos Sistemas de Apoio à Decisão é comum desnormalizar os dados para atingir uma melhor performance nos Data Mart e Data Warehouse.

Alternativas
Comentários
  • (I) Correto. São conceitos e metodologias, auxiliam na tomada de decisões estratégicas, ajudam a

    geração de relatórios gerenciais analíticos;

    (II) Correto. DW é realmente um banco de dados multidimensional, possui escopo organizacional e

    permite a busca rápida de informações para auxiliar a tomada de decisões estratégicas;

    (III) Correto. DM também é um banco de dados multidimensional, mas realmente possui um escopo

    departamental;

    (IV) Correto. Essa definição está tão genérica que eu acredito que ela poderia ser tanto para

    Mineração de Dados quanto para OLAP;

    (V) Correto. Desnormalizar é manter dados redundantes no banco de dados. Sistemas de Apoio à

    Decisão realmente desnormalizam dados para melhorar o desempenho de DW ou DM.

  • SAD - CETAP - TI


ID
362818
Banca
CESPE / CEBRASPE
Órgão
TRE-BA
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de modelagem dimensional, julgue os itens
subsequentes.

Diferentemente de datamining, que não possibilita a interação do usuário na busca por informações úteis, o OLAP permite ao usuário extrair informações de um data warehouse ou de um datamart, de forma customizada e interativa.

Alternativas
Comentários
  • Datamining: Define uma série de procedimento, técnicas e ferramentas para recuperar e analisar os dados de um Data Warehouse ou  Data Mart à procura de padrões e tendências a respeito dos dados armazenados. A análise de dados exploratória ("Data Mining") é o processo de descobrimento de vários modelos, sumários e valores derivados a partir de um dado conjunto de dados. Há várias técnicas para se realiar esse processo, tais como métodos estatísticos, análise de cluster, árvore de decisão, redes neurais e regras de associação.  Etapa de um processo conhecido como extração de conhecimento em bases de dados ou Knowledge-Discovery in Databases (KDD). Quando os dados são do tipo não-estruturados ou textos, chamamos de Text Data Mining ou simplesmente Text Mining, ou ainda Knowledge Discovery from Text (KDT).

    Data warehouse: ou armazém de dados é um banco de dados com dados históricos usados para análise e decisões das mais exóticas perguntas realizadas por executivos. Os dados contidos nos data warehouse são sumarizados, periódicos e descritivos. Com a manipulação desses dados os executivos podem tomar decisões baseadas em fatos e não em intuições e especulações. Os data warehouses são projetados para processamento on-line analítico (OLAP, On-line Analytical Processing) ao invés do processamento transacional on-line (OLTP, On-line Transactional Processing). Ferramentas OLAP para pesquisa inteligente de dados são chamadas de data mining. Delimitando a abrangência dos dados a uma área de negócio da empresa o data warehouse passa a se denominar data mart. É possível implementar um data warehouse com vários data marts distribuídos.
  • Datamining e OLAP são ferramentas para recuperar informações de um data warehouse. O data mining vai muito além da simples consulta a um banco de dados, no sentido de que permite aos usuários explorar e inferir informação útil a partir dos dados, descobrindo relacionamentos escondidos no banco de dados.
  • Acredito que o gabarito esteja equivocado. Não há celeuma alguma quanto a interatividade permitida pelo análise OLAP, onde é possível fazer várias operações acerca do cubo de dados. Agora não há que se falar de ausência de interatividade no Data Mining. Pode até ser menos interativo do que a análise OLAP, mas inferir que não é interativo seria desconsiderar, por exemplo, que um analista pode gerar hipóteses a serem testadas numa ferramenta de DataMining, ou seja, o analista usa o conhecimento para realimentar o procedimento de Data Mining. Gabarito redondamente equivocado. 
  • O segredo é o termo "busca".
     "não possibilita a interação do usuário na busca por informações úteis,"
    A busca se dá por meio de técnicas ou algorítimos como redes neurais, arvóre de decisão, etc. que é diferente de analisar e inferir hipóteses.
  • Todas as demais questõs de Data Miming do Cespe estão baseadas no livro do Navathe, exceto esta.
    Veja que destoa completamente do conceito do mesmo livro:

    Navathe 6ª Edição:
    A maioria das ferramentas (de Data Mining) é executada em uma ambiente de interface gráfica com o usuário. Alguns incluem tecnicas de visualização sofisticadas capazes de manipular dados interativamente. Há também os que fazem parte da ferramente OLAP.
  • Pelo que to percebendo, estudar banco de dados pra Cespe é enfiar a cara no livro de Navathe ;)

  • "Um datamining emprega tecnologias baseadas em inteligência artitficial. ... Assim, finalmente, podemos definir dataming como a extração automática de dados sobre padrões, tendências, associações, mudanças e anomalias previamente não identificadas"

    ...

    "OLAP constitui a sigla de On-Line Analytical Processing ou simplesmente Processamento Analítico Online. OLAP é uma tecnologia ou ferramenta que permite ao usuário extrair informações de um data warehouse ou de data mart de forma customizada, simples e interativa. Desse modo, diferentemente do datamining, que não possibilita a interação do usuário na busca por informações úteis, as ferramentas OLAP se tornam um grande aliado dos tomadores de decisão." 

     

    Fonte: Sistemas Integrados de Gestão – ERP (CICERO CAIÇARA JUNIOR), pág. 175

  •  busca por informação é diferente de busca por conhecimento. Informação é bruta e nas inferencias sobre elas é que consiste o conhecimento. Logo por esse lado a questão está correta visto que o data mining tras a informação de forma automatica (por software de logaritimos). Outro ponto é que a questão usa o  termo "usuario", o qual se entende como usuario final; cliente, esse realmente não interage na busca por informações, e sim o programador ou projetista do SGBD que cria e modifica o software. Logo questão mtoo escorregadia e foda tem q se atentar a esses dois termos "informação" e "usuario" no sentido estrito usado em TI, mas esta correta!!!

     

  • CERTO

    Trata da capacidade de analisar grandes volumes de informações nas mais diversas perspectivas dentro de um Data Warehouse (DW). O OLAP também faz referência às ferramentas analíticas utilizadas no BI para a visualização das informações gerenciais e dá suporte para as funções de análises do negócio organizacional.

    As limitações dos bancos de dados relacionais que utilizam modelo entidade-relacionamento podem ser superadas por meio do uso de ferramentas OLAP (online analytical processing).

  • "Diferentemente de datamining, que não possibilita a interação do usuário na busca por informações úteis" . E o aprendizado de máquina supervisionado como fica?

  • WTF!? e o aprendizado supervisionado? eeeeita


ID
399997
Banca
CESPE / CEBRASPE
Órgão
Correios
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de datawarehouse (DW) e datamining, julgue os próximos
itens.

Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster), por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo.

Alternativas
Comentários
  • Clustering é um ramo da Estatística Multivariada que engloba métodos utilizados para descobrir estruturas em um conjunto complexo de dados. O objetivo principal de clustering é separar objetos ou observações em classes naturais de forma que os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.

    Análise de Séries Temporais: determina características seqüenciais, como dados com dependência no tempo. Seu objetivo é modelar o estado do processo extraindo e registrando desvios e tendências no tempo.
    Fonte: http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf
  • Tipos de Descoberta de Conhecimento durante a Data Mining:
           - Regras de associação - Essas regras relacionam a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.
           - Hierarquias de classificação - O objetivo é trabalhar em um conjunto de eventos ou transações para criar uma hierarquia de classes.
           - Padrões seqüenciais - Uma seqüência de ações ou eventos é investigada.
           - Padrões com séries temporais - Similaridades podem ser encontradas em posições de uma série temporal de dados, que é uma seqüência de dados  tomada a intervalos regulares, como vendas diárias ou preço diário de fechamento de ações.
           - Clustering (Agrupando) - Uma dada população de eventos ou novos itens podem ser particionados (segmentados) em conjuntos de elementos 'similares'.
    Sistema de Banco de Dados - Elmari, Navathe. 4º ed.
    Cap. 27 - Regras de Associação
    pág. 626 e 627
  • Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.

    Gaba: ERRADO

  • Sequências (e não cluster)

    Na sequência os eventos estão ligados ao longo do tempo.

    Pode-se descobrir, por exemplo, que quando se compra uma Casa, em 65% das vezes se adquire uma nova Geladeira no período de duas semanas; e que em 45% das vezes, um Fogão também é comprado um mês após a compra da residência.

    Sequência = CasaGeladeiraFogão

  • A QUESTAO REFERE-SE AOS PADROES SEQUENCIAIS TEMPORAIS, MUITO SEMELHANTE À TECNICA DE CLUSTERIZACAO

  • Um dos métodos de classificação do datamining  é a Análise de Séries Temporais, por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo.

  • CLUSTERIZAÇÃO agrupamento de elementos com características comuns, busca melhorar o desempenho do BD.

    x

    PADRÕES TEMPORAIS →  fator temporal/intervalos regulares.

  • Gabarito: errado

    >> Outras questões:

     Prova: CESPE - 2013 - MPU - Analista - Suporte e Infraestrutura

    Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo

    Prova: CESPE / CEBRASPE - 2021 - TCE-RJ - Analista de Controle Externo - Especialidade: Tecnologia da Informação

    No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

    Prova: CESPE - 2013 - SERPRO - Programador de computador

    Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo

  • GABARITO ERRADO

    No Data Mining, a técnica de Agrupamento (Clustering) é utilizada para identificar dados que possuem alguma similaridade entre si, agrupando-os em registros que não são preestabelecidos. (Técnica não supervisionada)

    FONTE: Meus resumos

    “É justo que muito custe o que muito vale”. -D'Ávila

  • As características sequenciais são identificadas nos métodos de

    associação e não nos métodos de análise de agrupamento.

    A associação (ou aprendizagem de regras) visa descobrir

    relacionamentos entre variáveis em grandes bancos de dados. Dito de outro

    modo, as regras de associação correlacionam a presença de um item com uma

    faixa de valores para um conjunto de variáveis diverso.

    ▪ Análise de ligações: a ligação entre os diversos objetos de

    interesse é descoberta automaticamente. Ex.: quando um cliente do sexo

    masculino compra fraldas em supermercado, geralmente ele compra

    cerveja.

    ▪ Padrões sequenciais: uma sequência de ações ou eventos é

    buscada. A detecção de padrões sequenciais é equivalente à detecção

    de associações entre eventos com certos relacionamentos

    temporais. Ex.: se um paciente fuma excessivamente, provavelmente

    sofrerá com problemas pulmonares.

    ▪ Padrões dentro de série temporal: as similaridades entre os dados

    podem ser detectadas dentro de posições de uma série temporal, que é

    uma sequência de dados tomados em intervalos regulares. Ex.: os

    casacos de frio são mais baratos no verão e mais caros no inverno.

    A análise de clusters (análise de agrupamentos ou análise de

    aglomerações) é um método de mineração de dados essencial

    para classificar itens, eventos ou conceitos em agrupamentos comuns

    chamados de clusters.

    Gabarito: Errado.

  • Gabarito: errado

    Agrupamento( clustering):

      (CESPE / CEBRASPE - 2013) Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo

    (CESPE / CEBRASPE - 2021) No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

     (CESPE / CEBRASPE - 2013) Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo

    obs: lembrando que a diferença entre clustering e classificação e que esse último é supervisionado, já aquele é NÃO supervisionado.


ID
513562
Banca
FMP Concursos
Órgão
TCE-RS
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Mineração de dados consiste em

Alternativas
Comentários
  • Dataming (mineração de dados)
    - explora grandes quantidade de dados a procura de padões consistentes
    - uso de algoritmo de aprendizagem ou redes neurais
    - obter a partir de dados , sbsidiar a tomada de decisões

    exemplo : walmart , sexta feira compra de fraldas e cervejas

    letra a
  • D.M -  É o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados, usando-as para efetuar decisões cruciais.

    Diferença entre Ferramentas OLAP e Data Mining:

    Na análise OLAP a exploração é feita através da verificação, isto é, o analista conhece a questão, elabora uma hipótese e utiliza a ferramenta pra refutá-la ou confirmá-la

    Com o DM, a questão é total ou parcialmente desconhecida e a ferramenta é utilizada para a busca de conhecimento.

ID
513595
Banca
FMP Concursos
Órgão
TCE-RS
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Qual das assertivas a seguir melhor corresponde aos conceitos ou técnicas de mineração de dados?

Alternativas
Comentários
  • KDD - knowledge discovery in database( Descoberta (Busca) de Conhecimento em Banco de Dados) é um processo que engloba seis fases:
    seleção dos dados; (levantamento de itens especificos ou categorias de itens)
    limpeza;(eliminação de erros)
    enriquecimento; (incremento dos dados)
    transformação ou codificação;( executada para reduzir a quantidade de dados)
    data mining;
    construção de relárorios e apresentação da infromação descoberta;

    Portanto
    a) errada. nada tem a ver com o contexto de data mining que são baseados em data warehouses

    b) correta de acordo com a definição acima

    c)????viagem para gerar confusão

    d)CONTROVERSA - Segundo Bill Immon em Building the Data Warehouse todo dataware house nececessita ser integrado e a limpeza dos dados é tambem um requisito inicial dos DW. Como data mining são baseados em DW, conclui-se que esses passos já tenham sido aplicados no processo de mineração.

    e)errada. Tecnicas de mineração - regras de associação,hierarquias de classificação,padrões sequenciais,padrões com series temporais e clustering(agrupamento/agregação) .
    Portanto agregação errada e representação por gráficos diversos correta

    Questão dificil na minha opinião e  poderia ser alvo de um recurso melhor elaborado.
  • Concordo com o Haroldo, pois no meu entendimento a questão D esta correta também.
  • Amigos, o Data Mining não dependo do DW. Não confundam.
    O Data Mining Aliada ao DW possui um desempenho melhor, entretanto O Data Mining pode ser aplicado a Bancos de Dados convencionais.
  • "Limpeza, integração, seleção e transformação de dados, etapas fundamentais para o sucesso da mineração"

    ftp://ftp.inf.puc-rio.br/pub/docs/techreports/02_10_cortes.pdf


    DW ou não, ainda não entendi o porque não pode ser a letra D.
  • Questão difícil mesmo.
    Acredito que a solução esteja nos detalhes.

    D - errada.  Por que a limpeza e integração não são "sequencialmente" os passos iniciais.

    E - errada. Porque representação por gráficos diversos não é uma técnica.

    Muito confusa assim mesmo.
  • Concordo com o pessoal que a questão é confusa, mas o pensamento que tive ao descartar o item "d" é o seguinte:

    A mineração necessita de dados homogênios (tratados), porém esta função não faz parte das atividades de mineração. Pode ser de um BD (que possui dados homogênios devido suas regras de integridade) ou de um DW (homogênio pela ETL). A limpeza e integração são necessárias mas não são passos iniciais e sim ANTERIORES ao processo de integração.
    Estaria certa se fosse:

    d) A limpeza e integração dos dados no banco de dados são os passos anteriores ao processo de mineração.
  • A definição mais aceita do data mining é a identificação de padroes atraves da analise dos dados. A limpeza é realmente o 1° passoem data mining para avaliar as fontes de dados para verificar redundancia e inconsistencia na informação, originando repositorios mais especializados como data marts.

  • Gabarito B.

    Mineração de Dados é parte de um processo maior de pesquisa chamado de Busca de Conhecimento em Banco de Dados (KDD).

  • Limpeza faz parte do pré-processamento(segunda fase do KDD, mineração é encontrada na fase 4).

    • KDD (Knowledge Discovery in Databases – Descoberta de Conhecimentos em BD).

    Sou Policial e Também Dou Instrução

    1) Seleção

    2)  Pré-processamento

    3)  Transformação

    4)  Data Mining

    5)  Interpretação e Avaliação 

    fonte: qc e estratégia

  • Letra B

    A Mineração de Dados (Data Mining) é um SUBCONJUNTO do KDD

    Fases do KDD:

    (1) Seleção de dados: seleciona um conjunto de dados para serem ANALISADOS (estruturados, semi-estruturados, não-estruturados)

    (2) Pré-processamento (limpeza): eliminar ruídos, tuplas vazias, corrigir ou remover dados inconsistentes, identificar anomalias (outliers).

    (3) Transformação dos dados: transformação dos dados utilizando métodos como: Normalização, Agregação, Criação de novos atributos, e Sintetização dos dados.

    (4) Mineração de dados (data mining): é a fase MAIS importante do processo de KDD. Aplicam-se técnicas para extrair informações a partir de um grande volume de dados e transforma essas informações em conhecimento útil.

    (5) Interpretação / Avaliação: interpreta e avalia os padrões extraídos na etapa de Mineração de dados. (podendo retornar a qualquer fase anterior caso seja necessário)


ID
515767
Banca
FCC
Órgão
INFRAERO
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Funcionalidade cujo objetivo é encontrar conjuntos de dados que não obedecem ao comportamento ou modelo dos dados. Uma vez encontrados, podem ser tratados ou descartados para utilização em mining. Trata-se de

Alternativas
Comentários
  • Outlier

    Em estatística, outlier, ou valor atípico, é uma observação que apresenta um grande afastamento das demais da série (que esta "fora" dela), ou que é inconsistente.

    A existência de outliers implica, tipicamente, em prejuízos a interpretação dos resultados dos testes estatísticos aplicados as amostras.
     
    http://pt.wikipedia.org/wiki/Outlier 

  • Análise de outliers — um banco de dados pode conter dados que não apresentam o comportamento geral da maioria. Eles são denominados outliers (exceções). Muitos métodos de mineração descartam esses outliers como ruído indesejado. Entretanto, em algumas aplicações, tais eventos raros podem ser mais interessantes do que os que ocorrem regularmente. Exemplo: descobrir padrões de comportamento de professores que publicam um número muito grande de artigos e que fogem ao padrão dos demais professores.

    fonte : http://www.scielo.br/pdf/rap/v42n3/a04v42n3.pdf
  • Os outliers ou anomalias são as observações que não parecem pertencer ao mesmo conjunto de dados que as demais, por destoarem de forma acentuada do padrão observado. No âmbito da mineração de dados, muitas vezes essas discrepâncias são erros tratados na etapa de pré-processamento. Contudo, quando se trata de dados válidos, a análise dessas discrepâncias pode ser uma técnica útil para detecção de fraudes, por exemplo.

    Gabarito: D

  • dados que não obedecem ao comportamento ou modelo dos dados = outliers


ID
515770
Banca
FCC
Órgão
INFRAERO
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

No âmbito da descoberta do conhecimento (KDD), a visão geral das etapas que constituem o processo KDD (Fayyad) e que são executadas de forma interativa e iterativa apresenta a seguinte sequência de etapas:

Alternativas
Comentários
  • Primeiramente faz-se necessário conhecer a sequência das etapas do KDD, que segundo Fayyad (et. al., 1996b) são:

    Seleção, pré-processamento, transformação, data mining e interpretação/avaliação


    Assim .Assim sendo, tem-se:

    Opção A - correta (a sequência e os nomes estão corretos)

    Opção B - incorreta (sequência errada)

    Opção C - incorreta (não contempla as etapas)

    Opção D - incorreta (não contempla as etapas)

    Opção E - incorreta (não contempla as etapas)

    E, em tempo:

    "O processo KDD é constituído de várias etapas [...] que são executadas de forma interativa e iterativa. De acordo com Brachman & Anand (1996), as etapas são interativas porque envolvem a cooperação da pessoa responsável pela análise de dados, cujo conhecimento sobre o domínio orientará a execução do processo. Por sua vez, a iteração deve-se ao fato de que, com freqüência, esse processo não é executado de forma seqüencial, mas envolve repetidas seleções de parâmetros e conjunto de dados, aplicações das técnicas de Data Mining e posterior análise dos resultados obtidos, a fim de refinar os conhecimentos extraídos." (Fonte: http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf, acesso em 21/06/2012).

  • De acordo com Figueira (1998), podem se dividir as etapas da KDD da seguinte forma

    Seleção: é a etapa de agrupamento(organizado) dos dados Pré-processamento: neste momento os dados passam por uma adequação. Ao final do processo, devem possuir o formato correto e não apresentar duplicidade, entrer outras características; Transformação: é a etapa de armazenamento dos dados de forma a facilitar o usi das técnicas de Data Mining; Data Mining: é a principal atividade do conhecimento, aplicando, para este fim, algoritmos de descoberta de padrões; Interpretação e avaliação: como o nome diz, esta fase consiste em interpretar os dados gerados e verificar se possuem alguma validade para o problema proposto.

    https://sites.google.com/site/mineracaodedados1b/descoberta-do-conhecimento-kdd

  • RESPOSTA LETRA A

    "O processo de busca de conhecimento contém uma série de passos: seleção, pré-processamento e limpeza, transformação, mineração de dados (data mining) e interpretação/avaliação. Simplificando, pode-se dizer que o processo de KDD compreende, na verdade, todo o ciclo que o dado percorre a té virar informação, conforme pode ser visto na figura."

    http://fp2.com.br/blog/wp-content/uploads/2012/08/kdd.png

    http://fp2.com.br/blog/index.php/2012/um-visao-geral-sobre-fases-kdd/

  • Letra A

     

    Apenas para complementar... na visão de Navathe:

    O processo de Knowledge Discovery in Database (KDD) ou descoberta de conhecimento em banco de dados compreende seis fases:


    - Seleção de dados.
    - Limpeza de dados.
    - Enriquecimento.
    - Transformação.
    - Mineração.
    - Análise, assimilação, interpretação, avaliação, divulgação e exposição das informações.

  • O KDD é um processo bem intuitivo. Ele começa na seleção dos dados, que passam por um pré-processamento para serem transformados e serem alvo da mineração de dados. Por fim, há uma etapa de interpretação e avaliação dos resultados.

    A letra B poderia até trazer alguma dúvida, por isso é interessante lembrar que o pré-processamento é a primeira etapa a ser realizada após a obtenção dos dados (por isso que é “pré” J). Vamos ver mais sobre essa etapa ainda na aula de hoje.

    Outro detalhe importante é que a mineração permite extrair os padrões e relacionamentos ocultos no banco de dados, mas essas descobertas não têm muita serventia se não passarem por uma interpretação e avaliação dos usuários que irão realizar a tomada de decisão. A mineração não é um processo completamente automático, requerendo a intervenção humana em várias de suas etapas.

    Gabarito: A

  • Letra A

    KDD (extração do conhecimento)

    Conceito:

    “é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados.“ (FAYYAD, 1996).

    __________________

    Fases do KDD:

    - Seleção de dados: seleciona um conjunto de dados para serem ANALISADOS (estruturados, semi-estruturados, não-estruturados)

    - Pré-processamento (limpeza): eliminar ruídos, tuplas vazias, corrigir ou remover dados inconsistentes, identificar anomalias (outliers).

    - Transformação dos dados: transformação dos dados utilizando métodos como: Normalização, Agregação, Criação de novos atributos, e Sintetização dos dados.

    - Mineração de dados (data mining): é a fase MAIS importante do processo de KDD. Aplicam-se técnicas para extrair informações a partir de um grande volume de dados e transforma essas informações em conhecimento útil.

    - Interpretação / Avaliação: interpreta e avalia os padrões extraídos na etapa de Mineração de dados. (podendo retornar a qualquer fase anterior caso seja necessário)


ID
613093
Banca
CESPE / CEBRASPE
Órgão
BRB
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de banco de dados em SQL, julgue o item seguinte.

Existe uma integração total entre a tecnologia data mining e todos os SGBDs que permite a qualquer usuário, até mesmo aos que desconhecem o esquema de dados de um banco em SQL, descobrir informações nele existentes.

Alternativas
Comentários
  • Nem todos do SGDBs há a tecnologia data mine.
  • Não há integração com qualquer usuário, principalmente aqueles que desconhecem o esquema.
  • Questão Errada. Segundo Navathe, "Embora alguns recursos de mineração de dados estejam sendo fornecidos em SGBDRs, ela não é bem integrada aos sistemas de gerenciamento de banco de dados" (Sistemas de Banco de Dados, 6 ed, pag 698)
  • Essa questão é psicoteste pra eliminar os surtados. 

  • Prezados,

    A questão generalizou muito. As ferramentas de data mining disponibilizam algumas ferramentas para que usuários que não entendem muito de bancos de dados possam utilizar algumas funções, porém, ao afirmar que existe uma integração total entre os data mining e todos os SGBDs, e ao afirmar que qualquer usuário, até o que desconhece o esquema de dados, podem descobrir informações existente, a questão generalizou demais. 

    Portanto a questão está errada.

  • DESCONFIE DESSAS PALAVRAS:

    Existe uma integração total entre a tecnologia data mining e todos os SGBDs que permite a qualquer usuário, até mesmo aos que desconhecem o esquema de dados de um banco em SQL, descobrir informações nele existentes.

  • Gabarito: Errado.

    A data mining  é um procedimento que exige muito conhecimento de quem está envolvido no processo, dessa forma "qualquer usuário" já deixa a questão bem errada.


ID
638173
Banca
FUMARC
Órgão
PRODEMGE
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Analise as afrmativas abaixo em relação às técnicas de mineração de dados.
I. Regras de associação podem ser usadas, por exem- plo, para determinar, quando um cliente compra um produto X, ele provavelmente também irá comprar um produto Y.

II. Classifcação é uma técnica de aprendizado supervisionado, no qual se usa um conjunto de dados de treinamento para aprender um modelo e classifcar novos dados.

III. Agrupamento é uma técnica de aprendizado supervisionado que particiona um conjunto de dados em grupos.
Assinale a alternativa VERDADEIRA:

Alternativas
Comentários
  • Classificação é a estratégia que consiste na busca por uma função que consiga mapear (classificar) uma determinada ocorrência em uma dentre um conjunto finito e pré-definido de classes. A construção do modelo segundo esta estratégia, pressupõe o conhecimento prévio das possíveis classes e a correta classificação dos exemplos usados na modelagem. Várias são as aplicações para este tipo de abordagem, em análise de risco por exemplo, o objetivo pode ser o de classificar um potencial cliente entre as classes de excelente, bom ou mau pagador.

    Agregação (ou clustering ou agrupamento) consiste na busca de similaridades entre os dados tal que permita definir um conjunto finito de classes ou categorias que os contenha e os descreva. A principal diferença entre esta abordagem e classificação é que em agregação não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem. Descobrir grupos homogêneos de clientes é uma das possíveis aplicações e pode ser usada para ajudar na definição da estratégia de marketing a ser adotada.

    Associação por outro lado, consiste em identificar fatos que possam ser direta ou indiretamente associados. Esta estratégia é geralmente usada em aplicações onde se busca identificar itens que possam ser colocados juntos em um mesmo pacote de negociação. Por exemplo, a constatação de que vendas de cerveja e de fraldas descartáveis apresentam um comportamento ascendente às sextas-feiras pode levar à construção de uma hipótese que associe ambos os itens a um tipo especial de cliente. Associação também pode ser usada para avaliar a existência de algum tipo de relação temporal entre os itens constantes de uma base de dados.

    Regressão consiste na busca por uma função que represente, de forma aproximada, o comportamento apresentado pelo fenômeno em estudo. A forma mais conhecida de regressão é a linear, por exemplo, uma reta que minimiza o erro médio entre todos os valores considerados, mas também pode ser não linear.

    Predição envolve uma componente temporal, isto é, representa aquela classe de problemas nos quais estamos interessados em prever o comportamento ou valor futuro de uma determinada variável com base em valores anteriores desta mesma variável (mono-variável) ou em valores anteriores da variável de interesse e de outras variáveis (multi-variável).
  • Apenas acrescentando:
    Pelo texto do colega acima, quando é dito que na agregação "não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem", isto caracteriza uma técnica de aprendizado NÃO-SUPERVISIONADO, o que está em desacordo com a afirmativa III, tornando-a falsa.
  •  (III) Errado. Agrupamento é uma técnica de aprendizado não-supervisionado.  

    Mais conhecido como CLUSTERS.

  • supervisionado = classificação

    não supervisionado = clustering (agrupamento)


ID
661858
Banca
FCC
Órgão
INFRAERO
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Considere:
I. No Data Warehouse, o dado tem um valor histórico, por referir-se a algum momento específico do tempo, portanto, ele não é atualizável; a cada ocorrência de uma mudança, uma nova entrada é criada para sinalizar esta mudança.
II. O estágio de transformação no processo ETL deve ser capaz de selecionar determinadas colunas (ou nenhuma) para carregar; transformar múltiplas colunas em múltiplas linhas; traduzir e unificar códigos heterogêneos de um mesmo atributo, oriundos de diversas fontes de dados (tabelas).
III. No Snow Flake as subdimensões, por não serem normalizadas, geram aumento significativo no número de registros e, como consequência, aumentam também a quantidade de joins necessários à exibição de uma consulta.
IV. Data Mining é uma ferramenta de mineração de dados que executa a varredura nos dados históricos com o objetivo de desconsiderar o que é genérico sobre algum assunto e valorizar tudo que o for específico dentro do sistema.

Está correto o que consta em

Alternativas
Comentários
  • III. No Snow Flake as subdimensões, por não serem normalizadas, geram aumento significativo no número de registros e, como consequência, aumentam também a quantidade de joins necessários à exibição de uma consulta. ERRADO!

    No Snowflake as subdimensões são normalizadas até a terceira forma normal.

  • Dm valoriza o genérico,isso cortou fora as opções B,D,E = erradas

    C = errada, eu não sabia que era errada, mas pensa bem, a normalização aumenta a quantidade de joins, portanto mesmo eu que não sei fazer um snowflake descobri que está errado, se ele está desnormalizado talvez não precise de um join sequer


ID
704242
Banca
CESPE / CEBRASPE
Órgão
MPE-PI
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de conceitos básicos, arquiteturas e aplicações de data
warehouse e datamining
e técnicas de modelagem e otimização de
bases de dados multidimensionais, julgue os itens que se seguem.

Em datamining, o uso de holdout induz o modelo de classificação a partir do conjunto de treinamento, e seu desempenho é avaliado no conjunto de teste. Quanto menor o conjunto de treinamento, maior a variância do modelo; no entanto, se o conjunto de treinamento for grande demais, a precisão estimada calculada a partir do conjunto menor é menos confiável.

Alternativas
Comentários
  • holdout-maxpercent

    Um número inteiro entre 1 e 100 que indica a porcentagem de dados separados para teste.

    holdout-maxcases

    Um número inteiro que indica o número de máximo de casos usados para teste.

    Se o valor especificado para o máximo de casos for maior que o número de casos de entrada, todos os casos de entrada serão usados para teste e um aviso será emitido.

    Resposta: Certo

  • A fonte a seguir explica um pouco do que é cobrado na questão.

    http://www.saedsayad.com/model_evaluation.htm
  • Engraçado é quando o analista entrar lá no Ministério Público, ele nem vai ver isso, ou seja, é tudo terceirizado.
  • veja como uma amostra!

  • Não Fábio, não é terceirizado não. O MP formou a pouco tempo a equipe de BI dele. Antes simplesmente não tinha. Existem Analistas e Técnicos trabalhando com isso sim.


ID
746947
Banca
ESAF
Órgão
CGU
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

A Mineração de Dados é

Alternativas
Comentários
  • RESPOSTA CORRETA: (E)

    Segundo SIBELCHATZ  “O termo mineração de dados (Data Mining) se refere aproximadamente ao processo de analisar de forma semi-automática grandes bancos de dados para encontrar padrões úties (informações úteis - grifo meu). ... Ou seja, a mineração de dados lida com "descoberta de conhecimento em bancos de dados". ”.

    Fonte: SILBERCHATZ, A.; KORTH, H. F.; SUDARSHAN, S. Sistema de Banco de Dados. Tradução da 5ª ed. Rio de Janeiro: Elsevier, 2006. 782p.

    Abraços e bons estudos!!!

  • Quanto ao emprego da palavra "automática", em vez de semi-automática não tornaria a alternativa E errada?

  • Brincando um pouco com as opções "a" e "e" para tentar te ajudar com essa dúvida:

    Quando ele diz "O processo de desenvolvimento de soluções" ele está se referindo as regras (essas podem ser criadas de forma manual ou automática), define o que a gente quer procurar no banco, mas só isso não podemos dizer que é o ato de minerar dados.

    Agora em "o processo de descoberta" essa é a implementação da regra pelo SGBD, isso quer dizer ele vai varrer o banco de dados e retornar os valores que bateram com a regra, esse processo é feito pelo SOFTWARE logo é feito de forma automática.
  • Obrigado Frank. 

    Clareou bastante. Abs
  • complemento nas palavras de Navathe!

    Segundo Navathe(2011,p.698),"Como o termo indica, mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados."

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-2011-6 EDIÇÃO

  • Na minha concepção, a alternativa foi mal escrita pelo termo "automática", trata-se da operação de descoberta semi-automática. Devido a necessidade da supervisão humana para ajustes (parametrização) nos algoritmos.

  • Segundo as fontes que li, não se sabe ainda ao certo se a data mining pode ser considerada um processo 'automático'


ID
746953
Banca
ESAF
Órgão
CGU
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

São aspectos motivadores da Mineração de Dados:

Alternativas
Comentários
  • A banca retirou os aspectos de TAN et. al (2009, p. 05) e todos os que foram listados na assertiva C estão corretos. Um aspecto abordado no livro e não mencionado na questão é o de “Análises não tradicionais”. 

    Fonte: PATRÍCIA QUINTÃO - Ponto dos Concursos

  • Desafios para datamining

    -escalabilidade

    -alta dimensionalidade

    -dados complexos e heterogêneos

    -qualidade dos dados

    -propriedade e distribuição de dados

    -preservação da privacidade

    -dados em fluxo continuo

  • Desafios para Data Mining


    • Escalabilidade - Scalability
    • Alta dimensionalidade - Dimensionality
    • Dados complexos e heterogêneos - Complex and Heterogeneous Data
    • Qualidade dos dados - Data Quality
    • Propriedade e distribuição de dados - Data Ownership and Distribution
    • Preservação da privacidade - Privacy Preservation
    • Dados em fluxo contínuo - Streaming Data

     

    Fonte: Provas de TI

  • Letra C

    Escalabilidade. Alta dimensionalidade. Dados complexos e heterogêneos. Propriedade e distribuição de dados.


ID
781585
Banca
CESPE / CEBRASPE
Órgão
TJ-AL
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de otimização de consultas SQL em banco de dados e mineração de dados, assinale a opção correta.

Alternativas
Comentários
  • RBO (Rule Based Optimizer) Esta forma de otimização considera as regras de negócio para escolher a forma de recuperar as informações do banco de dados. A partir da versão 10g, a Oracle deixou de dar suporte ao otimizador, deixando suas funcionalidades disponíveis apenas para manter a compatibilidade com aplicações antigas. As novas aplicações desenvolvidas devem utilizar o CBO. Atualmente não são realizadas evoluções neste otimizador, mas apenas as correções de erros que eventualmente são encontrados.
    Para melhorar o desempenho de uma consulta, o RBO verifica apenas uma maneira de otimização. Ao encontrar a primeira forma aplicável, ele abandona o processo sem verificar se outros mecanismos podem ser aplicados.
    Esta série de artigos não detalhará este otimizador, uma vez que não é recomendada a construção de novos sistemas que utilizem este otimizador para melhorar o desempenho.
    CBO (Cost-Based Optimizer) Executa o comando de forma que consuma o mínimo de recursos de processamento. Para isto, o servidor de banco de dados busca maneiras alternativas para escrever o mesmo comando de forma que sua execução seja um processo mais simples. Para tentar verificar a melhor forma de escrever um comando, o otimizador utiliza as estatísticas e histogramas existentes para os objetos e operadores utilizados no comando. Caso as estatísticas ou histogramas não estejam disponíveis, o otimizador recorre a parâmetros previamente definidos para tentar chegar a uma solução melhor do que a apresentada.
    Enquanto o RBO pára a verificação logo após encontrar a primeira otimização possível, o CBO realiza todas as otimizações possíveis aplicáveis à consulta. O trabalho deste otimizador é maior do que o realizado pelo RBO, mas o resultado final é melhor do que o alcançado pelo otimizador baseado em regras de negócio, uma vez que os recursos gastos durante a execução da consulta são menores.
    Este otimizador também permite que o desenvolvedor dê sugestões (hints) a respeito de qual é a melhor forma de resolver um comando. Esta dica pode ser, por exemplo, a indicação de qual a melhor maneira de acessar os dados em uma tabela, ou a forma mais vantajosa de efetuar a junção entre duas tabelas.
    Disponível desde o Oracle 7, este é o principal otimizador do Oracle desde então, e a partir do Oracle 10g, tornou-se o único otimizador ainda em desenvolvimento. Por este motivo, este otimizador será descrito em detalhe nos próximos artigos.
  • Alguém de java pode explicar a letra "d"?
  • Através do Hibernate Statistics poderemos dizer quantas vezes cada entidade, coleção (relacionamento) e query está sendo carregada/executada, quantas vezes o cache foi usado, tempo médio de cada query, etc. Em mão desses dados, temos mais pistas de onde colocar cache, configurar batchsize e fazer joins com fetch eager. Fonte: Caelum (http://blog.caelum.com.br/cacando-seus-gargalos-com-o-hibernate-statistics/)
  • " Ao se habilitar hibernate.generate_statistics, o Hibernate exibe as métricas de otimização via JMX.""


    Ele não usa JMX, são Stats próprias como query mais demorada, quantas vezes ele foi no cache, etc
  • Raphael, veja o comentário do Gustavo, ele explica que o CBO gera diversas formas possíveis de realizar o comando e não apenas uma única maneira. Dessas, o otimizar escolhe a que for mais performática.


  • LETRA "a"

  • Fui por eliminação. Confesso que não dominava o conteúdo dessa questão.


ID
790921
Banca
FCC
Órgão
TST
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Leia as afirmações a seguir:


I. Um Data Warehouse é um repositório de dados atuais e históricos de uma organização que possibilita a análise de grande volume de dados para suportar a tomada de decisões estratégicas, possuindo registros permanentes.


II. O processo de Data Mining, ou mineração de dados, tem por objetivo localizar possíveis informações em um banco de dados através de comparações com dados informados pelo usuário e registros de tabelas.


III. Um ERP, ou Sistema Integrado de Gestão Empresarial, é conhecido por integrar os dados de diferentes departamentos de uma organização, aumentando o uso de interfaces manuais nos processos.


IV. As ferramentas OLAP (On-line Analytical Processing) são capazes de analisar grandes volumes de dados, fornecendo diferentes perspectivas de visão e auxiliando usuários na sintetização de informações.


Está correto o que se afirma APENAS em

Alternativas
Comentários
  • II. O processo de Data Mining, ou mineração de dados, tem por objetivo localizar possíveis informações em um banco de dados através de comparações com dados informados pelo usuário e registros de tabelas.

    Data Mining:
    –Processo de descobrir relacionamentos novos, padrões e tendências através da análise intensiva de grandes dados históricos, utilizando inteligência artificial e técnicas estatísticas e matemáticas.
  • III. Um ERP, ou Sistema Integrado de Gestão Empresarial, é conhecido por integrar os dados de diferentes departamentos de uma organização, aumentando o uso de interfaces manuais nos processos.
    hgjgfh
    Pelo contrario, o ERP elimina o uso de interfaces manuais.

    Vantagens:

    • Eliminar o uso de interfaces manuais
    • Otimizar o fluxo da informação e a qualidade da mesma dentro da organização (eficiência)
    • Otimizar o processo de tomada de decisão
    • Eliminar a redundância de atividades
    • Reduzir os limites de tempo de resposta ao mercado
    • Reduzir as incertezas do Lead time
    • Incorporação de melhores práticas (codificadas no ERP) aos processos internos da empresa
    • Reduzir o tempo dos processos gerenciais
    • Redução de estoque

    Desvantagens:
    • A utilização do ERP por si só não torna uma empresa verdadeiramente integrada;
    • Altos custos que muitas vezes não comprovam a relação custo/benefício;
    • Dependência do fornecedor do pacote;
    • Adoção de melhores práticas aumenta o grau de imitação e padronização entre as empresas de um segmento;
    • Torna os módulos dependentes uns dos outros, pois cada departamento depende das informações do módulo anterior, por exemplo. Logo, as informações têm que ser constantemente atualizadas, uma vez que as informações são em tempo real, ocasionando maior trabalho;
    • Aumento da carga de trabalho dos servidores da empresa e extrema dependência dos mesmos;

    Segundo uma pesquisa Chaos e Unfinished Voyages (1995) os principais fatores críticos de sucesso para um projeto de implantação de um ERP são:
    • Envolvimento do Usuário
    • Apoio da direção
    • Definição clara de necessidades
    • Planejamento adequado
    • Expectativas realistas
    • Marcos intermediários
    • Equipe competente
    • Comprometimento
    • Visão e objetivos claros
    • Equipe dedicada
    • Infraestrutura adequada
    • Constante qualificação da equipe usuária

    Fonte: Wikipedia
  • Só acho que na I citar que são dados atuais não é totalmente verdadeiro, nem sempre um DW vai ter dados atuais mas sim dados históricos, ou depende do ponto de vista do que se compreende por atual então. Eu achei essa afirmação errada, alguém pode opinar?

  • Caro colega, a resposta o site já nos diz ;)

  • Michele, a resposta foi colocada para aqueles que só têm acesso a 10 respostas por dia e já estouraram o limite diário. Algumas pessoas não concordam com isso, mas eu acho isso válido.

  • Paulo, sim, depois eu compreendi que era isso, mas alguns não parece que é essa a finalidade, mas enfim se ajuda alguém tá valendo.

  • II. O processo de Data Mining, ou mineração de dados, tem por objetivo localizar possíveis informações em um banco de dados através de comparações com dados informados pelo usuário e registros de tabelas. 

    * localizar informações do DataWareHouse e não no banco de dados.

    III. Um ERP, ou Sistema Integrado de Gestão Empresarial, é conhecido por integrar os dados de diferentes departamentos de uma organização, aumentando o uso de interfaces manuais nos processos. 

    * aumentando uso de interfaces manuais??? a intenção não seria de automatizar os processos.

  • Na vdd eu sabia quais afirmações estavam erradas, eu só não sabia que afirmações a FCC considerava erradas, kkkkk

  • Agora ninguém percebeu o erro da I

    I. Um Data Warehouse é um repositório de dados atuais e históricos de uma organização que possibilita a análise de grande volume de dados para suportar a tomada de decisões estratégicas, possuindo registros permanentes.

    os registros podem ser excluídos, só não podem ser alterados. Isso faz parte da sumarização de dados históricos por exemplo. 

  • Tecnicamente nada impede que um DW tenha dados atuais, ainda que a definição do que é "atual" possa ser subjetiva, mas as alternativas II e III estavam claramente erradas. Só tive certeza da IV mesmo.

  • no Data mining a questão é total ou parcialmente descnhecida e a ferramenta é utlizada para a busca do conhecimento, ou seja, o usuário não irá informar dados, para a busca.

  • imagina que você implementa um ERP entre todos os setores da fábrica, o que vai acontecer? Vai aumentar a quantidade de gente tendo que passar o dia digitando e clicando em várias interfaces?

    Claro que não, isso aqui foi o ponto chave pra facilitar a questão.

  • I – É verdade! Os DWs guardam dados atuais e históricos que não são modificados ou removidos. O propósito desse tipo de banco de dados é subsidiar a tomada de decisão. CERTA

    II – Esse não é bem o objetivo de mineração de dados. A ideia é buscar padrões e relacionamentos ocultos em grandes conjuntos de dados. ERRADA

    III – A ideia dos ERPs é justamente diminuir a utilização de interfaces manuais, ao informatizar os diferentes processos da empresa. Essa alternativa você não precisava saber, já que não faz parte do nosso assunto. Assim, não se preocupe se errou! ERRADA

    IV – Os cubos OLAP são estruturas multidimensionais, permitindo que se visualize os dados sob diferentes perspectivas e se realize análises em diversos níveis de agregação. CERTA

    Gabarito: E

  • III. Um ERP, ou Sistema Integrado de Gestão Empresarial, é conhecido por integrar os dados de diferentes departamentos de uma organização, aumentando o uso de interfaces manuais nos processos.


ID
792445
Banca
ESAF
Órgão
Receita Federal
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Um data mining inteligente descobre informações em data warehouses onde consultas e relatórios não conseguem revela-las. Ferramentas de data mining encontram padrões em dados e podem até deduzir regras a partir deles. Os métodos usados para identificar padrões em dados são

Alternativas
Comentários
  • Os três métodos utilizados para se identificar padrões em dados são:
    • Modelos simples (Consultas SQL, OLAP, e raciocínio humano)
    • Modelos intermediários (regressão, árvores de decisão, agrupamento)
    • Modelos complexos (redes neurais, outra indução de regras)
  • Apenas para mostrar uma referência, vou repetir o comentário do colega acima. Em [1], temos:

    "De acordo com NEMATI e BARKO (apud TURBAN et al., 2009) são usadostrês métodos para identificar padrões em dados:

    - Modelos simples (consultas baseadas em SQL, OLAP, raciocíniohumano)
    - Modelos intermediários (regressão, árvores de decisão, agrupamento)
    - Modelos complexos (redes neurais, outra indução de regras)" (Meu grifo)

    Referência:
    [1] Data Mining: http://pt.scribd.com/doc/61492282/33/Data-Mining-Mineracao-de-Dados
  • Um ambiente de apoio à tomada de decisões, integrando técnicas de data mining sobre um ambiente de data warehousing, possibilita um grande número de aplicações, que já vêm sendo implementadas em diversos segmentos de negócios, como manufatura, automação de pedido de remessas, varejo, gerenciamento de inventários, financeiro, análise de risco, transporte, gerenciamento de frotas, telecomunicação, análise de chamadas, saúde, análise de resultados, marketing, estabelecimento do perfil dos consumidores, seguros, detecção de fraude, dentre outros.

    Basicamente, são usados 3 métodos para identificar padrões em dados:

    ·         Modelos simples (consultas baseadas em SQL, raciocínio humano);

    ·         Modelos intermediários (regressão, arvores de decisão, agrupamento);

    ·         Modelos complexos (redes neurais, outra indução de regras).

     

    Fonte: www.casadoconcurseiro.com.br

    Professor: Júlio Alves


ID
804751
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o  item  subsequente , a respeito de datawarehouse e business intelligence (BI).

A exploração, no sentido de utilizar as informações contidas em um datawarehouse, é conhecida como data mining.

Alternativas
Comentários
  • O DATA MINING POSSUI, BASICAMENTE, TRÊS OBJETIVOS:

    > EXPLORATÓRIO (BUSCA POR NOVOS PADRÕES); 
    > CONFIRMATÓRIO (CONFIRMAR UMA HIPÓTESE);
    > EXPLANATÓRIO (EXPLICAR UM EVENTO "ANORMAL")

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

  • Qualquer uso de informação de um DW seria um Data mining? Fiqeui com essa dúvida

  • Data Mining busca informação para ajudar na tomada de decisão

  • Feliz natal!

  • Comparando os processos de Data Mining e Data Warehouse, concluímos que:

    Data Mining não depende do Data Warehouse, mas obtém-se melhores resultados quando aplicados em conjunto. Especialistas definem Data Warehouse como um depósito central de dados, extraído de dados operacionais, em que a informação é orientada a assuntos, não volátil e de natureza histórica. Devido a essas características, Data Warehouses tendem a se tornar grandes repositórios de dados extremamente organizados, facilitando a aplicação do Data Mining.

    Ou seja, o DW armazena uma grande quantidade de dados ao longo do tempo e isso é perfeito para o Data mining.

    https://sites.google.com/site/mineracaodedados1b/data-mining-x-datawarehouse

  • com o fim de...

  • O DATA MINING é um processo utilizado para a extração de dados de grandes repositórios, por exemplo um DATAWAREHOUSE para tomada de decisão.

    Gabarito: CERTO

  • O gabarito está correto, mas vale dizer que a atuação embasada em Data Mining não está restrita ao ambiente do D.W.

  • Mias genérico que paracetamol!

  • Relação D.M x D.W - Questões Cespe:

    • O processo de mineração de dados está intrinsecamente ligado às dimensões e a fato, tendo em vista que, para obtenção de padrões úteis e relevantes, é necessário que esse processo seja executado dentro dos data warehouses = E.

    • No processo de Data Mining (mineração de dados), é indispensável o uso de técnica conhecida como Data Warehousing, uma vez que a mineração de dados deve ocorrer necessariamente em estruturas não normalizadas (FN0) = E.

    • O data mining tem por objetivo a extração de informações úteis para tomadas de decisão com base nos grandes volumes de dados armazenados nas organizações. Os dados para o data mining são originados restritamente dos data warehouses, pois estes são os que aglomeram enorme quantidade de dados não voláteis e organizados por assunto = E.

    • A exploração, no sentido de utilizar as informações contidas em um datawarehouse, é conhecida como data mining = C.

    • O data mining é um processo utilizado para a extração de dados de grandes repositórios para tomada de decisão, mas sua limitação é não conseguir analisar dados de um datawarehouse = E.

    Gabarito correto.


ID
813067
Banca
AOCP
Órgão
TCE-PA
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Sobre a Mineração de Dados, é correto afirmar que

Alternativas
Comentários
  • Clustering é uma técnica de Data Mining para fazer agrupamentos automáticos de dados segundo seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo. Wikipédia

  • Gabarito: E

     

    Palavras chaves:

     

    Agrupamento (Clustering): encontrar grupos nos dados

  • Qual erro da B?

  • O erro do item B é que não é Sequência, mas sim Classificação

     

    "Classificação: Reconhece modelos que descrevem o grupo ao qual o item pertence por meio do exame dos itens já classificados e pela inferência de um conjunto de regras. "

     

    https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados


ID
813070
Banca
AOCP
Órgão
TCE-PA
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

São tarefas de mineração de dados, apenas:

Alternativas
Comentários
  • LETRA "A" 

  • Algumas alternativas apresentam técnicas.


ID
814417
Banca
AOCP
Órgão
TCE-PA
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

O processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre variáveis e novos subconjuntos de dados, é conhecido como

Alternativas
Comentários
  • e-

    Data mining implica a aplicação sistematica de metodos estaticos de volumes de dados (big data) para reconhecer conexoes entre eles. 

  • Gabarito E

    Prospecção de dados (português europeu) ou mineração de dados (português brasileiro) (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

    No campo da administração, a mineração de dados é o uso da tecnologia da informação para descobrir regras, identificar fatores e tendências-chave, descobrir padrões e relacionamentos ocultos em grandes bancos de dados para auxiliar a tomada de decisões sobre estratégia e vantagens competitivas.



    "Retroceder Nunca Render-se Jamais !"

    Força e Fé !

    Fortuna Audaces Sequitur !


ID
827938
Banca
CESPE / CEBRASPE
Órgão
TJ-RO
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere a data mining e sistemas de suporte a decisão, assinale a opção correta.

Alternativas
Comentários
  • resposta correta letra C

    LETRA D - o Data Mining é uma fase do KDD.

     

     

  • GAB C
    Regras de Associação
    -Relacionam a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.

     

    SOBRE A LETRA E:

    Classificação
    - É o processo de encontrar um conjunto de modelos que descrevem e distinguem classes ou conceitos.

  • Quanto à alternativa E.

     

    Na verdade, a assertativa traduz o conceito geral da técnica de Clustering e não de Classificação.

     

    O objetivo principal de clustering é separar objetos ou observações em classes naturais, de forma que, os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.

  • Quanto à letra A - algoritmos ID3 e C4.5 são para árvore de decisão (classificação). K-means, na verdade, que é para clusterização.

  • Gabarito: C

    A técnica de associação em data mining verifica se há controle ou influência entre atributos ou valores de atributos, no intuito de verificar, mediante a análise de probabilidades condicionais, dependências entre esses atributos.

    A) Algoritmos ID3 e C4.5 são para árvore de decisão (classificação). K-means, na verdade, que é para clusterização.

    As árvores de decisão são representações simples do conhecimento e têm sido aplicadas em sistemas de aprendizado. Elas são amplamente utilizadas em algoritmos de classificação, como um meio eficiente para construir classificadores que predizem classes baseadas nos valores de atributos. Assim, podem ser utilizadas em várias aplicações como diagnósticos médicos, análise de risco em créditos, entre outros exemplos.

    B) Basket é regra de associação;

    D) Embora KDD e Data Mining sejam frequentemente entendidos como sinônimos, é importante frisar que, enquanto o KDD compreende todas as etapas para a descoberta do conhecimento a partir da existência de dados, a Mineração de Dados é apenas e tão somente uma das etapas do processo.

    E) O objetivo principal de clustering é separar objetos ou observações em classes naturais, de forma que, os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.

    Aprofundando:

    Cada tipo de aplicação de DM é suportado por um conjunto de aproximações algorítmicas que são utilizadas para extrair as relações relevantes nos dados. Estas aproximações diferem em função do tipo de problema que visam solucionar. A maioria dos investigadores nesta área divide os estudos de DM da seguinte forma:

    º Classificação e regressão (aprendizagem supervisionada);

    º Clusterização (aprendizagem não supervisionada);

    º Associação (aprendizagem não supervisionada);

    º Análise de sequenciação (aprendizagem não supervisionada);

    º Estimação (aprendizagem supervisionada);

    º Visualização.


ID
835915
Banca
FDC
Órgão
MAPA
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

No tocante ao data mining, o tipo de informação que é extraída desta ferramenta, em que se pode descobrir, por exemplo, que, quando se compra uma casa, compra-se também uma geladeira, considerando-se que essas compras são realizadas num período de duas semanas, é:

Alternativas
Comentários
  • RESPOSTA: E

    maldição, marquei a letra D!

    Segundo Navathe(2011,p.699),"Padrões sequenciais: por exemplo, suponha que um cliente compre uma câmera e dentro de três meses ele ou ela compre suprimentos fotográficos,depois, dentro de seis meses, ele ou ela provavelmente comprará um item de acessório. Isso define um padrão sequencial de transações."

    Em outro trecho do Navathe.

    Segundo Navathe(2011,p.701),"Padrões sequenciais: [...] A detecção de padrões sequenciais é equivalente à detecção de associações entre eventos com certos relacionamentos temporais."


    **Portanto, uma peca de gente errou a questão, inclusive eu, porque não nos atentamos ao seguinte trecho: [...] realizadas num período de duas semanas. Esse é o trecho safado que distingue a sequencia da associação.

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-6 EDIÇÃO 2011-NAVATHE




  • Também fui seco na D.

     

    Ainda não conhecia esse conceito de sequência.

  • Padrões Sequenciais
    A ordem em que conjuntos estão alinhados refletem a ordem CRONOLÓGICA em que acontecem os fatos representados por estes conjuntos.

     

    Associações

    Relacionam a presença de um conjunto de itens com outra faixa de valores de um outro conjunto.
    ex: Compro um tenis e levo meias ou compro carne e levo carvão.

     

     

    ---> Não confundir os dois, o segredo é identificar se a questão está pedido ordem CRONOLOGICA/TEMPO, se pedir isso será padrões sequenciais.

     

  • CUIDADO

    AS BANCAS GOSTAM DE CONFUNDIR: ASSOCIACAO e PADROES SEQUENCIAS TEMPORAIS

  • Pensei que padrões sequenciais e temporais fossem regras de associação.

    Alguém ajuda?

  • Tipo de informação que é extraída desta ferramenta, em que se pode descobrir, por exemplo, que, quando se

    compra uma casa, compra-se também uma geladeira é um exemplo clássico de Regras de Associação (Letra D).

    Fonte: Estratégia Concursos. E agora?

  • A questão quer saber se sabemos diferenciar associação de padrões sequenciais temporais.

    Falou em período de tempo, falou que comprou o item B (geladeira) em x dias, semanas (duas, no caso dessa questão) ou meses depois do produto A (casa); então, falou de padrões sequenciais temporais. Isso porque a ordem em que conjuntos estão alinhados refletem a ordem cronológica.

    Se falasse, por outro lado, que comprou os 2 itens na mesma hora, como tenis-meias; carne-carvão; creme craque- goiabada; estariamos diante de associações, o que não foi o caso.

    Sendo assim,

    Gab. E) Sequência

  • então, mesmo sendo um padrão de sequência , ela é uma associação.

    Alguém para me refutar? Queria entender, pois para mim a técnica de Associação possui o padrão de sequência e o padrão temporal


ID
852616
Banca
CESPE / CEBRASPE
Órgão
SEDUC-AM
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

    Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.

A partir dessa situação, julgue o item.

A mineração de dados (data mining) é um método computacional que permite extrair informações a partir de grande quantidade de dados.

Alternativas
Comentários
  • Prospecção de dados (português europeu) ou mineração de dados (português brasileiro) (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados
  • Gabarito: CERTO

     

    Mineração de dados (em inglês, data mining) é o processo de encontrar anomalias, padrões e correlações em grandes conjuntos de dados para prever resultados. Ao empregar uma ampla variedade de técnicas, você pode usar essa informação para aumentar a renda, cortar custos, melhorar o relacionamento com os clientes, reduzir riscos e mais.

     

    https://www.sas.com/pt_br/insights/analytics/mineracao-de-dados.html

  • Posso dizer que:

    o ETL extrai DADOS de um grande volume de dados; e 

    que o Data Mining extrai INFORMAÇÃO de um grande volume de dados??????

  • A Mineração de Dados realmente permite extrair informações a partir de uma grande quantidade de dados – em geral, extraídas de Data Warehouses.

    Gabarito: Correto 

  • A mineração de dados é um processo que permite encontrar padrões e relacionamentos ocultos em

    conjuntos de dados, de modo a subsidiar a tomada de decisão.

    Fases:

    Seleção -> Pré-Processamento -> Transformação -> Mineração de Dados -> Interpretação/Avaliação 

    GAB C

  • CERTO

    Mineração de Dados é um conjunto de técnicas que envolvem métodos matemáticos, algoritmos e heurísticas para descobrir padrões e regularidades em grandes conjuntos de dados. (Possa et al, 1998)

    Mineração de Dados é a exploração e análise de dados, por meio automático ou semiautomáticos, em grandes quantidades de dados, com o objetivo de descobrir regras ou padrões interessantes (Berry & Linoff, 1997)

    Mineração de Dados é a análise de grandes conjuntos de dados a fim de encontrar relacionamentos inesperados e de resumir os dados de uma forma que eles sejam tanto úteis quanto compreensíveis ao dono dos dados. (Hand et al)

  • (C)

    Outras da CESPE /DATA MINING que ajudam a responder:

    A descoberta de novas regras e padrões em conjuntos de dados fornecidos, ou aquisição de conhecimento indutivo, é um dos objetivos de data mining.(C)

    Árvores de decisão e regras de associação são exemplos de algoritmos de data mining.(C)

    As ferramentas de Data Mining permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa, dentre outras.(C)

    A finalidade do uso do data mining em uma organização é subsidiar a produção de afirmações conclusivas acerca do padrão de comportamento exibido por agentes de interesse dessa organização.(C)

    O uso prático de data mining envolve o emprego de processos, ferramentas, técnicas e métodos oriundos da matemática, da estatística e da computação, inclusive de inteligência artificial.(C)

    Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.(C)

    Na implementação de mineração de dados (data mining), a utilização da técnica de padrões sequenciais pode ser útil para a identificação de tendências.(C)

  • Mineração de dados é uma das fases do processo de KDD, que é a descoberta de conhecimento sobre o banco de dados. Por conta disso, mineração de dados pode se dá em qualquer grande volume de dados em DW, DM e Big Data.


ID
872701
Banca
CESPE / CEBRASPE
Órgão
TJ-AC
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

No que diz respeito a sistemas de suporte a decisão, julgue os itens subsequentes.


O data mining possibilita analisar dados para obtenção de resultados estatísticos que poderão gerar novas oportunidades ao negócio.

Alternativas
Comentários
  • O data mining representa, para muitas empresas, uma grande oportunidade para obter vantagens competitivas sobre os concorrentes, impactando de forma extremamente positiva sobre a taxa de resposta das campanhas promocionais.

    Provendo ainda uma série de oportunidades de negócio.


    Óbvio!

    Fonte: http://portal.nce.ufrj.br/index.php?option=com_content&view=category&layout=blog&id=60&Itemid=93

  • A assertiva está correta! A mineração de dados envolve várias técnicas estatísticas para produzir os resultados das análises. O objetivo geral do processo é extrair padrões e relacionamentos previamente desconhecidos nos conjuntos de dados, o que guarda relação com a descoberta de novas oportunidades de negócio.

  • CERTO

    Mineração de Dados é um campo interdisciplinar que junta técnicas de máquinas de conhecimentos,  reconhecimento de padrões, estatísticas, banco de dados e visualização, para conseguir extrair informações de grandes bases de dados. (Cabena et al)

    "gerando novas oportunidades ao negócio e auxiliando na tomada de decisões"

  • Associa as informações e manifesta esse conteúdo em uma base de dados. Ex: Publicação de um edital e o aumento de vendas de Rivotril.

  • TI + ESTATÍSTICA = CIDADES FUTURÍSTICAS. AGUARDEM.

  • Conceito genérico que serve tanto para data mining, como para business intelligence


ID
888952
Banca
CESGRANRIO
Órgão
EPE
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

As técnicas de mineração de dados podem ser categorizadas em supervisionadas e não supervisionadas.


As técnicas de árvores de decisão, agrupamento e regras de associação são categorizadas, respectivamente, como

Alternativas
Comentários
  • Gabarito C.

    Árvores de decisão é uma tarefa de classificação. Classificação e Regressão são exemplos da Categoria Supervisionada.

    Agrupamento e Regras de associação são tarefas Não Supervisionadas.

     

    Referências: página 10 ->  http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf  

  • SUPERVISIONADO: VOCÊ SUPERVISIONA A ENTRADA E SAÍDA.

    NÃO SUPERVISIONADO: ELA DEDUZ SOZINHA, VC SÓ DA ENTRADA.


ID
892048
Banca
IBFC
Órgão
INEP
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Conforme o modelo CRISP-DM o ciclo de vida de um projeto de mineração de dados consiste de 6 (seis) fases que são:

Alternativas
Comentários
  • Gabarito: Letra A


    Observar o item 6.2 do link.

    https://books.google.com.br/books?id=HN6sCQAAQBAJ&pg=PT215&lpg=PT215&dq=fases+CRISP-DM&source=bl&ots=3rvF_LhJK9&sig=gIRgaI0gf69y4Wis7koKD4xeoCU&hl=pt-BR&sa=X&ved=0ahUKEwjRjPiiztzJAhWISiYKHeatD1o4ChDoAQg-MAU#v=onepage&q=fases%20CRISP-DM&f=false


  • 1- Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

    2- Entender os Dados: recolhimento de dados e inicio de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.

    3- Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.

    4- Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

    5- Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

    6- Desenvolvimento: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.

     

    Fonte: https://pt.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining

  • Fases da Mineração de Dados - (CRISP-DM)


    Propõe uma visão geral do ciclo de vida de um projeto de mineração de dados.

     

    FASES:

    -Entendimento do Negócio
    -Seleção dos Dados
    -Limpeza dos Dados
    -Modelagem dos Dados
    -Avaliação do Processo
    -Execução

     

    Fonte: Provas de TI
     

  • GABARITO A!

    Fases do CRISP-DM

    ENTENDIMENTO DO NEGÓCIO

    ENTENDIMENTOS DOS DADOS

    PREPARAÇÃO DOS DADOS

    MODELAGEM

    TESTE & AVALIAÇÃO

    IMPLEMENTAÇÃO

  • Letra A

    Entendimento do negócio = Compreensão do Negócio

    Entendimento dos dados = Compreensão dos Dados

    Preparação dos dados

    Modelagem dos dados

    Avaliação

    Implementação = Desenvolvimento

    ___________________________________________________

    Etapas: (“EE.PM.AI”)

    - Entendimento do negócio: definir os objetivos, requisitos, e o problema

    - Entendimento dos dados: entender e conhecer os dados

    - Preparação dos dados: limpeza e preparação dos dados para a modelagem

    - Modelagem dos dados: aplicação de técnicas de data mining sobre os dados

    - Avaliação: realização de testes para validar os dados

    - Implementação: execução 


ID
913273
Banca
FMP Concursos
Órgão
MPE-AC
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados é conhecido como

Alternativas
Comentários
  • - Data Warehouse: coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão. O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP). São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados.
    Os dados estão disponíveis somente para leitura e não podem ser alterados. O Data Warehouse é um banco de dados multidimensional grande, de escopo organizacional (ou seja, abrange toda a empresa) e reúne dados de todos os departamentos de forma a permitir a busca rápida de informações para auxiliar a tomada de decisões estratégicas. A principal ideia do Data Warehouse é construir um depósito no qual será mantida a memória histórica dos dados, possibilitando a utilização dos mesmos para consulta e análise estratégica para a tomada de decisão. A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.

    - Data Mart: é um banco de dados multidimensional de escopo departamental (ou seja, abrange apenas um determinado departamento). “Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehousesetorial” (Kimball). As diferenças entre o Data Mart e o Data Warehouse são apenas com relação ao tamanho e ao escopo do problema a ser resolvido.

    - Data Mining (ou Mineração de dados): define uma série de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse ou Data Mart à procura de padrões e tendências a respeito dos dados armazenados. Processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis. Objetivos do Data Mining: conhecer o comportamento de certos atributos no futuro; possibilitar a análise de determinados padrões de eventos; categorizar perfis individuais ou coletivos de interesse comercial; apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa. As técnicas mais conhecidas de Data Mining (que também são chamadas de tarefas, por alguns autores) são: Descrição de Classes, Associação, Classificação, Previsão e Agrupamento (também conhecida como “clustering”). Alia-se a estas técnicas ainda, algumas ferramentas estatísticas como Regressão Linear, Modelo Linear Generalizado e Análise de Correlação. 

    Fiquem com Deus!
  • LETRA C. MINERAÇÃO DE DADOS

    Segundo Navathe(2011,p.698),"Como o termo indica, mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados."

    Segundo Navathe(2011,p.700),"É comum descrever o conhecimento descoberto durante a mineração de dados da seguinte forma: regras de associação, hierarquias de classificação, padrões sequenciais, padrões dentro de série temporal e agrupamento."

    Bibliografia:
    SISTEMAS DE BANCO DE DADOS. 6 EDIÇÃO 2011. NAVATHE
  • Peço licença e replico comentário para melhor visualização.

     

    Data Warehouse: coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão.

    O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP).

    São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados.


    A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.

     

    Data Mart: é um banco de dados multidimensional de escopo departamental (ou seja, abrange apenas um determinado departamento).

    “Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehouse setorial” (Kimball).

    As diferenças entre o Data Mart e o Data Warehouse são apenas com relação ao tamanho e ao escopo do problema a ser resolvido.

     

    Data Mining (ou Mineração de dados): define uma série de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse ou Data Mart à procura de padrões e tendências a respeito dos dados armazenados.

    Processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis.

     

    Objetivos do Data Mining:

     

    * conhecer o comportamento de certos atributos no futuro;

    * possibilitar a análise de determinados padrões de eventos;

    * categorizar perfis individuais ou coletivos de interesse comercial;

    * apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa.

     

    As técnicas mais conhecidas de Data Mining são: Descrição de Classes, Associação, Classificação, Previsão e Agrupamento (também conhecida como “clustering”).

    Alia-se a estas técnicas ainda, algumas ferramentas estatísticas como Regressão Linear, Modelo Linear Generalizado e Análise de Correlação.

  • As palavras-chave para nos ajudar: explorar dados; procurar padrões consistentes; detectar relacionamentos sistemáticos; novos subconjuntos de dados – tudo isso nos remete ao processo de Mineração de Dados (Data Mining).

    Fonte: pdf- estratégia concursos


ID
917131
Banca
ESAF
Órgão
MF
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

A Mineração de Dados requer uma adequação prévia dos dados através de técnicas de pré-processamento. Entre elas estão as seguintes técnicas:

Alternativas
Comentários
  • FONTE:http://www.itnerante.com.br/profiles/blogs/coment-rio-prova-stn-2013-esaf-quest-es-de-bd-bi-infra-estrutura

    Essa questão não mede o grau conhecimento do candidato e sim a sua capacidade de decorar uma lista, que cada dia cresce mais, de técnicas de datamining, mas precisamente das técnicas de pré-processamento. A lista foi retirada do livro do TAN. Veja abaixo a lista em inglês, uma tradução ao pé da letra encontra-se na alternativa E,na mesma ordem apresentada.

    AggregationSamplingDimensionality ReductionFeature subset selectionFeature creationDiscretization and BinarizationAttribute Transformation

  • Gabarito: E.

    Técnicas de Pré-Processamento:

    Agregação: Combina dois ou mais atributos (ou objetos) em um único atributo (ou objeto) com a finalidade de reduzir o número de atributos ou objetos, alterar escalas e tornar os dados mais estáveis.

    Amostragem: O princípio básico é: usar uma amostra funciona tão bem quanto usar o conjunto completo de dados, se a amostra for representativa. Ela é representativa se tiver aproximadamente as mesmas propriedades de interesse do conjunto inicial.

    Redução de Dimensionalidade: Essa técnica reduz a quantidade de tempo e memória necessárias pelos algoritmos de mineração de dados, permitindo que os dados sejam mais facilmente visualizados e ajudando a eliminar características irrelevantes.

    Seleção de Subconjuntos de Recursos: Trata-se de outra forma de reduzir a dimensionalidade dos dados, buscando eliminar características redundantes ou irrelevantes por meio de diversas abordagens diferentes.

    Criação de Recursos: Essa técnica busca criar novos atributos que podem capturar informação importante em um conjunto de dados muito mais eficientemente que os atributos originais.

    Binarização e Discretização: Técnica que busca transformar dados para um formato de atributos binários ou discretos.

    Transformação de Variáveis: Essa técnica busca melhorar a eficiência de algoritmos de classificação envolvendo redes neurais e auxiliar técnicas estatísticas que se baseiam na suposição da normalidade dos dados.

    Fonte: Minhas anotações.

    Bons estudos!


ID
917134
Banca
ESAF
Órgão
MF
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Uma técnica de classificação em Mineração de Dados é uma abordagem sistemática para

Alternativas
Comentários
  • Agora me diz por que um ser desses é capaz de colocar um comentário só com a resposta da questão?
    São várias questões com o mesmo estilo de comentário... Fala sério...
  • FONTE:http://www.itnerante.com.br/profiles/blogs/coment-rio-prova-stn-2013-esaf-quest-es-de-bd-bi-infra-estrutura

    Essa questão trata de classificação, uma tarefa de data mining. A classificação pode ser entendida como o processo de encontrar um conjunto de modelos (funções) que descrevem e distinguem classes ou conceitos, com o propósito de utilizar o modelo para predizer a classe de objetos que ainda não foram classificados. Segundo o LIVRO TAN, a definição também pode ser a tarefa de aprender uma função alvo f que mapeie cada conjunto de atributos x para um dos rótulos de classes y pré-determinados. Com a ajuda das duas definições acima podemos chegar à resposta na letra B. 

  • Para quem tem o plano básico conseguir ver as respostas. Também acho péssimo.

  • b-

    Tema abordado dentro do Modelo de Classificação Preditiva

    Uma técnica de classificação é uma abordagem sistemática para construção de modelos de classificação a partir de um conjunto de dados de entrada.

    Classificadores de árvores de decisão , classificadores baseados em regras, redes neurais, máquinas de vetor de suporte e classificadores bayesianos

    Cada técnica emprega um algoritmo de aprendizagem.

    https://www.coursehero.com/file/46847194/ML-Aula09pdf/


ID
923665
Banca
FUNCAB
Órgão
CODATA
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Em um armazém de dados do tipo data warehouse, a mineração de dados pode ser feita por meio de uma ferramenta conhecida como:

Alternativas
Comentários
  • DataMining agora é ferramenta?
  • Muito estranho essa questão...

    Mineração de dados = Data Mining
    Ou seja... "Data Mining pode ser feita por meio de uma ferramenta conhecida como Data Mining".

    ¬¬
  • Essa FUNCAB é uma das bancas mais fuleiras. Deveria ser proibida de aplicar provas de TI pois não possuem examinadores qualificados nesta área.


    Dataming não é ferramenta!

    "Talvez a definição mais importante de data mining tenha sido elaborada por Fayyad e colaboradores (1996:4): "...o processo não-trivial de identificar, em dados, padrões válidos, novos, potencialmente úteis e ultimamente compreensíveis".

    Data mining, ou mineração de dados, é uma área de pesquisa multidisciplinar, incluindo principalmente as tecnologias de bancos de dados, inteligência artificial, estatística, reconhecimento de padrões, sistemas baseados em conhecimento, recuperação da informação, computação de alto desempenho e visualização de dados."

    http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-76122008000300004


    Ferramentas de Data Mining são: 

    Clementine (SPSS); SAS Enterprise Miner Suite; WEKA, Oracle Data Mining; IBM Intelligent Miner e várias outras...



    E outro detalhe é que o examinador não sabe o que signfica CASE (Computer-aided software engineering).

    Ferramentas CASE podem sim ser utilizadas em Mineração de Dados.

    http://www.mhhe.com/engcs/compsci/pressman/olc_linkedcontent/casetools.htm


  • N'ao sabia que DataMining eh uma ferramenta, que empresa desenvolveu? Oracle?

  • Isso é questão de DW ou de inglês?

  • Melhor comentário - Rannye Foster.

     

    Uma beleza essa questão. Pulem para a próxima que vale mais a pena.


ID
928681
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens que se seguem, acerca de data mining e data
warehouse.

A data mining apóia a descoberta de regras e padrões em grandes quantidades de dados. Em data mining, um possível foco é a descoberta de regras de associação. Para que uma associação seja de interesse, é necessário avaliar o seu suporte, que se refere à freqüência com a qual a regra ocorre no banco de dados.

Alternativas
Comentários
  • Suporte mínimo e confiança mínima são fatores considerados relevantes, para que uma regra de associação seja avaliada.

    Suporte é calculado através da freqüência que a transação ocorre no banco de dados, com determinado conjunto de itens, e dividido pelo 
    número total de transações.

    Se o percentual do suporte gerado for baixo, sugere que não existe evidência expressiva que os itens em X ∪ Y ocorram juntos, considerando que o conjunto de itens ocorre em uma pequena fração de transações (ELMASRI, 2005). 
     
    Suporte = X ∪ Y / número total de registros 
     
    A confiança da regra é calculada de forma semelhante ao suporte, porém a divisão é feita considerando apenas a freqüência em que X ocorre. 
     
    Confiança = X ∪ Y / número de registro com X 
     
    A medida de confiança tem por objetivo, demonstrar a qualidade da mesma, indicando o quanto a ocorrência do antecedente da regra pode garantir a ocorrência do conseqüente (GOLDSCHMIDT, 2005)

    http://tconline.feevale.br/tc/files/0002_1696.pdf
  • Segundo Elmasri e Navathe, 6ª Edição:

    Em geral,, qualquer regra de associação tem a forma LHS (lado esquerdo ou left-hand side) => RHS (lado direito ou right-hand side), onde LHS e RHS são conjuntos de itens. O conjunto LHS U RHS é o chamado itemset, o conjunto dos itens comprados pelos clientes. 

    O suporte para uma regra HS => RHS é com relação ao itemset; ele se refere à frequencia com que um itemset específico ocorre no banco de dados. Ou seja, o suporte é o percentual de transações que contêm todos os itens no itemset LHS U RHS.

    A confiança é com relação à implicação mostrada na regra. A confiança da regra LHS => RHS é calculada como o suporte(LHS U RHS)/suporte(LHS). Podemos pensar nela como a probabilidade de que os itens no RHS sejam comprados, dado que os itens no LSH são comprados por um cliente. Outro termo para confiança é força da regra.
  • CERTO
    Só um complemento ao colega acima ainda segundo NAVATHE. (PRIMEIRA PARTE)

    Segundo Navathe(2011,p.698),"Como o termo indica, mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados."

    Segundo Navathe(2011,p.700),"É comum descrever o conhecimento descoberto durante a mineração de dados da seguinte forma: regras de associação, hierarquias de classificação, padrões sequenciais, padrões dentro de série temporal e agrupamento."

    Bibliografia:
    SISTEMAS DE BANCO DE DADOS. 6 EDIÇÃO 2011. NAVATHE


  • Regras de Associação - Relaciona a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.

    Ex: Quando uma mulher compra uma bolsa em uma loja, ela está propensa a comprar sapatos na (mesma loja).

    .

    .

    TRC

  • Gab: CERTO

    Uma regra de associação deve satisfazer alguma medida de interesse do analista de dados. As duas principais medidas de interesse são: Suporte e Confiança

                   SUPORTE: Trata-se da FREQUÊNCIA com que um conjunto de itens específico ocorre no banco de dados

                   CONFIANÇA: Trata-se da PROBABILIDADE de que exista uma relação entre itens.

  • CERTO

    Vamos supor que foi criada uma regra de associação para determinar que se um indivíduo compra Toddy, ele também comprará leite.

    Suporte= Quantas vezes Toddy e leite se encontram juntos? Ou seja, o que "suporta" sua decisão em criar essa regra de associação???

    Confiança= Posso confiar que, se o cara comprar Toddy, ele comprará leite? Trata-se de uma probabilidade condicional. Qual é a chance de, dado que ele comprou Toddy, ele comprar leite?

  • Comentário: Mineração de dados é o ato de extrair e explorar dados. Esses dados que serão explorados não estão apenas em um único banco de dados específico. Esses dados estão espalhados por todo o mundo, que vão desde um site na internet com variadas informações, como o facebook, por exemplo, até mesmo na análise do comportamento de pessoas. Ou seja, a mineração de dados explora, basicamente, tudo que existe no mundo. A mineração de dados, representado pelo termo em Inglês Data Mining, é um PROCESSO, uma ação, que analisa uma grande quantidade de dados e não um banco de dados em si.

    A mineração de dados pode buscar um grande volume de informações, presente em todos os locais, e colocar isso dentro de um banco de dados, mas não podemos considerar mineração de dados como um banco de dados em si

  • As regras de associação são uma técnica popular para descobrir

    relacionamentos interessantes entre variáveis em grandes bancos de

    dados. Para que uma regra de associação seja de interesse de um analista de

    dados, ela deve obedecer a alguma medida de interesse.

    Duas medidas comuns são o suporte e a confiança.

    ❖ Suporte ou prevalência: frequência que um conjunto de itens

    específico ocorre no banco de dados, ou seja, o percentual de

    transações que contém todos os itens em um dado conjunto. Ex.: 30%

    das compras realizadas em um supermercado contém fraldas e cervejas.

    ❖ Confiança ou força: probabilidade de que exista relação entre itens.

    Ex.: 70% dos clientes que compram fraldas também compram cerveja.

    Gabarito: Certo.

  • O data mining (mineração de dados) se refere à extração ou descoberta de novas informações de grandes quantidades de dados. A frequência e o suporte são informações relevantes para verificação da informação que será entendida a partir dos dados.


ID
930922
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens subsequentes, com base nos conceitos de arquitetura e tecnologias de sistemas de informação.

A mineração de dados (dataminingj é uma atividade de processamento analítico não trivial, que, por isso, deve ser realizada por especialistas em ferramentas de desenvolvimento de software e em repositórios de dados históricos orientados a assunto (datawarehouse).

Alternativas
Comentários
  • O Data Mining é usado no back end, ou seja, para os usuários finais extraírem conhecimento. Não necessariamente deve ser realizada por especialistas de desenvolvimento 

  • Para quem não entende os comentários sem o gabarito como eu e não tem acesso a resposta.

    Gaba: ERRADO

  • Acredito que haja alguns erros.

    • Processamento analítico está mais ligado ao OLAP

    • Não é obrigatório o uso de DW. Este PODE ser usado em DM.

    • Como o Aécio disse, não necessariamente deve ser realizada por especialistas de desenvolvimento 

  • A mineração de dados (datamining é uma atividade de processamento analítico não trivial, que, por isso, deve ser realizada por especialistas em ferramentas de desenvolvimento de software e em repositórios de dados históricos orientados a assunto (datawarehouse).

    ERRADO!

  • Gabarito errado ❌

    Q435333 - Banco de Dados, Data Mining

    Ano: 2014 Banca: CESPE / CEBRASPE Órgão: ANATEL Prova: CESPE - 2014 - ANATEL - Analista Administrativo - Suporte e Infraestrutura de TI

    A respeito de banco de dados, julgue os itens que se seguem.

    No processo de Data Mining (mineração de dados), é indispensável o uso de técnica conhecida como Data Warehousing, uma vez que a mineração de dados deve ocorrer necessariamente em estruturas não normalizadas (FN0).

    (  ) Certo

    (X) Errado

  • Gabarito: errado

    Acredito que o erro esteja no final ao dizer ''deve ser realizada por especialistas '', visto que não é uma obrigatoriedade. Ademais, mesmo não sendo obrigatório a utilização de um DW, já teve questões do cespe nesse sentido:

    (cespe/cebraspe 2011) A exploração, no sentido de utilizar as informações contidas em um datawarehouse, é conhecida como data mining. (certo)

    Complementando:

    NÃO-TRIVIAL= não é extrair qualquer conhecimento é extrair conhecimento que não era conhecido e que pode ser útil para a tomada de decisão de uma organização.


ID
943294
Banca
CESPE / CEBRASPE
Órgão
INPI
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Em relação a Data Warehouse, Data Mining e banco de dados distribuídos, julgue os itens subsequentes.

Um Data Mart pode ser considerado, na visão bottom-up, uma reunião de vários Data Mining, desde que estes sejam desenvolvidos em modelos multidimensionais (MDM).

Alternativas
Comentários
  • Um data mart é um pequeno data warehouse que fornece suporte à decisão de um pequeno grupo de pessoas.

    Fonte: http://www.infobras.com.br/portugues/produtos_conceito_datamart.asp
  • Um Data Mart Data Warehouse pode ser considerado, na visão bottom-up, uma reunião de vários Data Mining Data Marts, desde que estes sejam desenvolvidos em modelos multidimensionais (MDM).
  • Existem alguns tipos de implementação de DW como:
    1) bottom up: primeiro criam-se os data marts depois é criado o data warehouse
    2) top down: primeiro cria-se o dw depois são criados os data marts
    3) implementação combinada: dw e data marts são criados ao mesmo tempo.
  • Apenas corrigindo o colega acima, Data Mart não é um pequeno DataWarehouse e sim a separação da solução por departamentos ou visões.

    Existem alguns tipos de implementação de DW como:
    1) bottom up: primeiro criam-se os data marts depois é criado o data warehouse
    Esta forma é utilizada quando a empresa não está ciente dos ganhos que pode ter e prefere ver um resultado mais rapidamente e de forma mais econômica.
    2) top down: primeiro cria-se o dw depois são criados os data marts
    Esta é o oposto da acima, é uma implantação/implementação mais demorada, e com o objetivo mais amadurecido.
    3) implementação combinada: dw e data marts são criados ao mesmo tempo.

    Tempo de desenvolvimento de um Data Mart: 4 a 12 meses.
    Tempo de desenvolvimento de um DataWareHouse: 1 a 5 anos.

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: ERRADO

     

    Data Warehouse contem varios Data Mart

  • GABARITO ERRADO!

    Data mart é um sub-conjunto de dados de um Data warehouse. Geralmente são dados referentes a um assunto em especial ou diferentes níveis de sumarização, que focalizam uma ou mais áreas específicas.

    Ex: Financeiro de uma empresa multinacional no Brasil; RH de uma empresa multinacional na França.

  • Bottom-up (Data Marts -> DW) :nessa abordagem o data mart é feito primeiro, seus dados são extraídos de banco de dados transacionais, e posteriormente os DW são feitos através dos DM

  • DATAWAREHOUSE = GÊNERO

    DATAMART = ESPÉCIE

    https://www.astera.com/pt/type/blog/data-mart-vs-data-warehouse/


ID
943297
Banca
CESPE / CEBRASPE
Órgão
INPI
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Em relação a Data Warehouse, Data Mining e banco de dados distribuídos, julgue os itens subsequentes.

O Data Mining possibilita descobrir padrões úteis de diferentes formas. Uma delas é por meio de classificação, utilizando-se o algoritmo ID3 que recebe como entrada um conjunto de tuplas para treinamento chamado exemplos e um atributo objetivo, que permite criar árvores de decisão.

Alternativas
Comentários
  • O algoritmo ID3 (Iterative Dichotomiser 3) foi desenvolvido por J. Ross Quinlan (QUINLAN, 1986) na Universidade de Sidney e publicado em 1975. O ID3 constrói a árvore de decisão a partir da raiz, selecionando o melhor atributo classificador dentre todos os atributos do conjunto de dados. O melhor atributo classificador é selecionado com base numa avaliação estatística de todos os atributos. Após a escolha, os dados são separados de acordo com as classes do atributo escolhido, gerando uma subdivisão dos dados para cada descendente na árvore. O algoritmo é aplicado recursivamente a cada descendente, até que algum critério de parada seja atingido. Isto gera uma árvore de decisão aceitável, na qual o algoritmo nunca retrocede para reconsiderar escolhas feitas anteriormente.
  • O vídeo abaixo mostra o funcionamento do ID3:
    http://www.youtube.com/watch?v=wL9aogTuZw8
  • APFCoelho, tá de sacanagem? só copiando e colando comentários dos outros.

  • é, o APFCoelho é um brincante mesmo.

     

  • fizeram o mlk apagar kkkkkkkkkk

  • CERTO

    Uma das características do Data mining é descobrir padrões úteis em diferentes tipos de dados.

    • A classificação é uma das técnicas mais utilizadas. 
    • Possui Aprendizado Supervisionado (humano treina o algoritmo), ou seja, recebe como entrada um conjunto de dados para treinamento, que possui um objetivo específico. (ex: após o treinamento distinguir o sexo de uma pessoa na foto, "homem" ou "mulher") 

    Além de permitir criar Árvore de Decisão, pois ela pode ser usada com os sistemas de Classificação para atribuir informações.

  • PF18 Descobrir conexões escondidas e prever tendências futuras é um dos objetivos da mineração de dados, que utiliza a estatística, a inteligência artificial e os algoritmos de aprendizagem de máquina.(C)


ID
947425
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Em relação às soluções existentes para o problema de tomada de decisão nas organizações, julgue os itens a seguir.

Algumas das principais técnicas utilizadas para a realização de Datamining são: estatística, aprendizado de máquina, datawarehouse e recuperação de informações.

Alternativas
Comentários
  • Datamining é o conjunto de técnicas capazes de levar ao conhecimento
    através de massas de dados.

    Datamining não precisa necessariamente de Datawareouse. Porém o uso de
    cubos leva a dados mais organizados e melhores dispostos para
    aplicação de algoritmos. De fato, grande parte da etapa de
    pré-processamento que datamining necessita já estará realizada nos cubos de
    um DW.

    São técnicas correlatas. Acredito que a questão esteja realmente correta,
    embora já tenha visto questões confusas do CESPE acerca do assunto.

    Fonte: 
    http://br.groups.yahoo.com/group/timasters/message/198933
  • Data warehouses não é técnica de Data mining.

    Questão deveria estar errada. Faltou um recurso bem feito.

    Data warehouse pode usar o Data mining na busca de padrões e relacionamentos entre dados. Mas dizer que Data warehouse é técnica de data mining é forçar a barra. Nenhum autor consagrado diz isso.

    Segundo DATE, Data Warehouse é 

    "Um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo, para apoiar as decisões da gerência"
  • Concordo com você Eleizomar a questão deveria ser anulada! Datawarehouse nada mais é do que um conjunto de Data Mart e não um técnica como o avaliador (que não tem o que fazer fica inventando lorota) mencionou.

  • Para mim a questão está é ERRADA mesmo. Deveria anular nada. O CESPE forço a barra dessa vez!

  • QualO o Erro da questão? A questão esta certíssima. Quem discordou acima,humildemente falando,pecou na interpretação do texto.

    Transcrevendo parte da questão:
    Algumas das principais técnicas utilizadas PARA a realização de Datamining...
    Então a questão informa claramente ,que se trata de técnicas para realizar o datamining,e não que são técnicas do datamining.
    Espero eu que tenha somado em algo, se alguem discorda,deixa um comente.
  • Davi Bruno,

    pensei do mesmo jeito que você. Só que relendo e relendo, você acaba chegando a seguinte conclusão: um data warehouse não pode ser considerado uma técnica, porque ele não passa de uma casa de dados digitais (no mais grosso dos conceitos). O que se extrai dele ou a forma como os dados são armazenados, já acontece por meio de outras ferramentas ou procedimentos, que nesse quesito são técnicas.

    É impossível tal questão receber o aval de "Correta", no mínimo deveria ser tida como anulada, porque certa não está.

    A CESPE ultimamente tem pisado em chãos dúbios e sem muita solidez, espremendo assuntos que muitas vezes só encontramos um ou outro autor citando algo a respeito. Dessa forma, sem uma bibliografia fica díficil. Principalmente diante de conceitos consolidados.




  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

    Dica: CESPE é quem manda, então se ela diz que é, aquilo é verdade e acabou! se ela fala que vaca da "cola cola" acredite e garanta seu ponto. de outra forma vc perde 2 pontos, creio que isso é mais importante do que discultir se é ou não é ou acho ou não acho e buscar em algum escritozinho como tanenbaum,Navathe.

    CESPE é jurisprudencia maxima! kkkkk

     

     

  • Datawarehouse não é uma técnica, é uma maneira de guardar os dados, assim como os Bando de Dados, ou seja é uma forma de armazenar dados.

    Estatística tampouco é uma técnica, a grosso modo é uma disciplina bem ampla, e em Datamining utilizamos algumas distribuições estatísticas, algumas regressões (linear,,..) isto sim são técnicas.

    Recuperação de informações também é muito vago, recuperar algo é o mesmo que resgatar, e em Datamining você descobre padrões ocultos nos dados, na pior das hipóteses não recupera nada, pois, você tem mesmo é que descobrir algo, que não sabe ainda, então não recupera nada (que perdeu dados?).

    Portanto, para mim, está errada a questão, e muito mal formulada por sinal. vou colocar errada mesmo sabendo que o pessoal já disse que "cespe é jurisprudência" [ahaha].

    O examinador acha que estava certa a questão, mas é passível de ser derrubada/anulada/exterminada.

    Ahaha {:^|

  •  a mineração de dados utiliza técnicas quem envolvem estatística e aprendizado de máquina. Estas técnicas são aplicadas em dados, por isso é necessário também técnicas de recuperação de dados. Para serem usados na mineração os dados devem passar um tratamento. Devem estar limpos e integrados. Isso pode ser obtido com um datawarehouse. De fato, tipicamente, a mineração de dados ocorre com informações que estão organizadas em um datawarehouse

    FONTE : GRAN CURSOS

  • BOM:

    O avaliador não excluiu e sim disse: "algumas da principais", ou seja, dá aquela comparada no seu caderno e marca a bolinha certa.

  • O ideal seria Data Warehousing

  • Os principais métodos de mineração de dados:

    • Rede Neurais
    • Árvore de Decisão
    • Algoritmos Genéticos
    • Lógica Fuzzy (Difusa)
    • Estatística

  • Ô questãozinha fulera

  • DW como técnica?

  • A título de conhecimento:

    Data warehouse: significa repositório de dados. Sendo assim, os repositórios funcionam como coleções de dados que a sua empresa acumulou ao longo dos anos e podem armazenar tanto dados estruturados quanto dados não estruturados. Portanto ele é um dos recursos mais importante para que o Data mining funcione, mas um não se trata da evolução do outro.

    Machine learning (aprendizado de máquina): é uma disciplina científica que se preocupa com o design e desenvolvimento de algoritmos que permitem que os computadores aprendam com base em dados, como a partir de dados do sensor ou bancos de dados. Um dos principais focos da Machine Learnig é automatizar o aprendizado para reconhecer padrões complexos e tomar decisões inteligentes baseadas em dados.

    Recuperação de informação (RI): é uma área da computação que lida com o armazenamento de documentos e a recuperação automática de informação associada a eles. É uma ciência de pesquisa sobre busca por informações em documentos, busca pelos documentos propriamente ditos, busca por metadados que descrevam documentos e busca em banco de dados, sejam eles relacionais e isolados ou banco de dados interligados em rede de hipermídia, tais como a World Wide Web. A mídia pode estar disponível sob forma de textos, de sons, de imagens ou de dados.

  • se cair desse jeito na pf, vai vim errado.

  • A matéria já é difícil e chata, o cara faz a questão lotado dos tóxicos. Aí fica sem condições. Vou comer pudim.


ID
947578
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens seguintes, relativos à arquitetura e às tecnologias de sistemas de informação.

Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante racionalização e potencialização por meio de dois componentes: organização e tecnologia.

Alternativas
Comentários
  • Processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis. Objetivos do Data Mining: conhecer o comportamento de certos atributos no futuro; possibilitar a análise de determinados padrões de eventos; categorizar perfis individuais ou coletivos de interesse comercial; apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa. As técnicas mais conhecidas de Data Mining (que também são chamadas de tarefas, por alguns autores) são: Descrição de Classes, Associação, Classificação, Previsão e Agrupamento (também conhecida como “clustering”). Alia-se a estas técnicas ainda, algumas ferramentas estatísticas como Regressão Linear, Modelo Linear Generalizado e Análise de Correlação. 
  • Prezados,
    Vejamos o conceito de Datamining segundo Navathe, página 698 :
    Mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados.
    Em nada o Datamining está relacionado com automação de processos, portanto, questão errada.
    Fonte : Navathe, Sistemas de bancos de dados, 6º edição.
  • GABARITO: ERRADO

     Data  Mining  (ou  Mineração  de  dados):  define  uma  série  de procedimentos, técnicas e ferramentas para recuperar e analisar dados de um  Data  Warehouse  ou  Data  Mart  à  procura  de  padrões  e  tendências  a respeito dos dados armazenados. 

  • Datamining é a tecnologia por intermédio da qual os processos são automatizados

    Falácias do Data Mining: "Data Mining é automatico"

    Gab: ERRADO

  • FALÁCIAS DE DATA MINING:

     

    *Data mining é automático: pelo contrário, data mining é interativo, é um processo que requer supervisão

     

    *Data mining pode identificar problemas no negócio: ele pode encontrar padrões e fenômenos, identificar problemas deve ser feito por especialistas

     

    *Investimentos são recuperados rapidamente: não pode ser afirmado pois depende de inúmeros fatores

     

    *Software são intuitivos e simples: é mais importante conhecer os algorítmos e o negócio em si

     

    Fonte: estratégia concursos

     

     

    GABARITO: ERRADO

     

  • Vejamos o conceito de Datamining segundo Navathe, página 698 :
    Mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados.
    Em nada o Datamining está relacionado com automação de processos, portanto, questão errada.
    Fonte : Navathe, Sistemas de bancos de dados, 6º edição.

  • Mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados.
    Em nada o Datamining está relacionado com automação de processos, portanto, questão errada.

  • Errado.

    Esse não é o conceito de Data mining.

    Data Mining consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados. 

    Minerar os dados é o uso de teorias, métodos, processos e tecnologias para organizar uma grande quantidade de dados brutos para identificar padrões de comportamentos em determinados públicos. CERTO.

    (FCC/2010) Sobre data mining, é correto afirmar: A)É o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de padrões, estatísticas e matemáticas.


ID
947587
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a gerenciamento eletrônico de documentos (GED) e datawaehouse, julgue os itens que se seguem.

Denomina-se de análise dimensional o processo de análise mediante o qual dados originários são selecionados das bases operacionais e modelados no ambiente de datamining, de acordo com as perspectivas ou visões elegidas para a realização.

Alternativas
Comentários
  • Errei a questao por causa da afirmação: "modelados no ambiente de datamining"

    Pra mim está estranho isso
  • DataMining é uma técnica e não um ambiente multidimensional, acredito que o erro está em dizer ambiente de datamining, o correto seria dizer ambiente multidimensional.
  • Realmente Datamining não tem nada a ver com isso... Dataming é uma técnica de mineração de dados para descoberta de padrões.

    Não sei porque a questão não foi anulada.
  • Prezados,
    Inicialmente essa questão foi dada como errada, mas teve seu gabarito alterado com a seguinte justificativa:
    “A modelagem dos dados, no contexto de Data Warehouse, chamada de análise multidimensional, é um processo de análise que envolve selecionar dados originários das bases operacionais e modelá-los no ambiente de Data Warehouse, de acordo com as dimensões (perspectivas ou visões) sobre as quais se deseja tratá-los.“
    Percebemos que o examinador acatou o entendimento que “análise dimensional” é a modelagem dos dados em bases distintas a fim de construir um modelo para o DW.
    Portanto, alternativa correta.
  • Acredito que tenha sido anulada por alguma regra do edital, pois o correto seria dar a questão como ERRADA em sei gabarito.

  • Datamining é buscar por padrões existente em base de dados e utilizamos no processo de descoberta de conhecimento.


  • Aff questão ridiculamente errada! Quem elaborou esta questão?

  • Infelizmente a CESPE, assim como a FCC, de vez em quando comete uns erros grotescos na elaboração de questões. Obviamente datamining não se encaixa nesse contexto, talvez ninguém tenha entrado com recurso para anulação da questão, e só por isso não houve alteração do gabarito.

  • Gente.Pelo amor de Deus.

    Se vocês interpretarem o texto da assertiva de forma correta,vão perceber que a analise dimensional são selecionada das bases operacionais E MODELADOS NO datamining,em nenhum momento a questão afirma que o datamining é a modelagem, ou deixa de ser uma técnica.

    Se limitem ao que a questão diz.


  • A questão está tão errada que o próprio Cespe escreveu isto ao justificar a alteração de gabarito de ERRADO para CERTO:


    "A modelagem dos dados, no contexto de Data Warehouse, chamada de análise multidimensional, é um processo de análise que envolve selecionar dados originários das bases operacionais e modelá-los no ambiente de Data Warehouse, de acordo com as dimensões (perspectivas ou visões) sobre as quais se deseja tratá-los. Portanto o item está correto e opta-se por alterá-lo."


    WTF??

    O próprio Cespe deixa claro que foram trocadas as palavras 'DATA WAREHOUSE" por "DATAMINING" na questão, o que a deixa ERRADA. Mancada feia eles deram nessa questão.

    Enfim, bola pra frente e não vamos criar polêmica em coisa que não vai dar em nada!

  • O texto utilizado como argumento da Banca para a alteração do gabarito pode ser encontrado na íntegra no link http://www1.serpro.gov.br/publicacoes/tematec/pubtem38.htm.

     

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

     

    sabe aquele ditado: "essa aí é maria vai com as outras", então, coloquei meu diploma de bacharelado em informática de lado e sigo o que a JURISPRUNDENCIA CESPE diz! 

     

    kkk -2 pra todos e 1 ponto pra mim.

     


ID
947641
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens que se seguem à luz dos conceitos básicos de datamining e datawarehouse.

Em tarefas preditivas, o atributo a ser predito é conhecido como variável independente, enquanto que os atributos usados para fazer a predição são conhecidos como alvo.

Alternativas
Comentários
  • Tarefas Preditivas objetivam predizer o valor de um determinado atributo (variável) baseado nos valores de outros atributos. O atributo a ser predito é comumente conhecido como a variável preditiva, dependente ou alvo, enquanto que os atributos usados para fazer a predição são conhecidos como as variáveis preditoras, independentes ou explicativas.
  • Prezados,
    O termo mineração de dados, ou “data mining”, refere-se, em geral, ao processo de analisar grandes bancos de dados de forma semi automática para encontrar padrões ou conhecimentos úteis.
    O conhecimento descoberto possui várias aplicações. As aplicações mais utilizadas são aquelas que exigem algum tipo de previsão.
    Como técnicas de descoberta de conhecimento, tarefas Preditivas objetivam predizer o valor de um determinado atributo (variável) baseado nos valores de outros atributos. O atributo a ser predito é comumente conhecido como a variável preditiva, dependente ou alvo, enquanto que os atributos usados para fazer a predição são conhecidos com as variáveis preditoras, independentes ou explicativas. De modo mais abstrato, a predição se utiliza de uma tupla de variáveis para predizer outras variáveis ou valores desconhecidos [Fayyad et al. 1996]
    Portanto, questão errada.
    Fonte : Fayyad, U. M., Piatetsky-Shapiro, G., and Smyth, P. (1996). Advances in knowledge discovery and data mining
  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: ERRADO

  • Corrigindo: 

    Em tarefas preditivas, o atributo a ser predito é conhecido como variável dependente (variável preditora ou alvo), enquanto que os atributos usados para fazer a predição são conhecidos como variável preditora ou independente.
     

    A questão trocou os conceitos.

  • O correto seria:

    "Em tarefas preditivas, o atributo a ser predito é conhecido como variável dependente ou alvo, enquanto que os outros atributos, utilizados para fazer a predição, são conhecidos como variáveis independentes ou preditoras."

  • GAB E

    Trocou as classificações..

    As tarefas preditivas realizam inferências sobre os dados atuais para fazer previsões sobre os mesmos). O objetivo dessas tarefas é prever o valor de um determinado atributo baseado nos valores de outros atributos.

    O atributo a ser previsto é comumente conhecido como a variável dependente ou alvo, enquanto que os atributos usados para fazer a previsão são conhecidos como as variáveis independentes ou explicativas.

    Fonte: Patrícia Quintão- Ponto dos Concursos.

  • O correto seria:

    "Em tarefas preditivas, o atributo a ser predito é conhecido como variável dependente ou alvo, enquanto que os outros atributos, utilizados para fazer a predição, são conhecidos como variáveis independentes ou preditoras."

    Arthur Mendonça | Direção Concursos

  • ERRADO

    OBJETIVOS:

    Sumarização: Técnicas que permitem a identificação de uma descrição compacta e inteligível para os dados (ou para um subconjunto dos mesmos). Frequentemente é possível sumarizar os dados mesmo com alguma imprecisão, e o valor das técnicas é na capacidade de descrever os dados, não necessariamente em sua precisão.

    Predição: É o processo de predizer um comportamento futuro, baseado em vários valores. Por exemplo, baseado na formação escolar, no trabalho atual e no ramo de atividade profissional de uma pessoa, predizer que seu salário será de um certo montante até um determinado ano.

    Estimação: É o processo de predizer algum valor, baseado num padrão já conhecido. Por exemplo, conhecendo-se o padrão de despesas e a idade de uma pessoa, estimar seu salário e seu número de filhos.

    Associação: premissa básica encontrar relacionamentos ou padrões frequentes entre conjuntos de dados.

  • [1] [2] É EXATAMENTE O QUE ELE DISSE, SÓ QUE TUDO AO CONTRÁRIO.

    FONTE:

    [1] CONCURSEIRO QUASE NADA

    [2] KIKO

  • Acertei essa com conhecimento de estatística (regressão linear).

  • atributo a ser predito ---> variável dependente ou alvo

    utilizados para fazer a predição ---> variáveis independentes ou preditoras

  • Gabarito: errado

    Atributo a SER PREDITO = ALVO

    Atributo a se FAZER PREDIÇÃO = VARIÁVEL INDEPENDENTE


ID
947644
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens que se seguem à luz dos conceitos básicos de datamining e datawarehouse.

Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters.

Alternativas
Comentários
  • Prezados,
    Segundo Korth, página 503, o agrupamento refere-se ao problema de localizar clusters de pontos nos dados indicados, tendo como intuito agrupar pontos semelhantes em um único conjunto ( cluster ).
    Os agrupamentos podem possuir ainda outros subclusters, a exemplo do sistema de classificação da biologia, por exemplo, leopardos e humanos são agrupados sob a classe de mamíferos, enquanto crocodilos e serpentes são agrupados sob repteis. Tanto mamífero quanto repteis vêm abaixo da classe comum cordato, e assim temos o agrupamento hierárquico ( ou clusterização hierárquica ).
    Os algoritmos de agrupamento hierárquico ( ou clusterização hierárquica ) podem ser classificados como algoritmos de agrupamento aglomerado, que começam montando pequenos clusters e depois criam níveis mais altos, ou algoritmos de agrupamento divisível, que primeiro criam níveis mais altos do agrupamento hierárquico, depois refinam cada cluster resultante em clusters de nível inferior.
    Portanto, alternativa correta.
    Fonte : Korth , Sistemas de Bancos de dados, 5º edição.
  • O Agrupamento Hierárquico ou Clustering Hierárquico tem como característica um processo de junções (aglomerações) ou separações de grupos ou elementos. Visa detectar a existência de diferentes grupos dentro de um determinado conjunto de dados e, em caso de existência, determina estes grupos. O Clustering tenta identificar um conjunto finito de categorias ou clusters para os quais cada registro (elemento) possa ser mapeado. As categorias podem ou não, ser organizadas em árvore (hierarquia).

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

  • O agrupamento hierárquico ou clustering hierárquico tem como característica um processo de junções (aglomerações) ou separações de grupos ou elementos. Ele visa detectar a existência de diferentes grupos dentro de um determinado conjunto de dados e, em caso de existência, determina dividi-los ou aglomerá-los. O Clustering tenta identificar um conjunto finito de categorias ou clusters para os quais cada registro ou elemento possa ser mapeado

    (Correto)

    FONTE: Estratégia

  • Eles se formam por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters 

  • Vejam essa imagem, é um dendograma. Notem a hieraquia.


ID
947647
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens que se seguem à luz dos conceitos básicos de datamining e datawarehouse.

Tarefas descritivas têm como objetivo derivar padrões como correlações, tendências, grupos, trajetórias e anomalias, os quais sumarizam as relações subjacentes nos dados.

Alternativas
Comentários
  • Tarefas descritivas: têm como objetivo encontrar padrões que descrevam os dados,

    permitindo sua análise. As principais tarefas descritivas são: Extração de Regras

    de Associação e Agrupamento (Clustering ).
    Fonte  http://www.decom.ufop.br/menotti/monoI111/RelatorioAtividades-final/BCC390-111-vf-07.1.4044-LincolnGoncalvesDaSilvaPires.pdf






     

  • Prezados,
    Segundo Fayyad, Tarefas Preditivas objetivam predizer o valor de um determinado atributo (variável) baseado nos valores de outros atributos, enquanto Tarefas Descritivas procuram encontrar padrões (correlações, tendências, grupos, trajetórias e anomalias) que descrevam os dados.
    Portanto, questão correta.
    Fonte : Fayyad, U. M., Piatetsky-Shapiro, G., and Smyth, P. (1996). Advances in knowledge discovery and data mining
  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

     

    Tarefas descritivas: têm como objetivo encontrar padrões que descrevam os dados,

    permitindo sua análise. As principais tarefas descritivas são: Extração de Regras

    de Associação e Agrupamento (Clustering ).
    Fonte http://www.decom.ufop.br/menotti/monoI111/RelatorioAtividades-final/BCC390-111-vf-07.1.4044-LincolnGoncalvesDaSilvaPires.pdf

  • maneirão. A CESPE simplesmente acha que a gente tem de advinhar que achar padrões INCLUEM  correlações, tendências, grupos, trajetórias e anomalias . Mesmo se você não tiver isso escrito em lugar algum. 
    CESPE eu te odeio !

  • Tendência achei que se tratasse de predição

     

     

  • • Descritiva: ao invés de focar no futuro, esta análise busca trazer uma fotografia do presente, para que decisões de cunho imediato possam ser tomadas com segurança, o que faz deste modelo muito útil para análise de crédito, por exemplo.

    A análise descritiva trabalha com histórico de dados, cruzando informações com o objetivo de gerar um panorama claro e preciso dos temas relevantes para a empresa no presente momento.

    fonte: amigos do qc

  • GAB C

    As tarefas descritivas caracterizam as propriedades gerais dos dados em um banco de dados).

    O objetivo dessas tarefas é derivar padrões (correlações, tendências, grupos, trajetórias e anomalias) que resumem os relacionamentos subjacentes nos dados.

    As tarefas descritivas da mineração são muitas vezes exploratórias em sua natureza e frequentemente requerem técnicas de pós-processamento para validar e explicar resultados.

    Fonte: Patrícia Quintão- Ponto dos Concursos.

  • Certo

    Tarefas descritivas: tarefas focadas em achar padrões reconhecidos por seres humanos para descrever os dados.

    Tarefa preditivas: realizam uma inferência sobre os dados atuais para fazer previsões futuras sobre os mesmos.

  • descritivas. A questão descreve corretamente o objetivo das tarefas descritivas.

    As tarefas descritivas têm como objetivo encontrar padrões que

    descrevam os dados, permitindo sua análise. Nestas tarefas, podemos

    identificar correlações (por meio da associação e análise de ligações), grupos

    (através da clusterização), trajetórias (uso de padrões sequenciais e de série

    temporal) e anomalias (pela análise de outliers).

    As tarefas preditivas realizam inferências sobre os dados existentes para

    predizer o comportamento de novos dados. As principais tarefas preditivas

    são a classificação e regressão.

    Gabarito: Certo.


ID
947650
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens que se seguem à luz dos conceitos básicos de datamining e datawarehouse.

Nos métodos de particionamento para k-clusterização e k-medoids, o elemento que melhor representa o cluster é definido de acordo com seus atributos, sem que haja muita influência dos valores próximos aos limites do cluster.

Alternativas
Comentários
  •  Os métodos de particionamento para k-clusterização incluem ainda as técnicas  k-medoids e k-means, de acordo com o tipo de representatividade utilizada para os
    clusters: no k-medoids, o elemento que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita influência dos valores próximos aos
    limites do cluster; no k-means o elemento representativo de um cluster é o seu centróide, que possui um valor médio para os atributos considerados, relativos a todos
    os elementos do cluster.
    Os métodos de particionamento para k-clusterização incluem ainda as técnicas  k-medoids e k-means, de acordo com o tipo de representatividade utilizada para os
    clusters: no k-medoids, o elemento que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita influência dos valores próximos aos
    limites do cluster; no k-means o elemento representativo de um cluster é o seu centróide, que possui um valor médio para os atributos considerados, relativos a todos
    os elementos do cluster.
     

    Os métodos de particionamento para k-clusterização incluem ainda as técnicas  k-medoids e k-means, de acordo com o tipo de representatividade utilizada para os clusters: no k-medoids, o elemento que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita influência dos valores próximos aos limites do cluster; no k-means o elemento representativo de um cluster é o seu centróide, que possui um valor médio para os atributos considerados, relativos a todos os elementos do cluster. 
    fonte: http://www2.ic.uff.br/~satoru/conteudo/artigos/ERI-Minicurso-SATORU.pdf





  • Questãozinha escrota pra técnico!
  • Prezados,
    Essa questão não é trivial, e aborda conceitos ainda pouco explorado pelas bancas examinadoras.
    Os métodos de particionamento para k-clusterização incluem ainda as técnicas kmedoids e k-means, de acordo com o tipo de representatividade utilizada para os  clusters: no k-medoids, o elemento que melhor representa o cluster, é definido de  acordo com seus atributos sem que haja muita influência dos valores próximos aos limites do cluster; no k-means o elemento representativo de um cluster é o seu centróide, que possui um valor médio para os atributos considerados, relativos a todos os elementos do cluster. A utilização do centróide como elemento representativo de um cluster é conveniente apenas para atributos numéricos e possui um significado geométrico e estatístico claro podendo, entretanto, receber muita influência de um único elemento que se encontre próximo à fronteira do cluster
    Portanto, questão correta.
    Fonte : http://www2.ic.uff.br/~satoru/conteudo/artigos/ERI-Minicurso-SATORU.pdf
  • Fato - provas para ganhar R$ 2k são muito mais fodas que as de R$ 12k salário.

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

    Os métodos de particionamento para k-clusterização incluem ainda as técnicas  k-medoids e k-means, de acordo com o tipo de representatividade utilizada para os clusters: no k-medoids, o elemento que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita influência dos valores próximos aos limites do cluster; no k-means o elemento representativo de um cluster é o seu centróide, que possui um valor médio para os atributos considerados, relativos a todos os elementos do cluster.
    fonte: http://www2.ic.uff.br/~satoru/conteudo/artigos/ERI-Minicurso-SATORU.pdf
     

  • k-medoids --> mediana

    em estatística, a mediana não é afetada pelos extremos, exemplo o conjunto {2,4,6,8,10}

    mediana = 6

    Caso faça uma alteração nos valores extremos, tipo assim : {-5,4,6,8,720)

    mediana = 6

    Usei esse raciocínio frouxo pra acertar kk

  • gabarito correto

    Autor: Leandro Rangel, Auditor Federal de Controle Externo do TCU. Ex Auditor da CGU., de Noções de Informática, Arquitetura de Computadores, Sistemas Operacionais, Redes de Computadores, Banco de Dados, Segurança da Informação, Algoritmos e Estrutura de Dados, Governança de TI, Engenharia de Software, Programação, Sistemas de Informação, Eletrônica, Arquitetura de Software

    Prezados,

    Essa questão não é trivial, e aborda conceitos ainda pouco explorado pelas bancas examinadoras.

    Os métodos de particionamento para k-clusterização incluem ainda as técnicas kmedoids e k-means, de acordo com o tipo de representatividade utilizada para os clusters: no k-medoids, o elemento que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita influência dos valores próximos aos limites do cluster; no k-means o elemento representativo de um cluster é o seu centróide, que possui um valor médio para os atributos considerados, relativos a todos os elementos do cluster. A utilização do centróide como elemento representativo de um cluster é conveniente apenas para atributos numéricos e possui um significado geométrico e estatístico claro podendo, entretanto, receber muita influência de um único elemento que se encontre próximo à fronteira do cluster

    Portanto, questão correta.

    Fonte : 

    colei comentário do professor.


ID
960937
Banca
IADES
Órgão
EBSERH
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Existem algumas técnicas utilizadas em Data mining, para fins de estatísticas. A técnica que permite lidar com a previsão de um valor, em vez de uma classe, é denominada

Alternativas
Comentários
  • difícil! 

    Segundo Navathe(2011,p.714),"Uma aplicação geral da regressão ocorre quando, em vez de mapear uma tupla de dados de uma relação para uma classe específica, o valor de uma variável é previsto com base nessa tupla."

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-6 EDIÇÃO 2011, CAPÍTULO 28-CONCEITOS DE MINERAÇÃO DE DADOS

  • Técnicas e Tarefas de Mineração de Dados

    As tarefas básicas da mineração de dados, e seus respectivos objetivos principais, são:


    •  Classificação: predizer a classe de um item;
    •  Regressão: prever um valor numérico contínuo;
    •  Associação: encontrar padrões de ocorrências de dados associados;
    •  Análise de agrupamentos (Clusterização): encontrar grupos nos dados;
    •  Detecção de anomalias (Detecção de Desvio): encontrar alterações nos 
    dados.

     

    www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão


ID
960967
Banca
Marinha
Órgão
Quadro Técnico
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

A Descoberta de conhecimento em Bancos de Dados (KNOWLEDGE DISCOVERY IN DATABASES) , normalmente abreviada como KDD, engloba mais que a DATA MINING. Este processo é composto por seis fases, que são executadas na seguinte ordem: Seleção de dados;

Alternativas
Comentários
  • letra E.

    Segundo Navathe(2011,p.699),"O processo de descoberta de conhecimentocompreende seis fases: seleção de dados, limpeza de dados, enriquecimento, transformação ou codificação de dados,mineração de dados e o relatório e exibição da informação descoberta. "

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-6 EDIÇÃO 2011


  • Se-Li-En-T-M-A

    Selecão; Limpeza; Enriquecimento; Transformação; mineração; Apresentação

  • 1ª SELAÇÃO

    2ª LIMPEZA DE DADOS

    3ª ENREQUICIMENTO

    4ª TRNSFORMAÇÃO OU CODIFICAÇÃO DE DADOS

    5ª MINERAÇÃO DE DADOS

    6ª RELATÓRIO E EXIBIÇÃO DA INFORMAÇÃO DESCOBERTA

    A LIMPEZA FAZ PARTE DO PRE-PROCESSAMENTO DE DADOS, PARA A APLICAÇÃO DEVIDA DAS TÉCNICAS DE MINERAÇÃO E PARA A CRIAÇÃO DE DATA WAREHOUSE.

    PROFESSOR XAVIER. 87-99130-6668


ID
977794
Banca
FUNRIO
Órgão
MPOG
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Qual o tipo de descoberta de conhecimento através de mineração de dados (do inglês “data mining”), em que se relaciona a presença de conjuntos de itens diversos, como por exemplo: “Quando uma mulher compra uma bolsa em uma loja, ela está propensa a comprar sapatos”?

Alternativas
Comentários
  • Colegas, para elucidar o é que uma regra de associaçãoUma regra de associação é um padrão da forma X -> Y , onde X e Y são conjuntos de valores (artigos comprados por um cliente). Considerando, por exemplo, um supermercado. O seguinte padrão “Clientes que compram pão também compram leite” representa uma regra de associação que reflete um padrão de comportamento dos clientes do supermercado.
  • LETRA C. REGRAS DE ASSOCIAÇÃO conforme NAVATHE(RETIRADO QUASE QUE NA ÍNTEGRA).


    Segundo Navathe(2011,p.700),"Regras de associação: Essas regras correlacionam a presença de um itemset com outra faixa de valores para um conjunto de variáveis diverso. 
    Exemplos: 

    (1) Quando uma compradora adquire uma bolsa, ela provavelmente compra sapatos.
    (2) Uma imagem de raio X contendo características A e B provavelmente também exibe a característica C."

    Bibliografia:
    SISTEMAS DE BANCO DE DADOS. 6 EDIÇÃO 2011. NAVATHE
  • Questão fdp... me fez rodar nesse concurso :(

  • A associação determina quais itens tendem a co-ocorrer.

  • Alguem ai tem todas as regras de associacao de DataMining?

  • Regras de Associação são regras que correlacionam a presença de um conjunto de itens com outra faixa de valores para um conjunto de variáveis diverso. A correção entre a compra de bolsas e sapatos é uma regra de associação. 

    E as regras de associação são em sequenciais e temporais.

  • Ao meu ver, a questão também se encaixa em padrões sequenciais, que estão dentro das regras de associação. Regras de associação seria o gênero do qual padrões sequencias é espécie.

  • Gabarito: C.

    Alguns colegas questionaram sobre padrões sequenciais, porém, não há como ser. Os padrões sequenciais delimitam temporalidade entre as associações. Então, se a questão demarcasse, por exemplo, que ela compra sapatos hoje e que daqui três semanas ela estará propensa a comprar sapatos, então temos um padrão sequencial.

    Regras de associação: não há lapso temporal definido.

    Padrões sequenciais: há lapso temporal definido.

    Bons estudos!


ID
985096
Banca
CESPE / CEBRASPE
Órgão
CPRM
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens subsequentes, a respeito de sistemas de suporte à decisão.


A fase de modelagem de um data mining agrega a seleção e aplicação das técnicas sobre os dados selecionados. Inúmeras técnicas podem ser empregadas para obtenção de padrões úteis, como por exemplo, a PMML (predictive model markup language), que objetiva, via schemas XML, a definição para modelos encontrados em associações, modelos de regressão e clustering.

Alternativas
Comentários
  • Ai fica dificil em parceiro, não sei nem anda e tu me da uma bicicleta home.

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

    A PMML (Predictive Model Markup Language) é um formato de arquivo baseado em XML desenvolvido pelo Data Mining Group para fornecer uma maneira de os aplicativos descreverem e trocarem modelos produzidos por algoritmos de mineração de dados e de aprendizado de máquina. Ele suporta modelos comuns, como regressão logística e redes neurais networks.

     

     

    kkkk alem de não colocar o gabarito ainda comenta em ingles kkkkkkkkkkkkk otima COLABORAÇÃO com quem não tem noção da matéria

  • CERTO

    Chutou e gol!

  • GABARITO CERTO!

    A Predictive Model Markup Language é um formato de intercâmbio de modelos preditivos baseado em XML.

  • A questão ta dificil num nivel estratosférico? Marca CERTO, fod4 se.

  • Mais fácil gabaritar o simulado do estratégia

  • É GOOOOL! QUE FELICIDADE...(bons tempos de rádio).


ID
1001731
Banca
CESPE / CEBRASPE
Órgão
MPOG
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de mineração e análise de dados para suporte à inteligência do negócio, julgue os itens a seguir.

Os dados podem provir de diferentes modelos de dados, mas devem ser integrados em um modelo integrado antes de serem armazenados em um datawarehouse.

Alternativas
Comentários
  • A Questão fala sobre o ETL, Extratc, Translate and Load, exemplificado na figura a seguir:

    http://vivianeribeiro1.files.wordpress.com/2011/06/062811_1937_oqueetl1.jpg?w=469&h=321


  • Depois que passa pelo ETL que é o processo de extração, organização, integração, correções e outros... os dados serão armazenados em algum modelo como "Floco de neve" ou "Estrela", creio eu que sejam esses os modelos citados na questão.

  • CERTO. O  modelo de dados é o multidimensional.

    Segundo Navathe(2011,p.727),"Os dados precisam ser ajustados ao modelo de dados do armazém. Os dados de várias fontes devem ser instalados no modelo de dados do armazém. Eles podem ter que ser convertidos de banco de dados relacionais, orientados a objeto ou legados(em rede e/ou hierárquico) para um modelo multidimensional."


    SISTEMAS DE BANCO DE DADOS-NAVATHE-2011-6 EDIÇÃO

  • O Modelo integrado intermediário seria o Data Staging, mas é obrigatório (deve) usá-lo? acho que não

  • Creio que a questão fala do Staging Area, área provisória onde os dados passam antes de serem efetivados no DW.

  • Gabarito: CERTO:

    Lembrem-se das características essenciais de um DW:

    1. Orientado por assunto;

    2. Integrado - Os dados de um DW são integrados de múltiplas fontes de forma consistente, padronizada e uniforme;

    3. Não-volátil; e

    4. Histório (variável com o tempo).


ID
1035475
Banca
CESPE / CEBRASPE
Órgão
PEFOCE
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere a banco de dados e sistemas de suporte a decisão, julgue os itens subsecutivos.

O data mining tem por objetivo a extração de informações úteis para tomadas de decisão com base nos grandes volumes de dados armazenados nas organizações. Os dados para o data mining são originados restritamente dos data warehouses, pois estes são os que aglomeram enorme quantidade de dados não voláteis e organizados por assunto.

Alternativas
Comentários
  • O erro está na expressão "Os dados para o data mining são originados restritamente dos data warehouses". Podem ser originados diretamente das fontes operacionais através do processo de ETL(Extract-Transform-Load)

  • Isso mesmo clark, não esquecendo dos "Data Marts" que também é uma fonte para a mineração de dados. 

  • Não se restringe a um branco de dados

  • Não há restrição quanto a obtenção dos dados ser feita somente através de data warehouses

    E

  • Gabarito: errado

    Um dos exemplos seria o processo de Data Mining, através dos conceitos de Inmon ,que coloca a extração de informações e consultas pelos Data Marts e não pelos DW's.

  • (E)

    "Os dados para o data mining são originados restritamente dos data warehouses"

    Outras questões CESPE que ajudam a responder:

    As ferramentas de Data Mining permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa, dentre outras.(C)

    A finalidade do uso do data mining em uma organização é subsidiar a produção de afirmações conclusivas acerca do padrão de comportamento exibido por agentes de interesse dessa organização.(C)

    O uso prático de data mining envolve o emprego de processos, ferramentas, técnicas e métodos oriundos da matemática, da estatística e da computação, inclusive de inteligência artificial.(C)

    Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.(C)

    Na implementação de mineração de dados (data mining), a utilização da técnica de padrões sequenciais pode ser útil para a identificação de tendências.(C)

    Situação hipotética: Após o período de inscrição para o vestibular de determinada universidade pública, foram reunidas informações acerca do perfil dos candidatos, cursos inscritos e concorrências. Ademais, que, por meio das soluções de BI e DW que integram outros sistemas, foram realizadas análises para a detecção de relacionamentos sistemáticos entre as informações registradas. Assertiva: Nessa situação, tais análises podem ser consideradas como data mining, pois agregam valor às decisões do MEC e sugerem tendências, como, por exemplo, o aumento no número de escolas privadas e a escolha de determinado curso superior.(C)

    Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados.(C)

  • DATA MINING É FESTA NA CASA DAS PRIMAS. É DADOS DE TUDO QUANTO É LUGAR.

  • Erro 1: Data mining não se restringe aos DW.

    Erro 2: Se é orientado por assunto, é DataMart.

  • Os dados para data mining não são originados restritamente / exclusivamente dos (data warehouses)

    Ramez Elmasri e Shamkant B. Navathe

    ➞   Data Mining PODE ser usada em conjunto com o DW para auxiliar certos tipos de decisão.


ID
1036057
Banca
CESPE / CEBRASPE
Órgão
IPEA
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a BI (business inteligence), indicadores da produção, administração da produção, monitoração do ambiente operacional, julgue os próximos itens.

O data mining é um processo utilizado para a extração de dados de grandes repositórios para tomada de decisão, mas sua limitação é não conseguir analisar dados de um data warehouse.

Alternativas
Comentários
  • Resposta: E.

    Ao meu ver, o erro está na segunda parte da assertiva: "mas sua limitação é não conseguir analisar dados de um data warehouse"

  • ERRADO. O erro é justamente como o colega disse. ERRO -> [...]mas sua limitação é não conseguir analisar dados de um data warehouse.

    Segundo Navathe(2011,p.698),"A mineração de dados pode ser usada junto com um data warehouse para ajudar com certos tipos de decisões. [...] De fato, para banco de dados muito grandes, que rodam terabytes ou até petabytes de dados, o uso bem-sucedido das aplicações de mineração de dados dependerá,primeiro, da construção de um data warehouse."

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-6 EDIÇÃO 2011-NAVATHE



  • Na verdade ele é até indicado para analisar os dados dentro do data warehouse.

    Questão, portanto errada.

  • Ramez Elmasri e Shamkant B. Navathe

    ➞   DM pode ser usada em conjunto com o DW para auxiliar certos tipos de decisão.

    ➞   Para fazer a DM mais eficiente, o DW deve ter uma coleção de dados agregados ou sumarizados.

    ➞   DM auxilia na obtenção de novos padrões que não poderiam ser encontrados simplesmente pesquisando (querying) ou processando dados ou metadados no DW

    ➞   O uso de DM é fortemente recomendável desde o início, na fase de projeto do DW

    ➞   As ferramentas de DM deveriam ser projetadas para facilitar seu uso em conjunto com o DW

    ➞   Em BD muito grandes (terabites de dados) o sucesso de aplicações de DM dependerá primeiro da construção do DW

  • DM é so parte do processo e não o processo


ID
1036060
Banca
CESPE / CEBRASPE
Órgão
IPEA
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a BI (business inteligence), indicadores da produção, administração da produção, monitoração do ambiente operacional, julgue os próximos itens.

As tecnologias de bancos da dados, data mining e data warehouse têm sido utilizadas plenamente para a monitoração de ambientes operacionais, pois utilizam ontologias e inteligência artificial com agilidade e baixo custo operacional.

Alternativas
Comentários
  • Resposta: E.

    Acredito que a questão está quase que totalmente errada.

    As tecnologias de bancos da dados, data mining e data warehouse têm sido utilizadas plenamente para a monitoração de ambientes operacionais

    Não é pra isso que servem essas tecnologia, e sim para dar suporte à área de negócio. Forçando um pouco dava até pra aceitar, já que a a área de negócio tem interesse em monitorar os ambientes operacionais, mas ainda assim marcaria errada só por isso.

    pois utilizam ontologias e inteligência artificial com agilidade e baixo custo operacional

    Não necessariamente terão baixo custo. Na verdade, ao meu ver, a tendência é justamente o contrário: alto custo.

    Se alguém quiser complementar...

  • O erro está em "baixo custo operacional".

  • Duas coisas que não combinam: IA e baixo custo.

  • Ontologia????? KKKKKKKK

  • GAB: E

    Eliminei na parte : baixo custo...

  • Barato não é kkkk

  • A implantação acredito não ser barata, mas imaginei que o custo operacional fosse baixo. Aparentemente estou errado.

  • Barato??? kkkkk

  • ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre estes. Uma ontologia é utilizada para realizar inferência sobre os objetos do domínio.


ID
1045675
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a datamining, datawarehouse, gerenciamento de conteúdo, ambientes colaborativos e portais corporativos, julgue os próximos itens.

Em um ambiente colaborativo, a necessidade de acesso a determinados recursos exige que a infraestrutura forneça elementos para que algumas ferramentas sejam executadas no servidor.

Alternativas
Comentários
  • Requisitos do groupware ..

    RD9 – Suporte às ferramentas localizadas no servidor 

    Algumas operações em um ambiente colaborativo são melhor realizadas quando centralizadas devido, por exemplo, à necessidade de acesso a determinados recursos ou de execução ininterrupta. A infra-estrutura deve prover, portanto, recursos para que algumas ferramentas sejam executadas no servidor, sendo que a forma de invocar estas ferramentas não deve diferir da forma de invocar ferramentas presentes nas máquinas dos usuários.

    FONTE: http://www.tecgraf.puc-rio.br/publications/artigo_2002_engenharia_groupware.pdf

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

     

    Requisitos do groupware ...

    RD9 – Suporte às ferramentas localizadas no servidor 

    Algumas operações em um ambiente colaborativo são melhor realizadas quando centralizadas devido, por exemplo, à necessidade de acesso a determinados recursos ou de execução ininterrupta. A infra-estrutura deve prover, portanto, recursos para que algumas ferramentas sejam executadas no servidor, sendo que a forma de invocar estas ferramentas não deve diferir da forma de invocar ferramentas presentes nas máquinas dos usuários.

    FONTE: http://www.tecgraf.puc-rio.br/publications/artigo_2002_engenharia_groupware.pdf


ID
1047241
Banca
CESPE / CEBRASPE
Órgão
MPU
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, acerca de sistemas de suporte à decisão.

Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas.

Alternativas
Comentários
  • CERTO

    Segundo Navathe(2011,p.712),"O objetivo do agrupamento é colocar registros em grupos, de modo que os registros em um grupo sejam semalhantes uns aos outros e diferentes dos registros em outros grupos. Os grupos constumam ser disjuntos."

    O.b.s: A técnica de agrupamento também pode ser denominada clustering.

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS- NAVATHE 6 EDIÇÃO 2011
  • Os registros são agrupados em função de suas similaridades básicas, ou seja, quando se deseja formar agrupamentos (clustering), seleciona-se um conjunto de atributos (variáveis) e em função da similaridade desses atributos (faixa de valores dos atributos) são formados grupos.

  • Tecnicas de mineracao de dados:

    Regressão

    Pergunta: "Quanto uma concessionaria devería cobrar por um carro? Os modelos de regressão podem responder a essa pergunta com uma resposta numérica, usando dados de vendas passadas.

    Classificação

    Pergunta: "Qual a probabilidade de uma pessoa X comprar o mais novo modelo de carro?" Criando uma árvore de classificação, os dados podem ser minerados para determinar a probabilidade de essa pessoa comprar um novo carro. 

    Armazenamento em cluster

    Pergunta: "Que faixa etária gosta de carros da cor prata?" A partir de dados de compradores previo de carro, é possível encontrar se certas faixas etárias (22-30 anos de idade, por exemplo) estão mais propensas a comprar um certo tipo de cor (75 por cento compram azul). 

    Vizinho mais próximo

    Pergunta: "Quando as pessoas compram um carro, quais outras opções elas tendem a comprar ao mesmo tempo?" Os dados podem ser minerados para mostrar que elas também compram um som. Assim, a concessionária pode mover as promoções dos sons automotivos para a parte da frente da concessionária, em um esforço para aumentar as vendas.

  • É verdade. A análise de agrupamentos permite descrever os dados de acordo com sua afinidade com outros itens da mesma faixa de valores ou grupo. Nessa tarefa, as classes não são previamente conhecidas, sendo definidas a priori de acordo com a similaridade entre os conjuntos de valores agrupados.

  • Agrupamento = Clustering. Método NÃO SUPERVISIONADO, ou seja, descobre por sí só.

  • Agrupamento (Clusterização/Aglomeração/Agregação) é a técnica que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas. O objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. A cada conjunto de dados resultante do processo, dá-se o nome de grupo, aglomerado, agrupamento ou cluster. O agrupamento é uma técnica de aprendizado não-supervisionado, ou seja, não há um pré-estabelecimento de classes antes da análise de dados.

    Agrupamento = não-supervisionado (não estabelece classes antes da análise)

    Classificação = é supervisionado (estabelece classes antes da análise)

  • Mas permite a descoberta de dados?

    Não seria o agrupamento de dados?

  • Técnicas do Data mining:

    • Associação: representa padrões de relacionamento entre itens de uma base de dados (famoso exemplo da frauda e cerveja)

    • Classificação: ajuda a obter informações importante sobre dados e metadados. Está intimamente relacionada com a técnica de clusterização e utiliza árvore de decisão ou rede neural. (agrupa por classes)

    • Agrupamento(clustering): é uma técnica que também é conhecida como agrupamento de dados. Trata-se do processo de identificação de dados semelhantes e não semelhantes entre si.

    Gabarito: CERTO

    Espero ter ajudado!

  • Etapas do processo de descoberta de conhecimento (Knowledge discovery in Database - KDD):

    Entrada de Dados -> Pré-processamento -> Mineração -> Pós-processamento -> Informação

     

    1. Pré-processamento

    (seleção de atributos, redução de dimensionalidade, normalização, amostragem)

    2. Mineração

    (Aplicação de algoritmos de aprendizado por máquina):

    Técnicas: < Classificação - Agrupamento - Anomalias - Associações >

     

    2.1 Classificação,

    ou classificação supervisionada: O conjunto de treinamento já possui uma classe. E.g.: Predizer espécie de uma flor dadas as características dela.

    2.2 Agrupamento (Clustering):

    O conjunto de treinamento não possui classe e é aprendido automaticamente pelo algoritmo, e.g. descoberta de centróides.

    2.3 Anomalias (Anomaly Detection):

    Aprende um padrão e detecta casos que extrapolam esse padrão, e.g. análise de fraude em cartões de crédito.

    2.4 Associação (Association Analysis):

    Aprende padrão de associação entre certos atributos e deriva uma regra, e.g. market basket analysis no Walmart - quem compra cerveja compra fraldas.

     

    3. Pós-processamento

    (Filtragem de padrões, visualização, interpretação de padrões).

     

    Fonte: Tan et al, Introdução ao Data Mining.

  • CERTO

    Agrupamento (CLAUSTERING): não supervisionado. >>os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.

  • Gabarito: certo

    Outra questão :

    Ano: 2021 Banca: CESPE / CEBRASPE Órgão:  Prova: 

    No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

  • Gabarito: certo

    Outra questão :

    Ano: 2021 Banca: CESPE / CEBRASPE Órgão:  TCE

    No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

  • CERTO

    Agrupamento/Aglomerado (Clusterização) = é uma técnica de aprendizado não-supervisionado, não  necessitando que os registros sejam previamente categorizados. Visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, devendo ser executada periodicamente, não apenas na criação da tabela. O objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. Um agrupamento é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos

  • Assertiva correta. A clusterização é a partição de uma coleção de coisas,

    eventos ou itens em segmentos cujos membros possuem características

    semelhantes. O objetivo é classificar casos (por exemplo, pessoas, coisas,

    eventos) em grupos ou clusters, de modo que o grau de associação seja

    forte entre os membros do mesmo cluster e fraco entre os membros de

    diferentes clusters.

    Gabarito: Certo.

  • Atributos, aqui nessa questão, tem que ser entendido como "características", e entidades como os objetos analisados. Sendo assim, a técnica de agrupamento permite a descoberta de dados por faixa de valores através do exame das características dos objetos envolvidos na mineração. Um exemplo disso é o agrupamento de pessoas com uma respectiva idade, tamanho, peso etc.


ID
1068115
Banca
FCC
Órgão
TRF - 3ª REGIÃO
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Mineração de dados é a investigação de relações e padrões globais que existem em grandes bancos de dados, mas que estão ocultos no grande volume de dados. Com base nas funções que executam, há diferentes técnicas para a mineração de dados, dentre as quais estão:

I. identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros. Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos a servidores de dados também estão envolvidos em processos ligados a roubo de dados sigilosos.

II. identificar sequências que ocorrem em determinados registros. Por exemplo: 32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica ajuízam uma causa contra o INSS solicitando ressarcimento monetário.

III. as categorias são definidas antes da análise dos dados. Pode ser utilizada para identificar os atributos de um determinado grupo que fazem a discriminação entre 3 tipos diferentes, por exemplo, os tipos de processos judiciais podem ser categorizados como infrequentes, ocasionais e frequentes.

Os tipos de técnicas referenciados em I, II e III, respectivamente, são:

Alternativas
Comentários
  • Não precisa nem ver o resto, dá pra matar a questão pelo item II.

    "32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica (também) ajuízam uma causa contra o INSS solicitando ressarcimento monetário."

    Se teve relação de tempo, ou seja, uma sequência, é sequencial.

  • Gabarito C.

    I - Associação

    II - Padrões sequenciais

    III - Classificação

  • Peguei o "gancho dos colegas" em outras questões SIMILARES e acertei pelo fator "TEMPO" exposto no item 2.

    Bons estudos.

  • I – O item descreve o fenômeno das coocorrências entre eventos. Dessa maneira, podemos perceber que trata-se da técnica de regras de associação.

    II – Os padrões sequenciais são semelhantes às regras de associação, mas focam na ocorrência sequencial dos padrões, enquanto que as regras de associação estão mais voltadas à análise da frequência das coocorrências.

    III – Ao contrário da clusterização, ou análise de conglomerados ou agrupamentos, na classificação as categorias são previamente definidas e os dados classificados entre elas. Esse processo ocorre através de um conjunto de dados de treinamento, que permite que o sistema classificador determine a que categoria pertence cada uma das observações restantes no conjunto.

    Logo, temos a seguinte ordem: Regras de associação, padrões sequenciais e classificação.

    Gabarito: C

  • Já matei pela III - .. quando categorias são pré-definidas antes da análise são Classificações = Aprendizado Supervisionado.


ID
1068907
Banca
IFC
Órgão
IFC-SC
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

A mineração de dados (data mining) fornece percepções dos dados corporativos que não podem ser obtidas com o OLAP, descobrindo padrões e relacionamentos ocultos em grandes bancos de dados e inferindo regras a partir deles para prever comportamentos futuros. Os tipos de informação que podem ser obtidos com a mineração de dados incluem: associações, seqüência, classificações, aglomerações, prognósticos. Selecione abaixo o detalhamento INCORRETO sobre um destes cinco itens.

Alternativas
Comentários
  • Gabarito B.

    ASSOCIAÇÕES são ocorrências responsáveis por realizar ligações entre todos os dados. 

    E erro está na palavra "todos"

  • GABARITO B!

    Associação

    Nesta técnica procura-se estabelecer regras que ligam um conceito ao outro identificando quais atributos estão relacionados. A associação obedece à regra SE atributo X ENTÃO atributo Y, onde o atributo Y ocorrerá em consequência do atributo X. (Navega, 2002). Muito utilizada no comércio, pois com a associação é possível identificar quais produtos são comprados em conjunto. Sempre que o cliente leva o produto X ele também leva o produto Y. Com as informações obtidas facilita a elaboração de promoções e a organização dos produtos no estabelecimento.

  • Tentaram confundir regras de associação do DM com relacionamento do ER


ID
1159306
Banca
FEPESE
Órgão
MPE-SC
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Analise as afrmativas abaixo com relação à Data Mining e Data Warehouse.

1. Ferramentas de Data Mining podem ser utilizadas independentemente do Data Warehouse, mas obtêm-se melhores resultados quando aplicadoasde forma conjunta.

2. Técnicas de Clusterização podem ser utilizadas na extração e na preparação de dados de um banco de dados para um Data Warehouse.

3. Data Mining é uma evolução do conceito de Data Warehouse.

4. A mineração de dados baseia-se na utilização de algoritmos capazes de analisar grandes bases de dados de modo efciente e revelar padrões interessantes, escondidos nos dados.

Assinale a alternativa que indica todas as afrmativas corretas.

Alternativas
Comentários
  • Não entendo qual seria o erro de considerar a alternativa 2 como correta também... Alguém saberia explicar o porquê de não podermos utilizar Técnicas de Clusterização para otimizar a extração e preparação de dados?

  • Também acho que a alternativa 2 está correta.

    Esta banca não pode ser levada a sério... Não é a toa que a prova foi anulada...

  • Creio que o erro da 2 está no fato de que a clusterização é usada em data mining. Mas o uso para extração de dados é possível. Na preparação é que poderia não ser enquadrada.

  • Senhores,

    Entendo que a clusterização pode aplicar-se ao processo de mineração de dados, haja vista que estamos falando de uma espécie de hierarquização ou particionamento. No meu modo de enxergar, a proposta da assertiva de número 2 está realmente incorreta, pois não faria muito sentido clusterizar no ETL, ou seja, antes de "entrar" no Data Warehouse, mas sim, quando for o caso, a partir da "saída" do Data Warehouse. No entanto, olhando rapidamente, não encontrei qualquer embasamento consolidado. Assim, sugiro que quem entender diferente, se posicione.

    Saudações, 

  • Fepese sendo fepese... Realmente n tem mta utilidade usar clusterizacao mas a questão colocou "podem" :(
  • "O armazenamento se dá num depósito único, que seja de rápido acesso para as análises." https://pt.wikipedia.org/wiki/Armaz%C3%A9m_de_dados

    Ou seja, não em clusters.


ID
1159612
Banca
CESPE / CEBRASPE
Órgão
TJ-CE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Assinale a opção correta acerca de datamining.

Alternativas
Comentários
  • A letra C é a menos errada. A ETL é parte fundamental do processo, ignorada na redação original fornecida. Creio que ficaria correta com da seguinte forma:

    É possível realizar mineração de dados a partir de documentos textuais como, por exemplo, uma página da Internet.
  • A letra C está completamente correta. Mineração de texto.

  • -------------------------------------------

    Formas de mining


    Preditivo - A data mining pode mostrar como certos atributos dos dados irão se comportar no futuro.
    Textual - Processo de obtenção de informação utilizando fontes de dados textuais. Aplicações em classificação automática de textos e busca de agrupamentos.
    Espacial - Processo de descoberta de padrões utilizando bancos de dados espaciais populados por mapas.

    -------------------------------------------

    SOBRE A LETRA B:

    Conjunto de itens grandes (itemset)
    • Conjunto de itens que estejam acima dos limites estabelecidos para o suporte de uma regra de associação.

    -------------------------------------------

    Fonte: Itnerante

  • a) Nada disso. A informação obtida pode ser representada em relatórios, em gráficos ou em qualquer maneira que o responsável pela análise julgue pertinente. ERRADA

    b) Os itemsets são os conjuntos de itens presentes nas regras de associação. Não tem nada a ver com classificação. ERRADA

    c) Essa alternativa está falando de text mining. Uma página da internet que contenha textos pode sim ser alvo desse tipo de técnica. CERTA

    d) Na verdade a mineração de dados é mais voltada a grandes quantidades de dados, já que a probabilidade de conterem padrões ocultos úteis vai se tornando maior a medida que o conjunto cresce. ERRADA

    e) Não existe tal restrição. Em um processo de mineração podem ser verificados diversos padrões em um banco de dados. ERRADA

  • Aquela questão que não beneficia nem um pouco quem estuda banco de dados com afinco =/

  • Para a mineração não precisa de um dado estruturado? De modo que uma análise em termos de "big data para o caso seria mais correta?

  • Letra C

    Mineração de texto: trata-se de um meio para encontrar padrões interessantes/úteis em um contexto de informações textuais não estruturadas, combinando com alguma tecnologia de extração e de recuperação da informação, processo de linguagem natural e de sumarização ou indexação de documentos.

  • MINERAÇÃO DE TEXTO

    ENCONTRA RELAÇÕES ENTRE DOCUMENTOS TEXTUAIS NÃO CONECTADOS.

    Identifica palavras chave e coexistência de termos em artigos da mesma área e análise de sentimentos em redes sociais.


ID
1164925
Banca
FUNDEP (Gestão de Concursos)
Órgão
IFN-MG
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Ao se utilizar a técnica de data mining (mineração de dados), como é conhecido o resultado dessa mineração, em que, por exemplo, se um cliente compra equipamento de vídeo, ele pode também comprar outros equipamentos eletrônicos?

Alternativas
Comentários
  • LETRA A. 

    Segundo Navathe(2011,p.699),"O resultado da mineração pode ser descobrir o seguinte tipo de informação nova:

    Regras de associação: por exemplo, sempre que um cliente compra equipamento de vídeo, ele ou ela também compra outro aparelho eletrônico"

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-6 EDIÇÃO 2011-NAVATHE

  • Pode ser feita também uma analogia, para facilitar o entendimento, por exemplo de um supermercado, onde a organização dos produtos podem seguir conceito semelhante. Exemplo: normalmente alguém que compra pão também compra leite e ovos, portanto, pode-se colocar tais produtos próximos a fim de buscar aumentar as vendas.

  • Gabarito: A.

    É bom frisar que há uma distinção com padrões sequenciais, pois este apresenta um lapso temporal. Por exemplo, o cliente compra o equipamento de vídeo, aí pode ser que em três meses ele compre acessórios, depois em 5 meses ele compre outros equipamentos que decorrem dos acessórios, etc.

    Qualquer equívoco, mandem mensagem.

    Bons estudos!

  • Ao se utilizar a técnica de data mining (mineração de dados), como é conhecido o resultado dessa mineração, em que, por exemplo, se um cliente compra equipamento de vídeo, ele pode também comprar outros equipamentos eletrônicos?

    REGRAS DE ASSOCIAÇÃO.

    .

    Ao se utilizar a técnica de data mining (mineração de dados), como é conhecido o resultado dessa mineração, em que, por exemplo, se um cliente compra equipamento de vídeo, ele também compra outros equipamentos eletrônicos após algum tempo?

    PADRÕES SEQUENCIAIS.


ID
1176055
Banca
CESPE / CEBRASPE
Órgão
TC-DF
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens subsecutivos, com relação a Data Mining, desempenho de sistemas de bancos de dados e controle de concorrência.

Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados.

Alternativas
Comentários
  • Segundo Carlos Barbieri  BI2 - Business intelligence pág. 137

    "Classificação - São processo que definem agrupamentos de itens em classes, segundo referências estabelecidas. São usados para definir grupos ou classes de elementos, com em certos parâmetros preestabelecidos."
  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

     

     

    "Classificação - São processo que definem agrupamentos de itens em classes, segundo referências estabelecidas. São usados para definir grupos ou classes de elementos, com em certos parâmetros preestabelecidos."

    Segundo Carlos Barbieri  BI2 - Business intelligence pág. 137

  • É verdade. A classificação visa utilizar vários atributos para obter o valor do que está se buscando rotular. Por exemplo, na análise do perfil de risco de um cliente são analisados fatores do perfil socioeconômico do cliente como idade, renda, etc. É importante lembrar que, na classificação, as classes em que serão mapeadas as variáveis são predefinidas, ao contrário do que acontece na clusterização.

  •  Realmente essa técnica busca identificar uma classe por meio de múltiplos atributos e pode ser usada – sim – em conjunto com outras técnicas de mineração de dados (Correto).

  • Certa

    é importante dizer que a classificação é considerada um exemplo de aprendizado supervisionado – isso significa que as classes são pré-definidas antes da análise dos resultados.

  • Outra questão para aprendizado.

    Julgue o item que segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.

    Situação hipotética: Na ação de obtenção de informações por meio de aprendizado de máquina, verificou-se que o processo que estava sendo realizado consistia em examinar as características de determinado objeto e atribuir-lhe uma ou mais classes; verificou-se também que os algoritmos utilizados eram embasados em algoritmos de aprendizagem supervisionados. Assertiva: Nessa situação, a ação em realização está relacionada ao processo de classificação.

    CORRETO

  • "busca identificar uma classe"

    e aí? a classe é previamente conhecida (classificação) ou desconhecida (agrupamento)?

    ¯\_(ツ)_/¯

  • Técnicas do Data mining:

    • Associação: representa padrões de relacionamento entre itens de uma base de dados (famoso exemplo da frauda e cerveja)

    • Classificação: ajuda a obter informações importante sobre dados e metadados. Está intimamente relacionada com a técnica de clusterização e utiliza árvore de decisão ou rede neural. (agrupa por classes)

    • Agrupamento(clustering): é uma técnica que também é conhecida como agrupamento de dados. Trata-se do processo de identificação de dados semelhantes e não semelhantes entre si.

    Gabarito: CERTO

    Espero ter ajudado!

    • Classificação: Envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Supervisionado justamente porque o ser humano precisa fornecer alguns exemplos para que o aprendizado possa ocorrer.

    • Análise de agrupamentos (clusterização): É um exemplo de aprendizado não supervisionado. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. 
  • Acho que esta questão esta errada, segue meus argumentos:

    Questão

    Julgue os itens subsecutivos, com relação a Data Mining, desempenho de sistemas de bancos de dados e controle de concorrência.

    Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados.

    Argumento

    na classificação, o modelo de dados é previamente construído, portando não há o que se falar em busca de atributos comuns, pois quando o processo de mineração começa, as classes já estão previamente definidas. acredito que o erro esta em falar que é classificação, quando na verdade seria o cluster / agrupamento ( busca durante o processo de mineração atributos comuns) , e desta forma os agrupa em classes/ agrupamentos.

    pessoal, caso concordem ou discordem, escrevam ai no comentário a fim de contribuir para o conhecimento coletivo.


ID
1208215
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a sistemas de suporte à decisão, julgue os seguintes itens.

Assim como o DataMining, os DataMarts são voltados para a obtenção de informações estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir da análise de dados oriundos de DataWarehouses.

Alternativas
Comentários
  • Data Mining
    A mineração de dados consiste em usar o computador para vasculhar imensos bancos de dados em busca de tendências que passam despercebidas aos olhos humanos. Como o Data WhereHouse possui bases de dados bem organizadas e consolidadas, as ferramentas de Data Mining ganharam grande importância e utilidade. Essa técnica, orientada para a mineração dos dados, oferece uma poderosa alternativa para as organizações descobrirem novas oportunidades e, acima de tudo, para traçarem novas estratégias para o futuro.
    O propósito da análise de dados é descobrir previamente características dos dados, sejam essas características relacionamentos, dependências ou tendências desconhecidas. 
    Tais descobertas tornam-se parte da estrutura informacional em que decisões são formadas. Uma ferramenta típica de análise de dados ajuda os usuários finais na definição do problema, na seleção de dados e a iniciar uma apropriada análise para geração da informação.Data Mart
    Os primeiros projetos sobre Data Warehouse (DW) referiam-se a uma arquitetura centralizada. Embora fosse interessante fornecer uniformidade, controle e maior segurança, a implementação desta abordagem não é uma tarefa fácil. Requer uma metodologia rigorosa e uma completa compreensão dos negócios da empresa. Esta abordagem pode ser longa e dispendiosa e por isto sua implementação exige um planejamento bem detalhado. Com o aparecimento de data mart ou warehouse departamental, a abordagem descentralizada passou a ser uma das opções de arquitetura data warehouse. Os data marts podem surgir de duas maneiras. A primeira é top-down e a outra é a botton-up.
    Top-down: é quando a empresa cria um DW e depois parte para a segmentação, ou seja, divide o DW em áreas menores gerando assim pequenos bancos orientados por assuntos departamentalizados. 
    Botton-up: é quando a situação é inversa. A empresa por desconhecer a tecnologia, prefere primeiro criar um banco 
    de dados para somente uma área. Com isso os custos são bem inferiores de um projeto de DW completo. 
    A partir da visualização dos primeiros resultados parte para outra área e assim sucessivamente até resultar num Data Warehouse. 
    A tecnologia usada tanto no DW como no Data Mart é a mesma, as variações que ocorrem são mínimas, sendo em volume de dados e na complexidade de carga. A principal diferença é a de que os Data Marts são voltados somente para uma determinada área, já o DW é voltado para os assuntos da empresa toda. Fonte: http://www.totall.com.br/bi/artigos.asp?sessao=148
  • Data Mart é um banco de dados departamental que subsidiará a formação de um DW corporativo

  • A questão apresenta vários erros. 

    1- os DataMarts são departamentais, não poderiam, isoladamente, prover subsídios para decisões estratégicas; 2- o processo de KDD (Knowledge Discovery in Database), existente em DataMining possui 6 fases:

     1. Seleção de dados. 

    � 2. Limpeza de dados.

    � 3. Enriquecimento.

    � 4. Transformação.

    � 5. Mineração.

    � 6. Análise, assimilação, interpretação, avaliação, divulgação e exposição das informações.

    Certamente, várias dessas etapas envolvem atividades humanas de análise, que não podem ser conseguidas de forma automatizada em sua plenitude!

    Espero ter ajudado!
  • Atenção, não confundir com o conceito de "staging area" que é realizado fora do acesso dos usuários.

  • Os Data Marts sao um tipo de Data Warehouse porem com menor abrangencia, ou seja, aplicados sobre um escopo menor(departamental).

  • Data mart (repositório de dados) é sub-conjunto de dados de um Data warehouse (armazém de dados). Geralmente são dados referentes a um assunto em especial (ex: Vendas, Estoque, Controladoria) ou diferentes níveis de sumarização (ex: Vendas Anual, Vendas Mensal, Vendas 5 anos)

     

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: ERRADO

  • Está faltando objetividade e sobrando "falação" nos comentários. Acredito que a questão esteja estruturada noutra questão, o DataMining aceita maior intervenção humana no process de construção da informação, (vasculhando e buscando dados) do que os DW ou DM, que fazem isso de forma mais automática!

  • Nenhum desses três conceitos é automático. A mineração de dados abarca o aprendizado de máquina, então há um certo grau de inteligência artificial aplicada, mas isso não quer dizer de forma alguma que a intervenção humana fica em segundo plano. Segundo Laudon & Laudon, inclusive, essa é uma das falácias da mineração de dados: dizer que ela ocorre sem a intervenção humana. Além disso, temos que o Data Mart é apenas um subconjunto do Data Warehouse, então temos algumas confusões conceituais que invalidam a assertiva.

  • DataMarts são pedaços dentro do DW, ou seja, já são as informações armazenadas 

    DataMining sim é voltado para obtenção de informações

    Gab.: Errado

  • De maneira, rápida e objetiva:

    Data Mining → Coleta de informações

    Data Mart → Subdivisões do DataWarehouse

  • A mineração de dados abarca o aprendizado de máquina, então há um certo grau de inteligência artificial aplicada, mas isso não quer dizer que a intervenção humana fica em segundo plano. Além disso, o Data Mart é apenas um subconjunto do Data Warehouse.

  • Mineração de dados --> semiautomática (ainda necessita da intervenção humana)

  • comparou dois conceitos que não tem nada a ver

  • Arthur Mendonça | Direção Concursos

    Nenhum desses três conceitos é automático. A mineração de dados abarca o aprendizado de máquina, então há um certo grau de inteligência artificial aplicada, mas isso não quer dizer de forma alguma que a intervenção humana fica em segundo plano. Segundo Laudon & Laudon, inclusive, essa é uma das falácias da mineração de dados: dizer que ela ocorre sem a intervenção humana. Além disso, temos que o Data Mart é apenas um subconjunto do Data Warehouse, então temos algumas confusões conceituais que invalidam a assertiva.

  • Se fosse automática, como ele saberia quais dados são importantes??

  • Erro 1: É dizer que o processo de mineração é autônomo, precisando de pouca ou nenhuma supervisão.

    O processo de mineração não é completamente automático. Apesar de haver o emprego de técnicas de inteligência artificial, a supervisão e ação humana é necessária durante todo o processo.

    Erro 2: É comparar Data mining com DataMarts.

    Data Mart é apenas um subconjunto do Data Warehouse.

  • Com relação a sistemas de suporte à decisão, julgue os seguintes itens.

    Assim como o DataMining, os DataMarts são voltados para a obtenção de informações estratégicas de maneira automática, ou seja, com o mínimo de intervenção humana a partir da análise de dados oriundos de DataWarehouses.

    se tem intervenção não são automáticos; e outra, data mining não é inexoravelmente usado em um DW, embora seja um costume.

    AVANTE

  • Q81745 - O data mining é um processo automático de descoberta de padrões, de conhecimento em bases de dados, que utiliza, entre outros, árvores de decisão e métodos bayesianos como técnicas para classificação de dados = C.

  • O processo de mineração de dados é:

    • INTERATIVO: homem e máquina

    e

    • ITERATIVO: processo repetitivo até que se encontre algo útil
  • Os DataMarts não são voltados para a obtenção de informações estratégicas. Eles, na verdade, são subconjuntos de um Armazém de Dados – Data Warehouse sendo um repositório de dados para assuntos específicos.


ID
1208230
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a sistemas de suporte à decisão, julgue os seguintes itens.

DataMining pode ser considerado uma etapa no processo de descoberta de conhecimento em base de dados, consistindo em análise de conjuntos de dados cujo objetivo é descobrir padrões úteis para tomada de decisão.

Alternativas
Comentários
  • Exato conceito de Data Mining (mineração de dados), ela busca informações/dados, que futuramente poderá ser útil para a tomada de decisões.

    Conceito leigo.


  • CERTO. Poxa não achei o conceito leigo não. Achei interessante como foi abordada a questão. Clara e com profundidade.

    Segundo Navathe(2011,p.699),"O processo de descoberta de conhecimento compreende seis fases: seleção de dados, limpeza de dados, enriquecimento, transformação ou codificação de dados,mineração de dados e o relatório e exibição da informação descoberta. "

    Segundo Navathe(2011,p.698),"[...] mineração de banco de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados."

    Segundo Navathe(2011,p.698),"A mineração pode de dados pode ser usada junto com um datawarehouse para ajudar com certos tipos de decisões."

    Conclusão:  A mineração de dados (DataMining) faz parte da descoberta de conhecimento, e é usada para extração de novos conhecimentos que auxiliam na tomada de decisão.

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-6 EDIÇÃO 2011


  • 2015
    Quem utiliza o data mining tem como objetivo descobrir, explorar ou minerar relacionamentos, padrões e vínculos significativos presentes em grandes massas documentais registradas em arquivos físicos (analógicos) e arquivos lógicos (digitais)
    errada

     

    não permite interação com o Usuário
    2010
    Diferentemente de datamining, que não possibilita a interação do usuário na busca por informações úteis, o OLAP permite ao usuário extrair informações de um data warehouse ou de um datamart, de forma customizada e interativa.
    certa

  • É importante entender a técnica do datamining ou mineração de dados. Essa técnica é uma forma de extrair dados de um determinado banco de dados, com isso é possível prever, identificar, classificar ou otimizar os dados.

     

    Veja o conceito exposto pelo site Devmedia.com.br:

     

    “Data Mining consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados.”

  • O processo de descoberta de conhecimento, como o nome já diz, tem como objetivo a extração de informações e a geração do conhecimento a partir dos conjuntos de dados. A mineração de dados é uma das várias etapas desse processo, que inclui seleção, pré-processamento, transformação e a interpretação e avaliação dos resultados da mineração. O objetivo da etapa de mineração de dados é mesmo descobrir padrões e relacionamentos úteis, de modo a subsidiar a tomada de decisão.

  • CERTO

    Para Cios et al. e Fayyad o KDD refere-se a todo o processo de descoberta de conhecimento, e a Mineração de Dados a uma das atividades do processo.

    "Mineração de Dados é um passo no processo de Descoberta de Conhecimento que consiste na realização da análise dos dados e na aplicação de algoritmos de descoberta que, sob certas limitações computacionais, produzem um conjunto de padrões de certos dados", Fayyad.

    Conceito leigo, kkkkkkkkkkkkkk

  • (C)

    Outas da CESPE que ajudam a responder:

    PF18 Descobrir conexões escondidas e prever tendências futuras é um dos objetivos da mineração de dados, que utiliza a estatística, a inteligência artificial e os algoritmos de aprendizagem de máquina.(C)

    PF18 pode-se definir mineração de dados como o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis.(C)

    Árvores de decisão e regras de associação são exemplos de algoritmos de data mining.(C)

    As ferramentas de Data Mining permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa, dentre outras.(C)

    A finalidade do uso do data mining em uma organização é subsidiar a produção de afirmações conclusivas acerca do padrão de comportamento exibido por agentes de interesse dessa organização.(C)

    O uso prático de data mining envolve o emprego de processos, ferramentas, técnicas e métodos oriundos da matemática, da estatística e da computação, inclusive de inteligência artificial.(C)

  • GAB C

    Data Mining faz parte de um processo muito maior de descoberta de conhecimento chamada KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em Bancos de Dados.

    Através de um conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização para a tomada de decisões.

  • Fraldas x Cervejas às 21hrs... isso é Mineração de Dados (DATA MINING)

    GABARITO - CERTO

  • CERTO

    As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.

    O data mining consiste no processo virtual em que uma máquina realiza de maneira programada a prospecção e coleta de dados no ambiente eletrônico. 

    Ou seja, é uma forma ativa e automatizada de obter informação a partir da internet e de sistemas em rede.

  • Direto ao ponto.

    Quando a questão diz "processo de descoberta de conhecimento em base de dados", ela descreve o conceito de KDD (knowledge-discovery in databases).

    O processo do KDD é composto de:

    • Seleção de dados;
    • Limpeza;
    • Enriquecimento;
    • Transformação ou codificação;
    • Data mining;
    • Construção de relatórios;
    • Apresentação da informação descobertas;

    OU SEJA, Data minig é uma etapa (intermediária) do KDD, que é um processo. Equivale dizer que KDD>DM.

  • Perfeito

  • Data Mining:

    • A mineração de dados é um processo que permite encontrar padrões e relacionamentos ocultos em conjuntos de dados, de modo a subsidiar a tomada de decisão;

    • É um processo multidisciplinar, envolvendo estatística, matemática e computação;

    • Inúmeros propósitos: marketing, detecção de fraudes, saúde, sistemas de recomendação, entre outros.

  • A descoberta de conhecimento nos bancos de dados (KDD) abrange mais

    do que a mineração de dados. O processo de descoberta do conhecimento

    compreende seis fases:

    (1) seleção de dados;

    (2) limpeza de dados;

    (3) enriquecimento;

    (4) transformação ou codificação de dados;

    (5) mineração de dados; e

    (6) relatório e exibição de informação descoberta.

    A mineração de dados (data mining) refere-se à mineração ou

    descoberta de novas informações em termos de padrões ou regras com

    base em grandes quantidades de dados.

    Gabarito: Certo.


ID
1211539
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de DataMining e de DataWarehouse, julgue o item subsecutivo.

Os principais processos de DataMining são a identificação de variações embasado em normas, a detecção e análise de relacionamentos, a paginação de memória e o controle de periféricos.

Alternativas
Comentários
  • Os principais processos de DataMining consistem primeiro na organização e preparação de dados para os processos analíticos de Data Mining, no Data Mining em si, e na posterior utilização do conhecimento obtido para alavancar a atuação da empresa.

  • controle de perifericos...

  • Perifericos ? 100hor amado , nao ne 

  • Paginação da memória.. 
    Ahhh tá.

  • O examinador introduziu alguns conceitos de sistemas operacionais no meio da assertiva para ver se colava. Na verdade, a detecção e a análise de relacionamentos ocultos e de variações nos conjuntos de dados podem fazer parte de um processo de mineração, mas paginação e de memória e controle de periféricos não têm nada a ver com o nosso assunto.

  • DataMining (Mineração de Dados):

    -Descobrir conexões escondidas;

    -Prever tendências futuras;

    -Encontrar padrões válidos

    Ferramentas usadas pelo DataMining:

    -Estatística;

    -Inteligência Artificial;

    -Algoritmo de Machine Learning.

    Fonte: Meu resumo.

  • Gabarito: Errado

    Os principais processos de Data Mining consistem:

    • primeiro na organização e preparação de dados para os processos analíticos de Data Mining;
    • no Data Mining em si;
    • e na posterior utilização do conhecimento obtido para alavancar a atuação da empresa.
    • Não há o que se falar em "controle de periféricos".
  • ERRADO

    Os principais métodos de mineração de dados:

    • Rede Neurais
    • Árvore de Decisão
    • Algoritmos Genéticos
    • Lógica Fuzzy (Difusa)
    • Estatística

    A mineração de dados se apoia em três pilares de sustentação:

    o  Estatística clássica: para analisar fatores como variância e desvio padrão

    o  Inteligência artificial: considerada a matriz do 

    o  Machine learning: capacidade que as máquinas têm de acumular conhecimento e se tornarem inteligentes.

  • Os periféricos são equipamentos que auxiliam a comunicação homem-máquina, como, por exemplo, mouse, teclado, fones de ouvido, impressora, suportes em geral, caixas de som, dispositivos E/S, etc.

    Ou seja, o controle de periféricos NÃO é um processo de DataMining!

    #mantém

  • Aquela questão q a banca bota um conceito nada a ver, mas q na hora do vamo ver vc duvida até se é alfabetizado


ID
1215157
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os itens a seguir, acerca de modelagem multidimensional, DataWarehouse e DataMarts.

A captura de dados baseada na técnica Timestamp é inadequada para capturar estados intermediários, nas situações em que os dados operacionais são transientes.

Alternativas
Comentários
  • Não se trata de técnica, é um protocolo. Serve para que o sistema de banco de dados faça o controle da execução quando existem transações que estão concorrendo entre si, para garantir a consistência do banco de dados. Podemos considerar isso como sendo um controle de concorrência.


  • Apesar do artigo do Pedro Paulo indicar que timestamp é um protocolo, vejo como uma técnica ou algoritmo.


    Protocolo de timestamp está relacionado ao TCP: http://en.wikipedia.org/wiki/Time_stamp_protocol

    Existe um algoritmo para esta questão: http://en.wikipedia.org/wiki/Timestamp-based_concurrency_control

    A questão se refere ao fato que timestamp apenas indica qual dado é mais novo. Assim, se um dado passar de A (08:00) para B(08:03), o algoritmo sabe que B é mais novo. Se próximo dado for C (08:01), o A se perdeu.

  • Um modo de prevenir deadlocks, é utilizar o conceito de registro de timestamp da transação, normalmente são baseados na ordem em que as transações são iniciadas. Portanto, se a transação T1 inicia antes da transação T2, então T1 terá o menor valor de registro de timestamp.

  • No timestamp, você captura um dado e associa à um rótulo de tempo quando ocorre o commit. Como os dados do ambiente operacional variam muito, pode ocorrer deles variarem bastante entre 2 commits, ou seja, essa variação intermediária é perdida, sendo inadequado o uso de timestamps.

  • Gabarito: Certo.

    É como se cada transação do banco de dados recebesse um "carimbo" com o horário de quando aconteceu. Como os dados são transientes, o dado vai ser perdido quando a transação acabar. Em função disso, o timestamp não é muito adequado.

    Caso esteja equivocado, mandem mensagem.

    Deixo, como contribuição, um artigo do DevMedia que fala um pouco sobre o controle de concorrência por meio do timestamp: https://www.devmedia.com.br/protocolo-com-base-em-timestamp-controle-de-concorrencia-em-bancos-de-dados/27810.

    Bons estudos!

  • Acrescentando:

    As principais técnicas de controle de concorrência são:

    • bloqueio (locking);
    • ordenamento de registro de timestamp;
    • multiversão;
    • validação ou certificação (protocolos otimistas). 

    Com registros de timestamp, pode ocorrer starvation(Starvation é quando um processo não consegue ser executado) se uma transação for continuamente abortada e reiniciada.

    O algoritmo básico pode provocar rollback em cascata.

    Logo, para dados transitórios, não é viável o uso dessa tecnica, sendo que continuamente os dados terão seu tempo esgotado e logo em seguida serão adicionados outros.

    Um registro de timestamp (TS) é um identificador único criado pelo SGBD para identificar uma transação. Os registros são gerados por um contador incremental ou utilizam o valor corrente do relógio do sistema (data/hora/minuto/segundo/milissegundo).


ID
1215166
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, com relação a DataMining e ETL.

O uso de agrupamento (clustering) em DataMining exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares para predizer valores de variáveis.

Alternativas
Comentários
  • Agrupamento (Clustering)

    A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares


    Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf

  • O correto seria:


    O uso de agrupamento (clustering) em DataMining não exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares sem ter que predizer valores de variáveis.

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: ERRADO

     

     

    Agrupamento (Clustering)

    A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares

     

     

    Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf

  • esse é o conceito de CLASSIFICAÇÃO!!!

    Nela, você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva - supervisionada).

     

    No agrupamento há apenas a separação de dados constantes no seu banco (descritivo - não supervisionada). O objetivo não é classificar novas informações!!!

     

    Portanto, ERRADO

  • Trata-se de método não supervisionado (não existe rotulação dos dados)

  • CLUSTERING (AGRUPAMENTO)

     

    *Identifica agrupamento de objetos

     

    *Aprendizado não supervisionado

     

    *Não necessita que registors sejam categorizados

    OBS: essa característica o diferencia de classificação

     

     

    GAB: ERRADO

  • Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.

  • Essa é a classificação e não agrupamento.

  • Gabarito: errado

    Análise de Agrupamentos é utilizado quando nenhum grupo foi definido e nenhum registro foi previamente categorizado – a questão trata da Classificação.

    Questões sobre o clustering:

    CESPE / CEBRASPE - 2013) Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo

    (CESPE / CEBRASPE - 2021) No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

     (CESPE / CEBRASPE - 2013) Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo

     (CESPE / CEBRASPE - 2011) Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster), por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo. (errado)

  • Classificação -> exigem dados pré-definidos (SUPERVISIONADO)

    Agrupamento -> NÃO exigem dados pré-definidos (NÃO SUPERVISIONADO)

    Questão semelhante:

    (CESPE / TCU – 2007) No datamining, o agrupamento e a classificação funcionam de maneira

    similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence,

    examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda

    definido.

    Comentários:

    A questão inverteu os conceitos de agrupamento e classificação.

  • Classificação - Supervisionado

    Clusterização - Não supervisionado

  • Classificação: envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Exemplo de algoritmo: SVM, árvores de decisão, classificação de risco

    Agrupamentos/aglomerações (clusterização): é um exemplo de aprendizado não supervisionado. O sistema trabalha sem auxíliosEnvolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. Exemplo de algoritmo: K-Means. 

    Recentemente, em 2020, foi cobrada a diferença entre K-means, K-medoids e Fuzzy k-médias, fiquem de olho.

  • Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.

    Arthur Mendonça | Direção Concursos

    05/12/2019 às 18:43

  • Agrupamento :  Particiona dados em segmentos desconhecidos com características semelhantes

    • CLUSTER: NAO SUPERVISIONADO
  • ERRADO

    Agrupamento: não supervisionado. à os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.

    Classificação: supervisionado.

    Suporte / Prevalência: Trata-se da frequência com que um conjunto de itens específico ocorre no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto (Ex: 50% das compras realizadas em um mercado contém arroz e refrigerante).

    Confiança / Força: Trata-se da probabilidade de que exista uma relação entre itens (Ex: 70% dos clientes que compram fraldas também compram cerveja).

  • Clustering: permite segmentar automaticamente dados em grupos, de acordo com a similaridade. Cluster superestima a semelhança entre os grupos e não trata os pontos de dados como indivíduos. Por esse motivo, Clustering é inadequado para dividir grupos de clientes

  • Mesma história em 2020:

    CESPE 2020 - A técnica de agregação na mineração de dados atua em conjunto de registros que tenham sido previamente classificados. ERRADO

  • ERRADO

    • A técnica de Agrupamento NÃO possui classes/categorias previamente definidas, além de Não possuir característica Preditiva.
    • Essa característica é da técnica de Classificação.
    • Classificação: Envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Supervisionado justamente porque o ser humano precisa fornecer alguns exemplos para que o aprendizado possa ocorrer.

    • Análise de agrupamentos (clusterização): É um exemplo de aprendizado não supervisionado. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. 

  • Descritiva: Associação, agrupamento ou clustering

    Preditiva: Classificação ou Regressão, servem para predizer valores futuros.

  • Errado.

    A questão trouxe o conceito da técnica de classificação.

    A técnica de agrupamento é não-supervisionada, ou seja, quando não há uma classe associada.

    Já a técnica de classificação é supervisionada, ou seja, você apresenta ao algoritmo alguns conjuntos de padrões de ENTRADA e seus correspondentes de SAÍDA, comparando-se à resposta fornecida pelo algoritmo com a resposta apresentada.

    Uma questão bem recente da PF serve para responder essa:

    (2021/PF) A análise de clustering é uma tarefa que consiste em agrupar um conjunto de objetos de tal forma que estes, juntos no mesmo grupo, sejam mais semelhantes entre si que em outros grupos. CERTO 

    (2018/FCC)Dentre os algoritmos utilizados em data mining, há um algoritmo que visa o estabelecimento de categorias, a partir do conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Essa descrição corresponde aos algoritmos de A) Classificação

  • As tarefas de mineração de dados são de natureza PREDITIVA ou DESCRITIVA:

    • PREDITIVAS (SUPERVISIONADAS): Usa algumas variáveis para prever valores desconhecidos ou futuros de outras variáveis;

    EX.: Classificação e Regressão.

    • DESCRITIVAS (NÃO SUPERVISIONADAS): Padrões para descrever os dados

    EX.: Agrupamento (Clustering) e Regras de Associação.

    FONTE: Material Estúdio Aulas, prof. Léo Matos.


ID
1215172
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, com relação a DataMining e ETL.

O processo de transformação de dados pode exigir que dados logicamente relacionados, mas fisicamente separados, sejam recompostos, ainda que envolvam registros distintos ou até mesmo estejam em bancos de dados operacionais distintos.

Alternativas
Comentários
  • Pré-processamento em Data-Mining

    A etapa de pré-processamento, no processo de descoberta de conhecimento – KDD (Knowledge Discovery in databases), compreende a aplicação de várias técnicas para captação, organização, tratamento e a preparação dos dados. É uma etapa que possui fundamental relevância no processo de KDD. Compreende desde a correção de dados errados até o ajuste da formatação dos dados para os algoritmos de mineração de dados que serão utilizados.

    http://www.din.uem.br/~gpea/linhas-de-pesquisa/mineracao-de-dados/pre-processamento/pre-processamento-em-data-mining/

  • Cuidado. No processo de KDD, pré-processamento e transformação são etapas distintas.

     

     

    Pré-processamento e Limpeza
    O Pré-processamento e limpeza dos dados é uma parte crucial no processo de KDD, pois a qualidade dos dados vai determinar a eficiência dos algoritmos de mineração. Nesta etapa deverão ser realizadas tarefas que eliminem dados redundantes e inconsistentes, recuperem dados incompletos e avaliem possíveis dados discrepantes ao conjunto, chamados de outliers.

    O auxílio de um especialista do domínio é fundamental, pois na maioria dos casos apenas alguém que realmente entende do assunto é capaz de dizer se um dado é um outlier ou um erro de digitação.

    Nesta fase também são utilizados métodos de redução ou transformação para diminuir o número de variáveis envolvidas no processo, visando com isto melhorar o desempenho do algoritmo de análise.

    A identificação de dados inapropriados dentro do conjunto selecionado é problemática, e isto dificulta a automatização desta fase. Definir um dado como “ruim” dentro do conjunto depende da estrutura do mesmo e também de que aplicação é dada a ele (leia mais em DUNKEL  et al. , 1997).

    Transformação dos Dados
    A Transformação do Dados é a fase do KDD que antecede a fase de Data Mining. Após serem selecionados, limpos e pré-processados, os dados necessitam ser armazenados e formatados adequadamente para que os algoritmos possam ser aplicados.

    Em grandes corporações é comum encontrar computadores rodando diferentes sistemas operacionais e diferentes Sistemas Gerenciadores de Bancos de Dados (SGDB). Estes dados que estão dispersos devem ser agrupados em um repositório único.

    Além disto, nesta fase, se necessário, é possível obter dados faltantes através da transformação ou combinação de outros, são os chamados “dados derivados”. Um exemplo de um dado que pode ser calculado a partir de outro é a idade de um indivíduo, que pode ser encontrada a partir de sua data de nascimento.  Outro exemplo é o valor total de um finaciamento que pode ser calculado a partir da multiplicação do número de parcelas pelo valor da parcela.

     

     

    http://fp2.com.br/blog/index.php/2012/um-visao-geral-sobre-fases-kdd/

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: CERTO

  • A questão remete ao pré-processamento dos dados. Uma das tarefas dessa etapa envolve a integração de diferentes bases de dados. Dessa forma, a mineração poderá ocorrer em cima de um conjunto de dados que está fisicamente armazenado em BDs operacionais distintos, mas que foram posteriormente integrados em um DW ou em alguma estrutura do tipo.

  • Certo

    O sistema Extract-Transform-Load (ETL) é a base para construção de um data warehouse. Quando projetado adequadamente um sistema ETL extrai dados dos sistemas de origem, reforça a qualidade dos dados e padrões de consistência, ajusta dados para que dados advindos de fontes distintas possam ser usados juntos e finalmente entrega dados em um formato pronto para apresentação.

     

    A principal função da integração de dados ou ETL é obter dados de onde eles residem atualmente, alterando-os para que sejam compatíveis com o formato desejado e colocando-os no sistema de destino. Essas três etapas são chamadas de extrair, transformar e carregar (ETL). Toda a integração de dados, independentemente de ser executada em lote (batch) ou em tempo real, de forma síncrona ou assíncrona, física ou virtualmente, gira em torno dessas ações básicas.

     

    O ETL é responsável pela extração, transformação e carga dos dados das bases operacionais para a base de dados analítico.

     

    O processo de ETL é composto por algumas fases, extrair, limpar, preparar e entregar.

     

    No processo de ETL mostrado na figura, I e II correspondem, respectivamente, a: Staging Area e Data Warehouse.

  • integração de dados

    ANP.

  • Por que um Analista Judiciário precisa saber isso????????

  • Transformação de dados: Para realizar a mineração de dados, além da limpeza pode ser necessário também realizar algumas transformações sobre o conjunto de dados. Usa-se técnicas como normalização, suavização, agregação, generalização;

    Normalização: Essa normalização é diferente do processo de normalização que é aplicado nos bancos de dados relacionais. Aqui estamos falando de uma normalização matemática, uma operação em que os dados são distribuídos proporcionalmente para ficarem todos em um determinado intervalo. 

    Suavização: Consiste na remoção de ruídos dos dados, aqueles valores ocasionais que saem de um padrão desejado.

    Agregação: diminui o nível de detalhe dos dados. Dependendo da situação, pode não ser necessário armazenar os dados no seu formato mais detalhado, então realizamos a agregação para reduzir a quantidade de registros no nosso conjunto de dados.

    Generalização ou Discretização: A generalização também reduz a quantidade de registros como a agregação, mas a diferença é que esse processo permite transformar conjuntos de valores em categorias hierárquicas. Por exemplo, podemos juntar várias idades em uma divisão como “jovem”, “adulto” e “idoso”. 


ID
1215175
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, com relação a DataMining e ETL.

Embora os algoritmos genéticos apresentem elevada demanda computacional, eles possibilitam a resolução de problemas em paralelo; por isso, são uma boa ferramenta para mineração de dados.

Alternativas
Comentários
  • Os Algoritmos Genéticos (AGs) diferem dos métodos tradicionais de busca e otimização, principalmente em quatro aspectos:

    1. AGs trabalham com uma codificação do conjunto de parâmetros e não com os próprios parâmetros.

    2. AGs trabalham com uma população e não com um único ponto.

    3. AGs utilizam informações de custo ou recompensa e não derivadas ou outro conhecimento auxiliar.

    4. AGs utilizam regras de transição probabilísticas e não determinísticas.

    http://www.icmc.usp.br/pessoas/andre/research/genetic/

  • Um sistema de data mining pode realizar pelo menos uma das seguintes tarefas:

    4. Previsão - esta função de mineração prediz os possíveis valores de alguns dados perdidos ou a distribuição de valores de certos atributos em um conjunto de objetos. Ela envolve a descoberta de um conjunto de atributos relevantes para o atributo de interesse (e.g., por algumas análise estatística) e prediz a distribuição do valor baseada no valor do conjunto de dados semelhantes ao(s) objeto(s) selecionado(s). Por exemplo, o salário potencial de um empregado pode ser predito baseado na distribuição do salário de empregados semelhantes na companhia. Usualmente, análise de regressão, modelo linear generalizado, análise de correlação e árvores de decisão são ferramentas úteis em predição de qualidade. Também são usados algoritmos genéticos e redes neurais com bastante sucesso.


    http://www.dct.ufms.br/~mzanusso/Data_Mining.htm


    BONS ESTUDOS.

  • CERTO. Muito boa esta questão. Acabei de aprender coisas novas que não sabia. =]

    Segundo Navathe(2011,p.715),"Os algoritmos genéticos são usados para solução e agrupamento de problemas. Sua capacidade de solucionar problemas em paralelo oferece uma ferramenta poderosa para a mineração de dados. As desvantagens dos algoritmos genéticos incluem a grande superprodução de soluções individuais, o caráter aleatório do processo de pesquisa e a alta demanda no processamento do computador."

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-2011-6 EDIÇÃO

  • (C)

    Cespe / Data Mining

    As ferramentas de Data Mining permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa, dentre outras.(C)

  • DATAMINING: (CESPE)

    ‘’É um conjunto de processos, métodos, teorias, ferramentas e tecnologias open-end utilizadas para explorar, organizar e analisar de forma semi-automática uma GRANDE QUANTIDADE de DADOS BRUTOS com intuito de identificar, descobrir, extrair, classificar e agrupar informações implícitas desconhecidas, além de avaliar correlações, tendências e PADRÕES consistentes de comportamento POTENCIALMENTE ÚTEIS – como regras de associação ou sequências temporais – de forma não trivial por meio de TÉCNICAS ESTATÍSTICAS e MATEMÁTICAS, como redes neurais, algoritmos genéticos, inteligência artificial, lógica nebulosa, ANÁLISE de CONGLOMERADOS (clusters).’’

    Fonte: Estratégia Concursos.

  • Os algoritmos genéticos são usados para solução e agrupamento de problemas. Sua capacidade de solucionar problemas em paralelo oferece uma ferramenta poderosa para mineração de dados. As desvantagens dos GAs incluem a grande superprodução de soluções individuais, o caráter aleatório do processo de pesquisa e a alta demanda no processamento

    do computador.

    Navathe p.715


ID
1226965
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Acerca dos conceitos de Datawarehouse, de Datamining e de mensageria, julgue os itens a seguir.

O modelo de mensageria publish/subscribe é adequado para comunicação síncrona entre o remetente e o receptor das mensagens.

Alternativas
Comentários
  •  publish/subscribe é um paradigma de comunicação que busca prover desacoplamento e flexibilidade necessários para aplicações distribuídas de larga escala.O paradigma se baseia em duas entidades principais : produtores e consumidores. Produtores (publishers) são aqueles que publicam os dados no sistema, enquanto consumidores (subscribers) definem um formato de assinatura, a fim de expressar quais dos dados sendo publicados são de seu interesse

  • publish/subscribe está mais para uma comunicação assíncrona do que uma comunicação síncrona.

  • Assíncrona +1

  • Comunicação assíncrona!


    ERRADA

  • Gabarito: Errado.

    A título de contribuição para quem quiser saber um pouco mais sobre esse padrão de comunicação: https://gabrielschade.github.io/2018/03/12/publish-subscribe.html

    Bons estudos!

  • publish/subscribe = Traduzido do inglês; publicar - assinar. Na arquitetura de software, publicar-assinar é um padrão de mensagens em que os remetentes não programam as mensagens a serem enviadas diretamente para receptores, categorizam as mensagens publicadas em classes sem conhecimento de quais assinantes, se houver.

    Enquanto a comunicação síncrona refere-se ao contato imediato entre o emissor (quem envia a mensagem) e o receptor (quem recebe a mensagem), a comunicação assíncrona é atemporal.

    fonte: wikipedia.

  • O mecanismo de publicação/assinatura (pub/sub) é central ao caso de uso de dados empresariais de acesso. Nesse mecanismo, aplicativos de publicação emitem dados a um tópico, enquanto os aplicativos de assinatura se registram em um ou mais tópicos para receber os dados do aplicativo de publicação. O mecanismo de pub/sub é responsável pela distribuição, garantindo que todos recebam os dados esperados. Ele também funciona como uma camada de abstração que permite que a disponibilidade dos aplicativos de publicação e assinatura seja diferente.


ID
1238029
Banca
FCC
Órgão
MPE-MA
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Uma das funções desempenhadas pelas técnicas de mineração de dados consiste em determinar que itens de um conjunto de dados ocorrem de forma simultânea. Essa função recebe a denominação de

Alternativas
Comentários
  • Seguem algumas técnicas de Mineração de Dados:

     

    • Redes Neurais – Essa técnica é tratada pelos processos de mineração de dados como uma caixa preta, pois essa técnica constrói representações internas de modelos achados nos dados, porém essas representações não são mostradas aos usuários, por isso que os analistas de negócios não usam essa técnica, pois não podem explicar os resultados finais. 
        • Indução de Regras – Nesta técnica vários algoritmos e índices são colocados para executar esse processo, onde a maioria deste processo é feito pela máquina e só uma parte insignificante é feita pelo usuário. Na indução de regras, essas regras são apresentadas aos usuários como uma lista chamada de “não encomendada”. 
        • Análises de Séries Temporais – É a fundação de todas as outras tecnologias, essa técnica  é envolvida fortemente com o usuário e exige engenheiros experientes para construir modelos que detalhem o comportamento do dado através de métodos matemáticos. 
        • Classificação – É uma das tarefas de conhecimento humano mais usada no auxílio à compreensão do ambiente onde vivemos e é uma das técnicas mais utilizadas. No data mining essa técnica é utilizada na classificação de clientes, como por exemplo, classificá-los quanto ao seu nível social. 
        • Estimativa – Esta técnica é utilizada para determinar um valor aproximado de um índice através de dados que foram passados ou de dados adquiridos de outros índices semelhantes, sobre os quais se tem conhecimento. 
        • Previsão – Esta técnica tem por objetivo a avaliação de um valor de um índice ainda não identificado, baseando-se em dados adquiridos através do comportamento deste índice. 
        • Análise de Afinidade – Como o nome já diz, essa técnica determina que fatos ocorrem simultaneamente com probabilidade razoável, ou então que itens de dados estão presentes juntos com uma certa chance. Um exemplo disso, como o autor cita é a de um carrinho de supermercado, através dele pode-se extrair informações para que a disposição dos produtos do supermercado agrade aos consumidores, colocando produtos próximos uns aos outros, produtos comprados em conjunto com outro. 
        • Análise de Agrupamentos – Nessa técnica os dados são agrupados conforme sua classificação e grupo em que pertencem e esses grupos são construídos com base na semelhança que há entre os elementos desse grupo. Um exemplo disso como cita o autor, “agrupar sintomas pode gerar classes que não representam nenhuma doença explicitamente, uma vez que doenças diferentes podem possuir os mesmos sintomas”.

     

    Fonte: https://sites.google.com/site/siufam/definicoes-1/datamining-1

     

    []'s

  • vi que muita gente achou que era a C, mas para ser previsão deveria estar escrito na questão que algo será descoberto a partir de algo já sabido.

    Afinidade da letra é para quando é óbvio a ocorrência de algo simultâneo, mas precisa-se do DM para ver o óbvio

  • Não se assuste com a nomenclatura diferente! Análise de afinidade é equivalente à análise de regras de associação, indicando a análise das coocorrências entre eventos. Essa tarefa é útil para extrair informações a respeito de eventos que ocorrem em conjunto. Um exemplo clássico é o caso dos clientes que compram fraldas e que também compram cerveja.

    Gabarito: A


ID
1306006
Banca
CESPE / CEBRASPE
Órgão
ANATEL
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de banco de dados, julgue os itens que se seguem.

No processo de Data Mining (mineração de dados), é indispensável o uso de técnica conhecida como Data Warehousing, uma vez que a mineração de dados deve ocorrer necessariamente em estruturas não normalizadas (FN0).

Alternativas
Comentários
  • Pode-se aplicar o processo de Mineração de Dados tanto estruturas normalizadas, quanto "desnormalizadas".

  • Nem sempre é indispensável o uso de Data Warehousing no processo de Data mining.

    Segue um artigo sobre o assunto (http://www.batebyte.pr.gov.br/modules/conteudo/conteudo.php?conteudo=527) onde é mencionado:

    "O palestrante chamou a atenção para alguns conceitos errados sobre o Data Mining. Na verdade as ferramentas de Data Mining não descobrem informações/conhecimento sem qualquer intervenção humana, não substituirá as ferramentas para OLAP e Data Mining não necessariamente precisa de um Data Warehouse. Ele apresentou também algumas conclusões interessantes. Para utilizar Data Mining são necessários diferentes conhecimentos: expert em banco de dados, expert em estatística/data mining e expert no domínio do negócio."

  • ERRADO.      Matei a questão com este trecho: '(...) é indispensável o uso de técnica conhecida como Data Warehousing(...)'


    Segundo Navathe(2011,p.698),"A mineração de dados PODE ser usada junto com um data warehouse para ajudar com certos tipos de decisões."


    **Portanto, o próprio Navathe usa o termo 'pode', o que traz uma ideia de possibilidade, e não uma obrigatoriedade. Logo, é dispensável o uso conjunto de ambas as tecnologias, DW e DM.


    Bibliografia:

    SISTEMAS DE BANCO DE DADOS-NAVATHE-6 EDIÇÃO 2011.

  • Se não precisa de um DW eu vou minerar os dados de onde? 


    Num BD normal?

  • [Fonte: Abrahan Silberschatz, Sistema de Banco de Dados]

    "Outros tipos de mineração de dados incluem agrupamento, exploração de texto e visualização de dados" Página 505


    "A exploração de texto se aplica a técnicas de mineração de dados ao documentos textuais. Por exemplo, existem ferramentas que formam clusters sobre páginas que um usuário visitou; isso ajuda os usuários quando eles navegam pelo histórico de sua navegação para encontrar páginas que visitaram anteriormente. A distância entre as páginas pode ser baseada, por exemplo, em palavras comuns nas páginas" Página 504


    "Os sistemas de visualização de dados ajudam os usuários a examinar grandes volumes de dados e detectar padrões visualmente. Apresentações visuais dos dados - como mapas, diagramas e outras representações gráficas - permitem que os dados sejam apresentados de forma compacta aos usuários. Uma única tela gráfica pode codificar tanta informação quanto um número muito maior de telas de texto" Página 504

  • No processo de Data Mining (mineração de dados), é indispensável o uso de técnica conhecida como Data Warehousing, uma vez que a mineração de dados deve ocorrer necessariamente em estruturas não normalizadas (FN0).

  • [Fonte: Abrahan Silberschatz, Sistema de Banco de Dados]

    "Outros tipos de mineração de dados incluem agrupamento, exploração de texto e visualização de dados" Página 505


    "A exploração de texto se aplica a técnicas de mineração de dados ao documentos textuais. Por exemplo, existem ferramentas que formam clusters sobre páginas que um usuário visitou; isso ajuda os usuários quando eles navegam pelo histórico de sua navegação para encontrar páginas que visitaram anteriormente. A distância entre as páginas pode ser baseada, por exemplo, em palavras comuns nas páginas" Página 504


    "Os sistemas de visualização de dados ajudam os usuários a examinar grandes volumes de dados e detectar padrões visualmente. Apresentações visuais dos dados - como mapas, diagramas e outras representações gráficas - permitem que os dados sejam apresentados de forma compacta aos usuários. Uma única tela gráfica pode codificar tanta informação quanto um número muito maior de telas de texto" Página 504


    Nem sempre é indispensável o uso de Data Warehousing no processo de Data mining

    Segue um artigo sobre o assunto (http://www.batebyte.pr.gov.br/modules/conteudo/conteudo.php?conteudo=527) onde é mencionado:


    "O palestrante chamou a atenção para alguns conceitos errados sobre o Data Mining. Na verdade as ferramentas de Data Mining não descobrem informações/conhecimento sem qualquer intervenção humana, não substituirá as ferramentas para OLAP e Data Mining não necessariamente precisa de um Data Warehouse .Ele apresentou também algumas conclusões interessantes. Para utilizar Data Mining são necessários diferentes conhecimentos: expert em banco de dados, expert em estatística/data mining e expert no domínio do negócio."

  • Questão para reforçar o entendimento:

     

    CESPE - STJ - 2018

    O processo de mineração de dados está intrinsecamente ligado às dimensões e a fato, tendo em vista que, para a obtenção de padrões úteis e relevantes, é necessário que esse processo seja executado dentro dos data warehouses.  ERRADO.

  • A mineração de dados pode ocorrer em vários tipos de repositórios, geralmente com um grande volume de dados. O DW ajuda a realizar as tarefas de mineração, pois geralmente já passou pelo processo de ETL e está organizado de forma a otimizar a realização de análises. Contudo, esse não é um requisito obrigatório para que se minere dados. A mineração pode ocorrer até mesmo em conjuntos de dados não estruturados!

  • Gabarito: Errado.

    Você pode matar a questão lembrando para um DW que seja utilizado o Floco de Neve os dados estarão normalizados e caso se utilize a Estrela, os dados estarão mais condensados porque não estão normalizados.

    Bons estudos!

  • Nunca que um negócio desses vais estar certo quando afirma: "uma vez que a mineração de dados deve ocorrer necessariamente em estruturas não normalizadas"

  • Nishimura neles!

  • Não é obrigatório o uso de Data Warehouse, normalmente utilizam a arquitetura cliente/servidor.

  • O data mining , tbm pode ocorrer em dados não estruturados .Questão errada.

  • ERRADO.

    O uso bem-sucedido das aplicações de data mining depende da construção de um data warehouse, mas isso não significa que ele seja indispensável.

  • ERRADO

    Não é necessário/obrigatório ter um data warehouse (sistema de gerenciamento de dados) para aplicar a Mineração de dados.

    • Não há essa necessidade obrigatória que a questão afirma.

  • DATA MINING (DM) NÃO DEPENDE DO DW, PORÉM ALIADO AO DW POSSUIRÁ MAIOR DESEMPENHO O DM PODE SER APLICADOS A BANDO DE DADOS CONVENCIONAIS.