SóProvas


ID
1732792
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o item seguinte, referente a data mining.

Selecionar uma amostra e determinar os conjuntos de itens frequentes dessa amostra para formar a lista de previsão de subconjunto são as principais características do algoritmo de previsão.


Alternativas
Comentários
  • ·         Tipos de informção obtida pelo Data Mining

    [...]

    Prognóstico: Embora todas essas aplicações envolvam previsões, os prognósticos as utilizam de modo diferente. Partem de uma série de valores existentes para prever quais serão os outros valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar o valor futuro de variáveis com números de vendas

    https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados#Vis.C3.A3o_geral

  • a descrição da questão está relacionado ao Algoritmo por Amostragem.

  • Essa abordagem de conjunto de itens frequentes é do algoritmo Apriori
  • E

     

    Prognóstico: previsão de futuro a partir de valores existentes

  • O Top 10 Algoritmos em Data Mining

     

    Árvores de Decisão Visam organizar dados sobre escolhas concorrentes em ramos de influência após uma decisão inicial . O tronco da árvore representa a decisão inicial, e começa com um sim ou não pergunta, como se deve ou não tomar café da manhã . Comer o pequeno almoço e não comer o pequeno almoço seriam os dois primeiros ramos divergentes da árvore, e cada escolha , posteriormente, teria seus próprios ramos divergentes que conduz a um ponto final. 


    O algoritmo K-Means É baseado na análise de cluster. Destina-se a quebrar os dados coletados em "clusters" distintos agrupados por características como . 

    Support Vector Machines Levar os dados de entrada e prever qual das duas categorias possíveis, que incluem os dados de entrada . Um exemplo seria reunir os códigos postais de um grupo de eleitores e tentar prever se um eleitor dar é um democrata ou republicano. 


    O algoritmo Apriori Normalmente acompanha os dados da transação . Por exemplo, em uma loja de roupas , o algoritmo pode controlar quais camisas clientes normalmente compra em conjunto.

     

    O algoritmo EM Define parâmetros por meio da análise de dados e prevê a probabilidade de um resultado futuro evento ou aleatória dentro dos parâmetros de dados . Por exemplo, o algoritmo EM poderia tentar prever o tempo da próxima erupção de um gêiser com base nos dados de tempo de erupções passadas. 


    PageRank Algoritmo Base para os motores de busca . Ele classifica e avalia a relevância de uma única peça de dados dentro de um conjunto maior de dados, como um único site dentro do maior conjunto de todos os sites na Internet. 


    AdaBoost Algoritmo Funciona dentro de outros algoritmos de aprendizagem que antecipam o comportamento com base em dados observados para torná-los mais sensíveis a outliers estatísticos. Embora o algoritmo EM pode ser distorcida por um gêiser ter duas erupções em menos de um minuto, quando ele normalmente entra em erupção uma vez por dia , o algoritmo AdaBoost iria ajustar a saída do algoritmo EM , analisando a relevância do outlier.

     

    K -Nearest Neighbor Algorithm Reconhece padrões de localização de dados e associados que os dados com um identificador maior. Por exemplo, se você quiser atribuir uma estação de correios a localização geográfica de cada casa e teve o conjunto de dados de localização geográfica de cada casa , o algoritmo k-vizinhos mais próximo seria atribuir as casas para os correios mais próxima com base em sua proximidade um do outro.

     

    Naive Baye Prevê um resultado de identidade baseado em dados de observações conhecidas . Por exemplo, se uma pessoa é g pés seis polegadas de altura e veste tamanho 14 sapatos , o algoritmo Naive Bayes poderia prever com uma certa probabilidade de que a pessoa é um homem.

     

    CART Algoritmo É um algoritmo não paramétrico. Possui grande capacidade de pesquisas de relações entre os dados, prevendo o tratamento de variáveis dependentes discretas (classificação) ou variáveis contínuas (regressão).

     

     

     

     

  • Preditiva: este tipo de análise é o mais indicado para quem precisa prever algum tipo de comportamento ou resultado. Esta técnica busca analisar dados relevantes ao longo do tempo, buscando padrões comportamentais e suas variações de acordo com cada contexto, a fim de prever como será o comportamento de seu público ou mercado no futuro, dadas as condições atuais. Muito útil para avaliar tendências de consumo e flutuações econômicas. 

    Prescritiva: segue um modelo similar à anterior, porém com objetivos ligeiramente diferentes; ao invés de tentar prever um determinado acontecimento, esta análise busca trazer informações de consequências deste acontecimento. Para efeitos de comparação, enquanto o modelo anterior focaria em tendências de consumo do seu público – por exemplo – a análise prescritiva busca trazer um panorama dos tipos de produto que serão mais desejados ou o impacto que essas tendências terão no montante de vendas. Modelo muito útil, especialmente se casado com o anterior, mas não tanto utilizado, muitas vezes por falta de conhecimento sobre ele.  -> A QUESTÃO SE REFERE A ESSE TIPO DE ANALISE

    Descritiva: ao invés de focar no futuro, esta análise busca trazer uma fotografia do presente, para que decisões de cunho imediato possam ser tomadas com segurança, o que faz deste modelo muito útil para análise de crédito, por exemplo. A análise descritiva trabalha com histórico de dados, cruzando informações com o objetivo de gerar um panorama claro e preciso dos temas relevantes para a empresa no presente momento. 

    Diagnóstica: neste modelo o foco está na relação de causas e consequências percebidas ao longo do tempo, dentro de um determinado tema. Assim, a análise diagnóstica funciona baseada na coleta de dados relacionados a um determinado assunto, cruzando informações com o objetivo de entender quais fatores influenciaram o resultado atual. Bastante utilizado em vendas, este modelo funciona bem em conjunto com análises preditivas, servindo de base para as projeções futuras. Análises diagnósticas também são úteis para entender quais fatores devem ser ajustados em determinadas ações, a fim de obter os resultados desejados.

     

     

    OBS: por favor, se eu estiver enganada me mande a resposta correta.

  • Associação utilizando a técnica Algoritmo por Amostragem, que sugere uma lista descritiva, não há previsão.

  • GABARITO: ERRADO

    A questão descreve os algoritmos de amostragem utilizados nas regras de associação e não os algoritmos de previsão. Segundo Navathe, a ideia principal para o algoritmo de amostragem é selecionar uma amostra pequena e determinar os conjuntos de dados (itemsets) frequentes com base na amostra.

  • Gabarito: Errado.

    Na verdade, trata-se do Algoritmo Apriori. O que permite concluir isso é a seguinte parte do enunciado: " (...) determinar os conjuntos de itens frequentes (...)."

    Este algoritmo trabalha por meio de uma busca aprofundada nos dados gerando conjuntos de padrões, onde os mais frequentes são mantidos e os menos são eliminados.

    De acordo com Navathe (2011):

    O Algoritmo Apriori para encontrar itemsets frequentes (grandes).

    Entrada: banco de dados de m transações, D, e um suporte mínimo, mins, representado como uma fração de m.

    Saída: itemsets frequentes, L1, L2, ..., Lk.

    Bons estudos!

  • Conforme destaca Soares (2019), a assertiva apresenta o algoritmo de amostragem utilizado

    nas regras de associação. Navathe cita que a ideia principal do algoritmo de amostragem é

    selecionar uma amostra pequena e determinar os conjuntos de dados frequentes com base

    na amostra.

  • Vamos analisar os principais pontos do comando da questão:

    "Selecionar uma amostra e determinar os conjuntos de itens frequentes dessa amostra para formar a lista de previsão de subconjunto são as principais características do algoritmo de previsão."

    É possível identificar como termos chaves: frequência e previsão.

    Agora vamos raciocinar!

    Classificação: constitui uma técnica preditiva (termo chave 1 localizado); supervisionada;

    Regras de associação: são as que analisam a frequência / buscam de padrões sequenciais (termo chave 2 localizado); não supervisionada.

    Então, temos aqui DUAS técnicas DISTINTAS (classificação e associação), uma para cada termo chave.

    Até aqui ok?

    PORÉM, perceba que a questão afirma que essas são as características do algoritmo de previsão, OU SEJA, estão reduzindo todo este conceito ao conceito - ÚNICO - de classificação, o que seria incorreto afirmar (pois vimos que são duas técnicas distintas, e não apenas uma).

    Por esse motivo, gabarito ERRADO.

    Vale lembrar que ao passo que a classificação é preditiva (buscar realizar previsões), o agrupamento é descritivo (busca nesse caso, entender os dados - o que eles dizem - e não necessariamente realizar previsões com eles).

    Siga firme.

  • Li, li e até agora não encontrei o x da questão, obrigado aos envolvidos

  • Vamos comparar o conceito de previsão com o algoritmo de amostragem para entender a diferença entre eles:

    Previsão: Esta técnica tem por objetivo a avaliação de um valor de uma variável ainda não identificada, baseando-se em dados adquiridos por meio do comportamento desta variável ao longo do tempo.

    Amostragem: A ideia principal do algoritmo de amostragem é selecionar uma pequena amostra, que caiba na memória principal do banco de dados de transações, e determinar os conjuntos de itens frequentes daquela amostra.

    Veja que a alternativa 1 mistura os dois conceitos, logo, temos uma alternativa errada.

    Fonte: Prof. Thiago Cavalcanti - Estratégia Concursos

    [TEC CONCURSOS]

  • ~>Toda vida que se quer prever algo (a partir de determinado conjunto de dados), usam-se as técnicas de predição. Quais sejam: classificação e regressão.

    ~>Toda vida que se quer encontrar padrões entre variáveis (qual a chance de se comprar leite e café em uma compra só), usam-se técnicas prescritivas, cujos objetivos são descrever os grupos, entendê-los. Quais sejam: Clusterização (ou agrupamento) e associação.

  • A questão descreve os algoritmos de amostragem utilizados nas regras

    de associação e não os algoritmos de previsão. Segundo Navathe, a ideia

    principal para o algoritmo de amostragem é selecionar uma amostra pequena

    e determinar os conjuntos de dados (itemsets) frequentes com base na

    amostra.

    Gabarito: Errado.

  • Errado

    O item descreve o processo de seleção

    Seleção: selecionar um conjunto de dados ou se concentrar em um subconjunto de variáveis ou amostras de dados.

    Fonte: Apostila 22, pag. 11, estratégia concursos

  • Gab: ERRADO

    Professor Ramon Souza:

    A questão descreve os algoritmos de amostragem utilizados nas regras de associação e não os algoritmos de previsão.

    Segundo Navathe, a ideia principal para o algoritmo de amostragem é selecionar uma amostra pequena e determinar os conjuntos de dados (itemsets) frequentes com base na amostra.

  • Gab: Errado

    Essa é a principal característica de um algoritmo de amostragem e, não, de previsão – o algoritmo de amostragem busca selecionar uma amostra pequena e determinar os conjuntos de itens frequentes com base nessa amostra a fim de prever regras de associação.

    Algoritmos de previsão ou predição buscam avaliar o valor de uma variável ainda não identificada, baseando-se em dados adquiridos por meio do comportamento desta variável no passado.

    Fonte: Estratégia Concursos.

  • As principais características, a meu ver são: entrada de dados, separação de grupos para formar a lista de previsão de subconjunto (treino e teste) e saída com a predição