SóProvas


ID
2646211
Banca
CESPE / CEBRASPE
Órgão
TCM-BA
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

A respeito das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.

Alternativas
Comentários
  • Regras de Associação: identificação de grupos de dados que apresentam co-ocorrência entre si (ex. cesta de compras).

     

    Regressão ou Predição: aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

     

    Agrupamento (ou  clustering): identificação de grupos de dados onde os dados tem características semelhantes aos do mesmo grupo e onde os grupos tenham características diferentes entre si.

     

    Classificação: aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente.

     

    Métodos de classificação supervisionada

    -Baseados em separabilidade (entropia): árvores de decisão e variantes

    -Baseados em particionamento: SVM (support vector machines).

     

    http://homepages.dcc.ufmg.br/~pedro.lascasas/aula_2_minera%C3%A7%C3%A3o_de_dados_aplicada_weka.pdf

  • A-) REGRAS DE ASSOCIAÇÃO;

     

    B-)REGRESSÃO / PREDIÇÃO;

     

    C-)CLASSIFICAÇÃO;

     

    D-)CLUSTERING

  • Essa é do capiroto.

  • ABCD flagrantemente erradas, estão cruzados entre si esses conceitos fazendo uma salada

    não entendo a E, mas fui nessa

  • a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA

    b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas.  ERRADA

    c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA

    d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA

    e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA

  • Sobre a letra E, no Wikipédia está bem elucidativo (não consegui colar porque há imagens):

    Árvore de decisão -> https://pt.wikipedia.org/wiki/%C3%81rvore_de_decis%C3%A3o

    Máquina de vetores de suporte -> https://pt.wikipedia.org/wiki/M%C3%A1quina_de_vetores_de_suporte

  • Classificação: A técnica de classificação visa o estabelecimento de categorias pré definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando – sendo essa técnica possível de ser utilizada com outras técnicas.

    É importante dizer que a classificação é considerada um exemplo de aprendizado supervisionado – isso significa que as classes são pré-definidas antes da análise dos resultados. Os métodos de classificação supervisionada podem ser embasados em métodos como separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (Support Vector Machines). 

  • Art. 327***

    Corrigi ai.

  • Qual o problema com a C? Por que não posso usar regressão logística pra classificar (rotular) clientes como os bancos fazem?

  • Gabarito '' e''

    Complementando sobre Classificação:

    Visa o estabelecimento de categorias pré-definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando. Utiliza o aprendizado supervisionado, isso significa que as classes são pré-definidas antes da análise dos resultados.

  • As árvores de decisão são BASICAMENTE uma representação gráfica das regras de classificação.

  • A) Conceito de REGRAS DE ASSOCIAÇÃO

    realiza identificação de grupos de dados que apresentam coocorrência.

    B) ANÁLISE DE REGRESSÃO

    realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

    C) Conceito de CLASSIFICAÇÃO

    promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.

    D) Conceito de CLUSTERIZAÇÃO/AGRUPAMENTO

    identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.

    E) GABARITOOOOOOOOOO Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).

  • a) Incorreto: O agrupamento (ou clustering)

    As regras de associação realizam identificação de grupos de dados que apresentam coocorrência.

    b) Incorreto: A classificação

    regressão realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

    c) Incorreto: A regressão ou predição

    classificação promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes

    discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.

    d) Incorreto: As regras de associação

    A clusterização identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo

    e os grupos têm características diferentes entre si.

    e) Correto: Os métodos de classificação supervisionada podem ser embasados

    em separabilidade (entropia), utilizando árvores de decisão e variantes, e em

    particionamento, utilizando SVM (support vector machines).

    Gabarito: Letra E

  • A respeito das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.

    A (❌) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam coocorrência.

    O agrupamento separa os objetos em grupos com base nas características desses objetos. Permanecem no mesmo grupo objetos que possuem características similares.

    Coocorrência significa a ocorrência simultânea de duas coisas. Não é um critério para formar grupos.

    B (❌) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

    A classificação determina a qual classe pertence um exemplar com base em um conjunto de dados já classificado.

    C (❌) A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.

    O mapeamento de dados em uma classe é chamado de classificação.

    A "regressão é usada estimar valores a partir de um conjunto de dados históricos". A regressão permite encontrar um modelo preditivo capaz de encontrar tendências.

    D (❌) As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.

    As regras de associação consistem na “identificação de grupos de dados que apresentam co-ocorrência entre si”. Elas permitem encontrar relacionamentos entre conjuntos de dados.

    Segmentar uma população em grupos com caraterísticas semelhantes é papel do agrupamento.

    E (✅) Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).

    Os métodos de classificação supervisionada são:

    • Baseados em separabilidade (entropia): árvores de decisão e variantes;

    • Baseados em particionamento: SVM (support vector machines).

    Gabarito letra E. ✅

  • Lasquei-me.

  • a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA

    b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA

    c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA

    d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA

    e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA

    Arthur Mendonça | Direção Concursos

  • Arthur Mendonça | Direção Concursos

    a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA

    b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA

    c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA

    d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA

    e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA

    • Associação tem a ver com coocorrência. (Exemplo: cerveja e fralda.)
    • Já o agrupamento tem a ver com a clusterização.
  • Típica questão que só é possível acertar na eliminação

  • Os métodos de classificação supervisionada podem ser embasados em métodos como

    separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento,

    utilizando SVM (Support Vector Machines).

    • Estrategia Concursos (PDF aula 22, página 20 - PCDF)
    • Associação tem a ver com coocorrência. (Exemplo: cerveja e fralda.)
    • Já o agrupamento tem a ver com a clusterização
    • Os métodos de classificação supervisionada são:
    • Baseados em separabilidade (entropia): árvores de decisão e variantes;
    • Baseados em particionamento: SVM (support vector machines).

  • essa é pesada

  • Cespe e cursinho inventando teoria agora. No livro AISL, Tibshirani e cia, temos que Árvore de decisão é baseada no particionamento do espaço formado pelos preditores enquanto SVM baseia-se na separabilidade das classes no espaço formado pelos preditores. Aí a CESPE me vem com essa? Querem saber mais que pesquisador que trabalhou com quem inventou o negocio.