Questão Q882068

A respeito das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.

Alternativas

O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam coocorrência.

A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.

As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.

Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).

Comentários

Regras de Associação: identificação de grupos de dados que apresentam co-ocorrência entre si (ex. cesta de compras).

Regressão ou Predição: aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

Agrupamento (ou clustering): identificação de grupos de dados onde os dados tem características semelhantes aos do mesmo grupo e onde os grupos tenham características diferentes entre si.

Classificação: aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente.

Métodos de classificação supervisionada:

-Baseados em separabilidade (entropia): árvores de decisão e variantes

-Baseados em particionamento: SVM (support vector machines).

http://homepages.dcc.ufmg.br/~pedro.lascasas/aula_2_minera%C3%A7%C3%A3o_de_dados_aplicada_weka.pdf
A-) REGRAS DE ASSOCIAÇÃO;

B-)REGRESSÃO / PREDIÇÃO;

C-)CLASSIFICAÇÃO;

D-)CLUSTERING
Essa é do capiroto.
ABCD flagrantemente erradas, estão cruzados entre si esses conceitos fazendo uma salada
não entendo a E, mas fui nessa
a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA
b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA
c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA
d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA
e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA
Sobre a letra E, no Wikipédia está bem elucidativo (não consegui colar porque há imagens):

Árvore de decisão -> https://pt.wikipedia.org/wiki/%C3%81rvore_de_decis%C3%A3o

Máquina de vetores de suporte -> https://pt.wikipedia.org/wiki/M%C3%A1quina_de_vetores_de_suporte
– Classificação: A técnica de classificação visa o estabelecimento de categorias pré definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando – sendo essa técnica possível de ser utilizada com outras técnicas.
É importante dizer que a classificação é considerada um exemplo de aprendizado supervisionado – isso significa que as classes são pré-definidas antes da análise dos resultados. Os métodos de classificação supervisionada podem ser embasados em métodos como separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (Support Vector Machines).
Art. 327***
Corrigi ai.
Qual o problema com a C? Por que não posso usar regressão logística pra classificar (rotular) clientes como os bancos fazem?
Gabarito '' e''

Complementando sobre Classificação:

Visa o estabelecimento de categorias pré-definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando. Utiliza o aprendizado supervisionado, isso significa que as classes são pré-definidas antes da análise dos resultados.
As árvores de decisão são BASICAMENTE uma representação gráfica das regras de classificação.
A) Conceito de REGRAS DE ASSOCIAÇÃO
realiza identificação de grupos de dados que apresentam coocorrência.
B) ANÁLISE DE REGRESSÃO
realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
C) Conceito de CLASSIFICAÇÃO
promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.
D) Conceito de CLUSTERIZAÇÃO/AGRUPAMENTO
identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.
E) GABARITOOOOOOOOOO Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).
a) Incorreto: O agrupamento (ou clustering)
As regras de associação realizam identificação de grupos de dados que apresentam coocorrência.
b) Incorreto: A classificação
regressão realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
c) Incorreto: A regressão ou predição
classificação promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes
discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.
d) Incorreto: As regras de associação
A clusterização identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo
e os grupos têm características diferentes entre si.
e) Correto: Os métodos de classificação supervisionada podem ser embasados
em separabilidade (entropia), utilizando árvores de decisão e variantes, e em
particionamento, utilizando SVM (support vector machines).
Gabarito: Letra E
A respeito das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.

A (❌) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam coocorrência.

O agrupamento separa os objetos em grupos com base nas características desses objetos. Permanecem no mesmo grupo objetos que possuem características similares.
Coocorrência significa a ocorrência simultânea de duas coisas. Não é um critério para formar grupos.

B (❌) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.

A classificação determina a qual classe pertence um exemplar com base em um conjunto de dados já classificado.

C (❌) A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.

O mapeamento de dados em uma classe é chamado de classificação.

A "regressão é usada estimar valores a partir de um conjunto de dados históricos". A regressão permite encontrar um modelo preditivo capaz de encontrar tendências.

D (❌) As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.

As regras de associação consistem na “identificação de grupos de dados que apresentam co-ocorrência entre si”. Elas permitem encontrar relacionamentos entre conjuntos de dados.
Segmentar uma população em grupos com caraterísticas semelhantes é papel do agrupamento.

E (✅) Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).

Os métodos de classificação supervisionada são:
• Baseados em separabilidade (entropia): árvores de decisão e variantes;
• Baseados em particionamento: SVM (support vector machines).

Gabarito letra E. ✅
Lasquei-me.
a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA
b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA
c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA
d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA
e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA
Arthur Mendonça | Direção Concursos
Arthur Mendonça | Direção Concursos

a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA

b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA

c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA

d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA

e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA
- Associação tem a ver com coocorrência. (Exemplo: cerveja e fralda.)
- Já o agrupamento tem a ver com a clusterização.
Típica questão que só é possível acertar na eliminação
Os métodos de classificação supervisionada podem ser embasados em métodos como
separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento,
utilizando SVM (Support Vector Machines).
- Estrategia Concursos (PDF aula 22, página 20 - PCDF)
- Associação tem a ver com coocorrência. (Exemplo: cerveja e fralda.)
- Já o agrupamento tem a ver com a clusterização
- Os métodos de classificação supervisionada são:
- Baseados em separabilidade (entropia): árvores de decisão e variantes;
- Baseados em particionamento: SVM (support vector machines).
essa é pesada
Cespe e cursinho inventando teoria agora. No livro AISL, Tibshirani e cia, temos que Árvore de decisão é baseada no particionamento do espaço formado pelos preditores enquanto SVM baseia-se na separabilidade das classes no espaço formado pelos preditores. Aí a CESPE me vem com essa? Querem saber mais que pesquisador que trabalhou com quem inventou o negocio.

SóProvas

Continue usando...

O que está incluso