-
Regras de Associação: identificação de grupos de dados que apresentam co-ocorrência entre si (ex. cesta de compras).
Regressão ou Predição: aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
Agrupamento (ou clustering): identificação de grupos de dados onde os dados tem características semelhantes aos do mesmo grupo e onde os grupos tenham características diferentes entre si.
Classificação: aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente.
Métodos de classificação supervisionada:
-Baseados em separabilidade (entropia): árvores de decisão e variantes
-Baseados em particionamento: SVM (support vector machines).
http://homepages.dcc.ufmg.br/~pedro.lascasas/aula_2_minera%C3%A7%C3%A3o_de_dados_aplicada_weka.pdf
-
A-) REGRAS DE ASSOCIAÇÃO;
B-)REGRESSÃO / PREDIÇÃO;
C-)CLASSIFICAÇÃO;
D-)CLUSTERING
-
Essa é do capiroto.
-
ABCD flagrantemente erradas, estão cruzados entre si esses conceitos fazendo uma salada
não entendo a E, mas fui nessa
-
a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA
b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA
c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA
d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA
e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA
-
Sobre a letra E, no Wikipédia está bem elucidativo (não consegui colar porque há imagens):
Árvore de decisão -> https://pt.wikipedia.org/wiki/%C3%81rvore_de_decis%C3%A3o
Máquina de vetores de suporte -> https://pt.wikipedia.org/wiki/M%C3%A1quina_de_vetores_de_suporte
-
– Classificação: A técnica de classificação visa o estabelecimento de categorias pré definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando – sendo essa técnica possível de ser utilizada com outras técnicas.
É importante dizer que a classificação é considerada um exemplo de aprendizado supervisionado – isso significa que as classes são pré-definidas antes da análise dos resultados. Os métodos de classificação supervisionada podem ser embasados em métodos como separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (Support Vector Machines).
-
Art. 327***
Corrigi ai.
-
Qual o problema com a C? Por que não posso usar regressão logística pra classificar (rotular) clientes como os bancos fazem?
-
Gabarito '' e''
Complementando sobre Classificação:
Visa o estabelecimento de categorias pré-definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando. Utiliza o aprendizado supervisionado, isso significa que as classes são pré-definidas antes da análise dos resultados.
-
As árvores de decisão são BASICAMENTE uma representação gráfica das regras de classificação.
-
A) Conceito de REGRAS DE ASSOCIAÇÃO
realiza identificação de grupos de dados que apresentam coocorrência.
B) ANÁLISE DE REGRESSÃO
realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
C) Conceito de CLASSIFICAÇÃO
promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.
D) Conceito de CLUSTERIZAÇÃO/AGRUPAMENTO
identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.
E) GABARITOOOOOOOOOO Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).
-
a) Incorreto: O agrupamento (ou clustering)
As regras de associação realizam identificação de grupos de dados que apresentam coocorrência.
b) Incorreto: A classificação
regressão realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
c) Incorreto: A regressão ou predição
classificação promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes
discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.
d) Incorreto: As regras de associação
A clusterização identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo
e os grupos têm características diferentes entre si.
e) Correto: Os métodos de classificação supervisionada podem ser embasados
em separabilidade (entropia), utilizando árvores de decisão e variantes, e em
particionamento, utilizando SVM (support vector machines).
Gabarito: Letra E
-
A respeito das técnicas e(ou) métodos de mineração de dados, assinale a opção correta.
A (❌) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam coocorrência.
O agrupamento separa os objetos em grupos com base nas características desses objetos. Permanecem no mesmo grupo objetos que possuem características similares.
Coocorrência significa a ocorrência simultânea de duas coisas. Não é um critério para formar grupos.
B (❌) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
A classificação determina a qual classe pertence um exemplar com base em um conjunto de dados já classificado.
C (❌) A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.
O mapeamento de dados em uma classe é chamado de classificação.
A "regressão é usada estimar valores a partir de um conjunto de dados históricos". A regressão permite encontrar um modelo preditivo capaz de encontrar tendências.
D (❌) As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.
As regras de associação consistem na “identificação de grupos de dados que apresentam co-ocorrência entre si”. Elas permitem encontrar relacionamentos entre conjuntos de dados.
Segmentar uma população em grupos com caraterísticas semelhantes é papel do agrupamento.
E (✅) Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).
Os métodos de classificação supervisionada são:
• Baseados em separabilidade (entropia): árvores de decisão e variantes;
• Baseados em particionamento: SVM (support vector machines).
Gabarito letra E. ✅
-
Lasquei-me.
-
a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA
b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA
c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA
d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA
e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA
Arthur Mendonça | Direção Concursos
-
Arthur Mendonça | Direção Concursos
a) A coocorrência é a ocorrência simultânea de dois eventos. Na verdade, a técnica que vimos que está mais associada a esse conceito se refere às regras de associação. ERRADA
b) Não ficou muito claro para mim o que o examinador quis dizer com “valores reais”. Contudo, podemos perceber que a predição utiliza uma função para mapear os conjuntos de dados que se já tem em um valor dito real, que é o valor a ser previsto. Veja que a definição exposta no item seguinte descreve melhor o processo de classificação do que a presente alternativa, nos levando a crer que o examinador somente inverteu as duas respostas. ERRADA
c) Na verdade é a classificação que mapeia os dados em classes predefinidas. A predição realmente possibilita encontrar tendências, mas com o objetivo de realizar previsões a respeito de comportamentos futuros ainda desconhecidos. O entendimento e a exploração dos dados são funções de técnicas descritivas, como a própria classificação. ERRADA
d) Na verdade a assertiva descreveu a clusterização, também conhecida como agrupamento. ERRADA
e) Como citamos durante a aula, os métodos de classificação podem sim seguir essa divisão entre os que se baseiam em separabilidade ou entropia e aqueles que se baseiam em particionamento. É essa a nossa resposta. CERTA
-
- Associação tem a ver com coocorrência. (Exemplo: cerveja e fralda.)
- Já o agrupamento tem a ver com a clusterização.
-
Típica questão que só é possível acertar na eliminação
-
Os métodos de classificação supervisionada podem ser embasados em métodos como
separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento,
utilizando SVM (Support Vector Machines).
- Estrategia Concursos (PDF aula 22, página 20 - PCDF)
-
- Associação tem a ver com coocorrência. (Exemplo: cerveja e fralda.)
- Já o agrupamento tem a ver com a clusterização
-
- Os métodos de classificação supervisionada são:
- Baseados em separabilidade (entropia): árvores de decisão e variantes;
- Baseados em particionamento: SVM (support vector machines).
-
essa é pesada
-
Cespe e cursinho inventando teoria agora. No livro AISL, Tibshirani e cia, temos que Árvore de decisão é baseada no particionamento do espaço formado pelos preditores enquanto SVM baseia-se na separabilidade das classes no espaço formado pelos preditores. Aí a CESPE me vem com essa? Querem saber mais que pesquisador que trabalhou com quem inventou o negocio.