Questão Q1035386

Considere que a SANASA busca realizar a gestão de recursos hídricos subterrâneos com base em parâmetros conhecidos que determinam a poluição das águas subterrâneas. Um desses parâmetros, para exemplificar, seria o nitrato, um indicador de poluição difusa de água subterrânea. Criando-se regras para realizar o aprendizado supervisionado do sistema de Data Mining utilizando-se uma certa técnica, chegar-se-á a um resultado que considera os diversos parâmetros para se descobrir se um certo aquífero tem água potável ou não, comparando-se com uma definição conhecida.

Nesse cenário, a técnica aplicada é denominada

Alternativas

Associação.

Classificação.

Clustering.

Regressão.

Prediction.

Comentários

Se verifica PARÂMETROS, mede a quantidade e faz uma COMPARAÇÃO, é uma B)CLASSIFICAÇÃO.
GAB-B
Consegui chegar ao gabarito por conta dessa parte do texto "considera os diversos parâmetros",assim imaginei para que servem os parâmetros senão para classificar algo.
Bons estudos!
Cuidado com a frase que se falou em parâmetros, é classificação. Na verdade, todas as técnicas citadas precisam de parâmetros, o que difere é o resultado ou o domínio de trabalho. Será que se vai fazer associação sem parâmetros, por exemplo?
Acredito que a resposta pode ser justificada por este trecho: "se um certo aquífero tem água potável ou não, comparando-se com uma definição conhecida.".
É possível entender a técnica na interpretação, onde deseja uma classificação das barragens que estão aptas a serem usadas ou não, com certo nível de poluição.
A questão descreve uma tarefa de mineração de dados que rotula cada aquífero em potável ou não potável. Observe que o enunciado menciona o aprendizado supervisionado, aquele em que é fornecido um conjunto de treinamento com dados já rotulados, além de uma “definição conhecida”, que se refere aos rótulos das classes predefinidos. Todas essas características dizem respeito à técnica de classificação.
CESPE
No que se refere aos diversos tipos de algoritmos utilizados para minerar dados, a técnica utilizada em tarefas de classificação, regressão e segmentação de dados em tipos de dados heterogêneos é denominada
A algoritmos genéticos.
B redes neurais.
C banco objeto relacional.
D classes privadas.
E redes privadas.

ama essas questoes

o bizu foi a palavra chave SUPERVISIONADO
Supervisionado = classificação
Não-supervisionado = clusterização (agrupamento)
– Classificação: A técnica de classificação visa o estabelecimento de categorias pré definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando – sendo essa técnica possível de ser utilizada com outras técnicas.
É importante dizer que a classificação é considerada um exemplo de aprendizado supervisionado – isso significa que as classes são pré-definidas antes da análise dos resultados. Os métodos de classificação supervisionada podem ser embasados em métodos como separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (Support Vector Machines).

Análise de Agrupamentos (Clusters - clusterização): O agrupamento é uma técnica que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas. Como o nome sugere, o objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. A cada conjunto de dados resultante do processo, dá-se o nome de grupo, aglomerado, agrupamento ou cluster.
FALOU EM DADOS/REGISTROS PRE ESTABELECIDOS PODE MARCAR CLASSIFICACAO
Os grupos ja foram ditos: 1 grupo, tem água potável ; 2 grupo, não tem água potavél. Dentro dos parametros que serão entregues ( veja isso como dados rotulados - ou seja - já se espera ter um "formato" de resultado como saída ) os dados serão classificados no primeiro grupo ou no segundo grupo.

Segue a mesma lógica que uma instituição financeira usa para liberar crédito para o cliente. Dentro do banco de dados, ja foram separados "os grupos"/ os usuários adimplentes e os usuários inadimplentes. Conforme os parametros de cada usuário, este será classificado como adimplente ou inadimplente. Veja que os dados são rotulados, uma vez que ja sei o tipo de resultado que vou ter, essa é uma caracteristica de aprendizado supervisionado !

Grande abraço

SóProvas

Continue usando...

O que está incluso