SóProvas


ID
3106165
Banca
FCC
Órgão
SANASA Campinas
Ano
2019
Provas
Disciplina
Banco de Dados
Assuntos

Considere que a SANASA busca realizar a gestão de recursos hídricos subterrâneos com base em parâmetros conhecidos que determinam a poluição das águas subterrâneas. Um desses parâmetros, para exemplificar, seria o nitrato, um indicador de poluição difusa de água subterrânea. Criando-se regras para realizar o aprendizado supervisionado do sistema de Data Mining utilizando-se uma certa técnica, chegar-se-á a um resultado que considera os diversos parâmetros para se descobrir se um certo aquífero tem água potável ou não, comparando-se com uma definição conhecida.


Nesse cenário, a técnica aplicada é denominada

Alternativas
Comentários
  • Se verifica PARÂMETROS, mede a quantidade e faz uma COMPARAÇÃO, é uma B)CLASSIFICAÇÃO.

  • GAB-B

    Consegui chegar ao gabarito por conta dessa parte do texto "considera os diversos parâmetros",assim imaginei para que servem os parâmetros senão para classificar algo.

    Bons estudos!

  • Cuidado com a frase que se falou em parâmetros, é classificação. Na verdade, todas as técnicas citadas precisam de parâmetros, o que difere é o resultado ou o domínio de trabalho. Será que se vai fazer associação sem parâmetros, por exemplo?

  • Acredito que a resposta pode ser justificada por este trecho: "se um certo aquífero tem água potável ou não, comparando-se com uma definição conhecida.".

  • É possível entender a técnica na interpretação, onde deseja uma classificação das barragens que estão aptas a serem usadas ou não, com certo nível de poluição.

  • A questão descreve uma tarefa de mineração de dados que rotula cada aquífero em potável ou não potável. Observe que o enunciado menciona o aprendizado supervisionado, aquele em que é fornecido um conjunto de treinamento com dados já rotulados, além de uma “definição conhecida”, que se refere aos rótulos das classes predefinidos. Todas essas características dizem respeito à técnica de classificação.

  • CESPE

    No que se refere aos diversos tipos de algoritmos utilizados para minerar dados, a técnica utilizada em tarefas de classificação, regressão e segmentação de dados em tipos de dados heterogêneos é denominada

    A algoritmos genéticos.

    B redes neurais.

    C banco objeto relacional.

    D classes privadas.

    E redes privadas.

    ama essas questoes

    o bizu foi a palavra chave SUPERVISIONADO

  • Supervisionado = classificação

    Não-supervisionado = clusterização (agrupamento)

  • Classificação: A técnica de classificação visa o estabelecimento de categorias pré definidas antes da análise dos dados a partir de um conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando – sendo essa técnica possível de ser utilizada com outras técnicas.

    É importante dizer que a classificação é considerada um exemplo de aprendizado supervisionado – isso significa que as classes são pré-definidas antes da análise dos resultados. Os métodos de classificação supervisionada podem ser embasados em métodos como separabilidade ou entropia, utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (Support Vector Machines). 

    Análise de Agrupamentos (Clusters - clusterização): O agrupamento é uma técnica que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas. Como o nome sugere, o objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. A cada conjunto de dados resultante do processo, dá-se o nome de grupo, aglomerado, agrupamento ou cluster.

  • FALOU EM DADOS/REGISTROS PRE ESTABELECIDOS PODE MARCAR CLASSIFICACAO

  • Os grupos ja foram ditos: 1 grupo, tem água potável ; 2 grupo, não tem água potavél. Dentro dos parametros que serão entregues ( veja isso como dados rotulados - ou seja - já se espera ter um "formato" de resultado como saída ) os dados serão classificados no primeiro grupo ou no segundo grupo.

    Segue a mesma lógica que uma instituição financeira usa para liberar crédito para o cliente. Dentro do banco de dados, ja foram separados "os grupos"/ os usuários adimplentes e os usuários inadimplentes. Conforme os parametros de cada usuário, este será classificado como adimplente ou inadimplente. Veja que os dados são rotulados, uma vez que ja sei o tipo de resultado que vou ter, essa é uma caracteristica de aprendizado supervisionado !

    Grande abraço