SóProvas


ID
4863973
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o seguinte item, a respeito de big data.


Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers, que são objetos completamente diferentes do padrão da amostra.

Alternativas
Comentários
  • Certo. Outliers são dados que não apresentam comportamento padrão.

  • Essa definição da banca deve ser anotada, pois também serve para disciplina de estatística. Perfeito!

  • Os outliers são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva normal . Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá) causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise.

    Entender os outliers é fundamental em uma análise de dados por pelo menos dois aspectos:

    Os outliers presentes em datasets possuem diversos outros nomes, como:

    1 - dados discrepantes;

    2 - pontos fora da curva;

    3 - observações fora do comum;

    4 - anomalias;

    5 - valores atípicos;

    entre outros.

    FONTE: https://www.aquare.la/o-que-sao-outliers-e-como-trata-los-em-uma-analise-de-dados/

  • Clusterização é o agrupamento automático de instâncias similares, uma classificação não-supervisionada dos dados. Ou seja, um algoritmo que clusteriza dados classifica eles em conjuntos de dados que ‘se assemelham’ de alguma forma - independentemente de classes predefinidas. Os grupos gerados por essa classificação são chamados clusters.

    Uma forma de clusterização seria, por exemplo, a partir de dados de animais em um zoológico aproximar animais por suas características. Ou seja, a partir dos dados como ‘quantidade de pernas’, ‘quantidade de dentes’, ‘põe ovo’, ‘tem pêlos’ e vários outros, procuramos animais que estão mais próximos. Poderíamos assim clusterizar os dados, separar animais em mamíferos, aves ou répteis mas sem “contar” ao algoritmo sobre estas classificações. Apenas comparando a distância entre dados o algoritmo mostraria que um tigre está “mais próximo” de um leão do que de uma garça.

    FONTE: https://lamfo-unb.github.io/2017/10/05/Introducao_basica_a_clusterizacao/

  • Estatística salvando!

  • CERTO.

    Outliers são valores atípicos, fora do padrão.

  • outliers= anomalias

  • CORRETO

    Assim como a classificação, o agrupamento( clusters) pode ser usado para detectar anomalias( outliers).

    Detecção de Anomalias: originário da mineração de dados é também conhecida como detecção de outliers é a identificação de itens, eventos ou observações raras que levantam suspeitas por serem significativamente diferentes da maioria dos dados.

  • Certo. Cuidado para não confundir: não é porque a a clusterização não é supervisionada que não pode haver mecanismos auxiliares.

  • CERTO

    Clusterização: técnica de agrupar elementos a partir de características que possuem em comum.

    Outliers: são valores discrepantes, que fogem da normalidade.

  • GAB: Certo

    Agrupamento ou "clustering" é uma técnica de aprendizado não-supervisionado que objetiva agrupar/separar os elementos com base nas suas semelhanças, ou seja, nas características que possuem em comum.

    Essa técnica também permite que sejam identificados os outliers que são elementos que se diferenciam drasticamente do restante da amostra. Isso quer dizer que eles são bem discrepantes do padrão observado.

  • Obrigado, estatística.

    gabarito: CERTO

  • Agora eu descobri o motivo de ter estatística no edital rsrsrs.

    3T

  • GAB: C

    TRADUZINDO

    CLUSTERIZACAO OU AGRUPAMENTO:

    • NAO SUPERVISIONADO
    • OS GRUPOS SAO FORMADOS POR SUAS SIMILARIDADES
    • OS REGISTROS NAO SAO PRE-ESTABELECIDOS
    • OBJETIVA IDENTIFICAR PADROES DRASTICAMENTE DIFERENTES DOS PADROES ENCONTRADOS (OUTLIERS - FORAS DA LINHA)
  • Clusterização é a tarefa de dividir a população ou os pontos de dados em vários grupos, de modo que os pontos de dados nos mesmos grupos sejam mais semelhantes a outros pontos de dados no mesmo grupo do que os de outros grupos.

    (Agrupamento) (Clustering)

    técnica não supervisionada de aprendizado

    agrupa ou separa os elementos com base na semelhança.

    a técnica também permite que sejam identificados os outliers

    o que é otliers ? são os elementos que são diferentes.

    NYCHOLAS LUIZ

  • leva isso para a prova na cabeça sobre mineração e tabom demais

    AGREGAÇÃO = AGRUPAMENTO = CLUSTERING

    Características:

    -- Aprendizado NÃO-supervisionado

    -- Realiza a identificação de dados similares e os agrupa

    -- NÃO há pré-definição de grupos

    -- NÃO realiza classificação e NÃO estima valores

     

    Técnica de agrupamento (clustering)

    permite a descoberta de dados por faixa de

    valores,

     

    ·        explorar grandes quantidades

    de dados

    ·        procura de padrões

    consistentes

    ·        regras de associação ou

    sequências temporais

    ·        detectando assim novos

    subconjuntos

    ·        processo de descoberta automática de

    informações úteis

    ·        destaca-se

    o reconhecimento de padrões por meio de

    comparação e análise dos dados

  • Vem PRF !!!

  • Box-Plott 

  • Misericórdia! informática com estatística!

  • Outliers = Exceções.

    • Se os dados são avaliados em conjunto, é normal que existam exceções. Logo, a Aprendizagem de Máquina é capaz de ajudar a identificar tais exceções (dados incongruentes e que fogem do padrão).

    Gab: Certo.

  • Agora eu lancei a do CHAVES !

    SATANÁS, É VOCÊ SATANÁS ?

  • As melhores matérias do mundo, informática e estatística ! Só que não. Kkkkk

  • As técnicas de aprendizado de máquina costumam ser empregadas nas tarefas de mineração de dados, com o objetivo de permitir que o sistema consiga aprender os modelos de mineração e melhorar seu desempenho ao longo do tempo. 

    A identificação de outliers (anomalias) consiste em encontrar valores discrepantes no conjunto de dados, diferentes daqueles identificados no padrão da amostra. Para identificar os outliers, uma abordagem possível envolve a utilização de técnicas análogas à clusterização não supervisionada. Item correto.

  • Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers, que são objetos completamente diferentes do padrão da amostra.

    CERTO

    • Aprendizagem de máquina ajuda no desenvolvimento de processos por meio da melhoria contínua;
    • Clausterização é um agrupamento que leva em conta as caracteríticas semelhantes;
    • Outliers são os famosos "Pontos fora da cruva", exceções, pouquíssimos pontos fora do padrão.

    "A disciplina é a maior tutora que o sonhador pode ter, pois ela transforma o sonho em realidade."

  • Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers. Certo, machine learning pode ajudar em diversas áreas, como por exemplo em (agrupamento) para identificar outliers.

    Mas porque identificar esse tal outlier ai ? Outlier é aquele dado fora da curva, como por exemplo uma variação muito grande comparado ao um conjunto padrão, a analise de outlier pode ser eficaz para determinar o motivo de tamanha variação.

  • outlies significa: fora da curva. logo são objetos fora do padrão da amostra. gab . certo

  • igual cego em tiroteio!!!

  • Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers (Exceções), que são objetos completamente diferentes do padrão da amostra. CERTO

    Clusterização é a tarefa de dividir a população ou os pontos de dados em vários grupos, de modo que os pontos de dados nos mesmos grupos sejam mais semelhantes a outros pontos de dados dentro do mesmo grupo do que os de outros grupos

  • Inglês ajuda

  • Márcio Flávio me ajudando em informática

  • partiu fronteira

  • Clusterização: É uma técnica utilizada para agrupar elementos a partir de características que possuem em comum.

    Outliers: são valores discrepantes, que fogem da normalidade, são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva normal.

    Logo, a aprendizagem pode sim ajudar no processo de agrupamento de desses dados, unindo os semelhantes e diferenciando os fora da curva.

  • Quem disse que estatística descritiva não serve pra nda...? Ajudou em Info. hahhahhahahah

  • comentário de professor em vídeo: https://www.youtube.com/watch?v=fuG4iwknCYE

    7:16

  • A ESTATÍSTICA VIVE. OBRIGADO, JHONI EL ZINI

  • E a estatística me salvando mais uma vez em TI \o/

  • Achei "Completamente diferentes" forçado

  • CERTO

    -> O objetivo do Agrupamento/ Clusterização é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude na sua análise. Vale lembrar que um agrupamento é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos.

    A classificação é um exemplo de APRENDIZADO SUPERVISIONADO # Agrupamento/ Clusterização que é NÃO SUPERVISIONADO!

    -> Quando os dados fogem da normalidade e do padrão esperado eles são considerados anomalias. A forma de detectar anomalias é por meio de técnicas de análise de outlier (usando por ex. gráficos como box-plot).

    Cespe 2020: Outlier ou anomalias são padrões nos dados que não estão de acordo com uma noção bem definida de comportamento normal. CERTO

    NÃO DESISTAM!! VAI DAR CERTO!

  • Outliers podem ser identificados com o auxílio de aprendizado de máquina.

    Gabarito correto. ✅

  • se tivesse uma maneira de filtrar essas propagandas seria uma benção do q concurso ... minha opinião só atrapalha ..

  • Agora pode-se observar BANCO DE DADOS sempre relacionado com ESTATÍSTICA.

    Outliers são pontos fora da "curva".

    exemplo: Vamos fazer a média da altura de algumas pessoas

    João: 1,80 metros

    Joaquim: 1,80 metros

    Fábio: 1,80 metros

    Pedro: 1,80 metros

    Sebastião: 1,80 metros

    Lucas: 1,10 metros (outliers)

    Repare que a média seria mais ou menos 1,80 metros, mas Lucas é muito baixo e está fora da "curva". Caso Lucas entre no cálculo da média, ele irá puxar a média muito pra baixo.

  • Quando você acha que informática não pode ficar pior, ela começa a se fundir com a estatística...

  • CORRETO

    Os outliers são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva normal (). Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá) causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise.

    Entender os outliers é fundamental em uma análise de dados por pelo menos dois aspectos:

    1. os outliers podem viesar negativamente todo o resultado de uma análise;
    2. o comportamento dos outliers pode ser justamente o que está sendo procurado.

    Os outliers presentes em datasets () possuem diversos outros nomes, como:

    • dados discrepantes;
    • pontos fora da curva;
    • observações fora do comum;
    • anomalias;
    • valores atípicos;
    • entre outros.

  • completamente?

  • Gabarito: certo

    Anomalias artificiais podem partir de erros de amostragem, erros de processamento de dados, erros na entrada de dados, erros de medida ou erros intencionais. Bem, uma forma de detectar anomalias é por meio de técnicas de Análise de Outlier, usando – por exemplo – gráficos como Box-plot ou Scatter-plot.

     (CESPE / CEBRASPE - 2020) Outlier ou anomalias são padrões nos dados que não estão de acordo com uma noção bem definida de comportamento normal. (CERTO)

  • Objetos completamente diferentes é extremamente forçado.

    Até onde eu sei o objeto é o mesmo mas ele tem valores muitos diferentes da média.

    Um homem que tem 2,10 de altura é um outlier mas ele continua sendo um homem, ou não?!

  • data mining misturado com big data, estistica e box plot, ai sim!