SóProvas



Questões de Componentes principais


ID
221503
Banca
FCC
Órgão
TRT - 4ª REGIÃO (RS)
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:

I. Na análise de componentes principais a obtenção das componentes principais envolve a decomposição da matriz de covariâncias do vetor aleatório de interesse.

II. Na análise discriminante não é necessário que os grupos nos quais cada elemento amostral pode ser classificado sejam conhecidos à priori.

III. O escalonamento dimensional gera uma medida de ajuste denominada Stress que quanto mais próxima de 1 estiver melhor será o ajuste.

IV. Na análise de agrupamentos, para que se possa proceder ao agrupamento de elementos, é necessário se decidir à priori a medida de similaridade ou dissimilaridade que será usada.

Dentre essas afirmações citadas são verdadeiras SOMENTE

Alternativas
Comentários

ID
229330
Banca
FCC
Órgão
TJ-AP
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:

I. Na análise de correspondência usa-se como medida de similaridade a distância Euclidiana média.
II. O objetivo principal da análise de componentes principais é o de explicar a estrutura de variância e covariância de um vetor aleatório, composto por n variáveis aleatórias, através da construção de combinações lineares das variáveis originais.
III. O escalonamento dimensional é uma técnica matemática apropriada para representar graficamente n elementos num espaço de dimensão menor que o original, tendo-se em consideração a distância ou similaridade que os elementos têm entre si.
IV. Na análise de agrupamentos, uma medida de similaridade que pode ser utilizada é a distância Euclidiana.

Dentre essas afirmações citadas são verdadeiras SOMENTE

Alternativas

ID
318466
Banca
CESPE / CEBRASPE
Órgão
FUB
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Julgue os itens subsecutivos, referentes ao método de componentes
principais.

A técnica de componentes principais pode ser utilizada para se diagnosticar multicolinearidade em problemas de regressão linear.

Alternativas
Comentários
  • componentes principais é utilizada para se agrupar certas características

    avalia se essas características estão de certa forma relacionadas

    a multicolinearidade pode ocorrer devido ao fato de uma variavel estar relacionada com a outra, uma ser combinacao linear da outra

    multi = varias

    colinearidade = variaveis dependentes linearmente

     

  • Súmula nº 13

  • O que é multicolinearidade? A multicolinearidade ocorre quando o modelo inclui vários fatores correlacionados, não apenas à sua variável de resposta, mas também relacionando uns aos outros, ou seja, irá ocorrer quando houver fatores que são redundantes.

    Dessa maneira, se tivermos duas variáveis no modelo que são muito correlacionadas entre si (quando uma aumenta a outra também aumenta, quando uma diminui a outra também diminui), é útil que se reduza o número de variáveis para não trabalharmos com muitas variáveis desnecessárias. Assim, podemos concluir que de fato a técnica de componentes principais pode ser utilizada para se diagnosticar multicolinearidade.

    Resposta: C


ID
339676
Banca
COSEAC
Órgão
DATAPREV
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Oobjetivo principal da Análise de Componentes Principais é:

Alternativas

ID
670861
Banca
CONSULPLAN
Órgão
TSE
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Sobre análise multivariada, analise.

I. Os componentes principais amostrais são combinações lineares das variáveis mensuradas que maximizam a variação total da amostra e que são mutuamente ortogonais.

II. O algoritmo das k-médias é um tipo de agrupamento não hierárquico que particiona n objetos em k grupos.

III. O método de correlação canônica analisa combinações não lineares das variáveis em dois grupos para determinar as combinações que possuem a maior correlação.

Assinale

Alternativas

ID
698386
Banca
FCC
Órgão
TRE-SP
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações:

I. Na análise de componentes principais a informação contida em um vetor aleatório
p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional
(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.

II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.

III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.

Dentre as afirmações acima são verdadeiras APENAS

Alternativas
Comentários
  • Substituindo-se correlacionadas por não correlacionadas no item I, o mesmo torna-se correto.  

  • o item III está correto: nenhuma variável é classificada como dependente ou independente

    as observações são agrupadas em dendogramas, ou seja, não há que se falar em dependência ou independência:

    http://www.inf.ufsc.br/~patrec/agrupamentos.html



ID
770080
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Julgue os seguintes itens, acerca de análise multivariada de dados.

Considere a aplicação da técnica das componentes principais com o objetivo de reduzir a dimensão de um conjunto de dados constituído de p variáveis. Considere, ainda, supondo que os autovalores da matriz das correlações entre essas variáveis sejam tais que λ2 = λ3 = ... = λp = 1 - ρ em que ρ representa uma medida de correlação.

Nessa situação, considerando-se p =10, é correto afirmar que ρ < 0,75.

Alternativas
Comentários
  • E

    http://unievangelica.edu.br/gc/imagens/file/mestrados/artigos/RTINF_003092.pdf



ID
831496
Banca
CESPE / CEBRASPE
Órgão
TJ-RO
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Uma análise de componentes principais considerou 20 variáveis. Com base na matriz de covariância entre essas variáveis, observou- se que os cinco maiores autovalores foram iguais a 6, 4, 3, 2 e 1. Considerando esses resultados, assinale a opção correspondente ao percentual de variação explicada por esses cinco maiores autovalores.

Alternativas
Comentários
  • A princípio existem 20 variáveis.

    Como cada autovalor representa um percentual de variação explicada, em relação a todas as 20 variáveis, temos que:

    Maiores autovalores:
    Autovalor1 = 6   {este autovalor representa 6/20=30% da variação total}
    Autovalor2 = 4   {este autovalor representa 4/20=20% da variação total}
    Autovalor 3 = 3   {este autovalor representa 3/20=15% da variação total}
    Autovalor 4 = 2   {este autovalor representa 2/20=10% da variação total}
    Autovalor 5 = 1   {este autovalor representa 1/20=5% da variação total}

    Logo, a variação total explicada por eles é (30+20+15+10+5)% = 80%



    http://br.portalprofes.com/juliozibetti
  • Temos 20 variáveis e, portanto, temos que:

              Total das variações = 20

              Autovalores: 6 + 4 + 3 + 2 + 1 = 16 (corresponde às 5 maiores componentes principais). Logo, as cinco maiores componentes principais têm autovalores que juntos somam 16.

    Dessa maneira, para calcular o percentual de variação que esses 16 correspondem aos 20, basta fazer o seguinte cálculo:

    Portanto, o percentual de variação explicada por esses cinco maiores autovalores corresponde a 80%.

    Resposta: A


ID
852607
Banca
CESPE / CEBRASPE
Órgão
SEDUC-AM
Ano
2011
Provas
Disciplina
Estatística
Assuntos

    Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.

A partir dessa situação, julgue o item.

A análise de componentes principais é uma técnica da análise multivariada que permite formar um ranking dessas escolas com base nesses dados.

Alternativas
Comentários
  • Estatística, parte da disciplina de que trata sobre análise de componentes principais em Análise Multivariada.

    Correta, a assertiva.

    Bons estudos.

  • Não que para cada escola temos 5 variáveis (a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno). Dessa maneira, podemos realizar uma análise de componentes principais para reduzir a quantidade de variáveis com o objetivo de obter uma componente principal que irá explicar a maior parte das variações entre as escolas. 

    Veja que ao se obter apenas uma variável, ou seja, apenas uma componente principal, poderemos utilizar essa variável única para ordenar as escolas em um ranking. 

    Dessa forma, uma maneira de criar o ranking de fato é aplicar a análise de componentes principais, obter a principal componente (que explica a maior parte das variações entre as escolas) e a partir dela ordenar as escolas. Portanto, a alternativa encontra-se correta. 

    Resposta: C


ID
941911
Banca
CESPE / CEBRASPE
Órgão
INPI
Ano
2013
Provas
Disciplina
Estatística
Assuntos

      Em um banco de dados, foram armazenadas informações relativas a diversas pesquisas realizadas por pesquisadores de institutos renomados. Entre as variáveis constantes desse banco destacam-se: nome, gênero e titulação do pesquisador; valor financiado da pesquisa; instituto ao qual o pesquisador pertence; número de componentes da equipe; e número de artigos publicados pelo pesquisador.
Com base nessas informações, julgue os itens a seguir.

Se, na análise de componentes principais, fossem utilizadas 5 variáveis quantitativas, então, a técnica geraria, no máximo, 3 componentes, se essas correspondessem a, pelo menos, 95% da variância explicada.

Alternativas
Comentários
  • ERRADA: A quantidade de componentes é sempre igual ao número de variáveis.
  • O número de componentes é sempre menor ou igual ao número de variáveis quantitativas

    Geralmente, o número de componentes é menor

  • Lembre-se que caso haja três variáveis originais, será possível gerar três componentes principais, caso haja cinco variáveis originais, será possível gerar cinco componentes principais, e assim sucessivamente, ou seja, o número de variáveis originais será sempre igual ao número máximo de componentes principais. 

    Sendo assim, note que a alternativa está errada, pois o correto seria: “Se, na análise de componentes principais, fossem utilizadas 5 variáveis quantitativas, então, a técnica geraria, no máximo, 5 componentes”.

    Resposta: E


ID
1194355
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Julgue o  item  a seguir, relativo à análise multivariada.

No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.

Alternativas
Comentários
  • Afirmativa errada, até porque existem várias formas de se estabelecer os k elementos que formarão as sementes iniciais. Sendo assim, o resultado final pode ser bastante diferente do resultado inicial.

  • Existem várias formas de estabelecer os centroides iniciais, se o número de dimensões crescer e essa escolha dos centroides iniciais for aleatória o algoritmo tende a ter a probabilidade que a questão cita como sendo 0, devido a lei dos grandes números.

    Outro fato interessante desse algoritmo é que se k, o número de centroides for muito grande, o algoritmo pode entrar em overfitting. Na biblioteca Scikit learn o algoritmo k means por padrão treina 10 vezes, sendo a primeira com centroides aleatórios, depois dos dez treinamentos, escolhendo o melhor conjunto de centroides com base em minimizar a inércia, ele executa realmente o algoritmo. Pode se mudar esse número 10 padrão via código no scikitlearn

  • Note que quando a questão se refere ao método de agrupamento por k-médias ela está se referindo ao método não hierárquico. Lembre-se que o método não hierárquico primeiramente escolhe uma partição inicial, logo depois realiza o deslocamento de um objeto de um grupo para outros grupos e, por fim, verifica o valor do critério que está sendo utilizado, decidindo assim pela configuração que apresentar uma melhoria.

    Logo, perceba que a questão se encontra errada, pois existem diversas formas de estabelecer os k elementos que formarão os clusters iniciais e, portanto, o resultado final pode ser diferente do resultado inicial.

    Resposta: E


ID
1234588
Banca
FCC
Órgão
TRT - 19ª Região (AL)
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:

I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.

Está correto o que consta APENAS em

Alternativas
Comentários
  • Vamos à análise detida de cada um dos itens:

    CORRETO: II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana. 
    é o caso em que p = 2 em: 
    http://en.wikipedia.org/wiki/Minkowski_distance
    O correto seria:
    I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável DEPENDENTE e UMA OU várias variáveis INDEPENDENTES. 
    III. Na análise discriminante a variável dependente é CATEGÓRICA e a independente é MÉTRICA.
    IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a MAXIMIZAÇÃO da correlação entre os conjuntos de variáveis respostas. 
    observe que a banca tenta "ludibriar" o candidato invertendo os conceitos, trocando palavras, etc



ID
1331899
Banca
Quadrix
Órgão
DATAPREV
Ano
2012
Provas
Disciplina
Estatística
Assuntos

A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:

I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.

II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.

III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.

IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.

VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.

Dentre as seis afirmações dadas, quantas são falsas?

Alternativas

ID
1371904
Banca
FCC
Órgão
TRT - 13ª Região (PB)
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Sobre análise multivariada, considere:

I. Na análise fatorial nenhuma variável é definida como dependente ou independente.

II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.

III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.

IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.

Está correto o que consta APENAS em

Alternativas
Comentários
  • https://www.tecconcursos.com.br/conteudo/questoes/216322?materia=estatistica&banca=fcc

  • I. Correto. A análise fatorial é uma técnica de interdependência, pois todas as variáveis são consideradas simultaneamente. Sendo assim, não há variáveis dependentes ou independentes.

    II. Correto. Variância homogênea dentro e heterogênea entre os agrupamentos.

    III. Incorreto. Na correlação canônica queremos maximizar a correlação entre esses dois conjuntos.

    IV. Correto.


ID
2454646
Banca
INSTITUTO AOCP
Órgão
EBSERH
Ano
2015
Provas
Disciplina
Estatística
Assuntos

São técnicas, da Análise Multivariada, que estudam a estrutura de covariância de um vetor aleatório:

Alternativas

ID
3480868
Banca
INSTITUTO AOCP
Órgão
ADAF - AM
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:


Componente     Autovalor     Percentagem da variância     Percentagem Acumulada

         1                 5,813                       69,095                                     69,095

         2                 2,350                       27,933                                     97,028

         3                 0,25                           2,971                                   100,000


Variável     Autovetor 1     Autovetor 2     Autovetor 3

    X1              -0,39                 0,0                 0,89

    X2               0,95                 0,0                 0,40

    X3               0,00                 1,0                 0,0

Considerando o exposto, assinale a alternativa que apresenta a primeira componente principal.

Alternativas
Comentários

ID
3480871
Banca
INSTITUTO AOCP
Órgão
ADAF - AM
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Considerando as informações contidas na questão anterior n° 56, referente à análise de componentes principais, qual é a matriz de covariâncias do vetor de componentes principais?

Alternativas