SóProvas



Questões de Análise Multivariada


ID
173062
Banca
FCC
Órgão
MPU
Ano
2007
Provas
Disciplina
Estatística
Assuntos

A análise fatorial tem como objetivo principal descrever a variabilidade original de um vetor aleatório X com m componentes

Alternativas

ID
177739
Banca
FCC
Órgão
TRT - 9ª REGIÃO (PR)
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Quanto a (algumas) técnicas de Análise Multivariada, é INCORRETO afirmar:

Alternativas

ID
221503
Banca
FCC
Órgão
TRT - 4ª REGIÃO (RS)
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:

I. Na análise de componentes principais a obtenção das componentes principais envolve a decomposição da matriz de covariâncias do vetor aleatório de interesse.

II. Na análise discriminante não é necessário que os grupos nos quais cada elemento amostral pode ser classificado sejam conhecidos à priori.

III. O escalonamento dimensional gera uma medida de ajuste denominada Stress que quanto mais próxima de 1 estiver melhor será o ajuste.

IV. Na análise de agrupamentos, para que se possa proceder ao agrupamento de elementos, é necessário se decidir à priori a medida de similaridade ou dissimilaridade que será usada.

Dentre essas afirmações citadas são verdadeiras SOMENTE

Alternativas
Comentários

ID
229330
Banca
FCC
Órgão
TJ-AP
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:

I. Na análise de correspondência usa-se como medida de similaridade a distância Euclidiana média.
II. O objetivo principal da análise de componentes principais é o de explicar a estrutura de variância e covariância de um vetor aleatório, composto por n variáveis aleatórias, através da construção de combinações lineares das variáveis originais.
III. O escalonamento dimensional é uma técnica matemática apropriada para representar graficamente n elementos num espaço de dimensão menor que o original, tendo-se em consideração a distância ou similaridade que os elementos têm entre si.
IV. Na análise de agrupamentos, uma medida de similaridade que pode ser utilizada é a distância Euclidiana.

Dentre essas afirmações citadas são verdadeiras SOMENTE

Alternativas

ID
269638
Banca
CESPE / CEBRASPE
Órgão
TRE-ES
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Julgue os itens subsecutivos, acerca de análise multivariada e distribuições conjuntas.

Para dados não correlacionados, a distância de Mahalanobis é proporcional à distância euclidiana.

Alternativas
Comentários

ID
314323
Banca
FCC
Órgão
TRT - 1ª REGIÃO (RJ)
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Relativamente à Análise Multivariada de Dados, considere as afirmativas abaixo.

I. A análise fatorial é um exemplo de técnica de interdependência, o que significa que nenhuma variável ou grupo de variáveis é definida como sendo dependente ou independente.

II. A análise de correlação canônica não é adequada se as variáveis independentes são quantitativas.

III. A análise discriminante múltipla é adequada se a única variável dependente for categórica.

IV. A análise de correspondência não é adequada para teste de hipóteses.

Está correto o que se afirma APENAS em

Alternativas
Comentários

ID
318466
Banca
CESPE / CEBRASPE
Órgão
FUB
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Julgue os itens subsecutivos, referentes ao método de componentes
principais.

A técnica de componentes principais pode ser utilizada para se diagnosticar multicolinearidade em problemas de regressão linear.

Alternativas
Comentários
  • componentes principais é utilizada para se agrupar certas características

    avalia se essas características estão de certa forma relacionadas

    a multicolinearidade pode ocorrer devido ao fato de uma variavel estar relacionada com a outra, uma ser combinacao linear da outra

    multi = varias

    colinearidade = variaveis dependentes linearmente

     

  • Súmula nº 13

  • O que é multicolinearidade? A multicolinearidade ocorre quando o modelo inclui vários fatores correlacionados, não apenas à sua variável de resposta, mas também relacionando uns aos outros, ou seja, irá ocorrer quando houver fatores que são redundantes.

    Dessa maneira, se tivermos duas variáveis no modelo que são muito correlacionadas entre si (quando uma aumenta a outra também aumenta, quando uma diminui a outra também diminui), é útil que se reduza o número de variáveis para não trabalharmos com muitas variáveis desnecessárias. Assim, podemos concluir que de fato a técnica de componentes principais pode ser utilizada para se diagnosticar multicolinearidade.

    Resposta: C


ID
339676
Banca
COSEAC
Órgão
DATAPREV
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Oobjetivo principal da Análise de Componentes Principais é:

Alternativas

ID
347644
Banca
FCC
Órgão
TRT - 8ª Região (PA e AP)
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Considere as afirmativas abaixo.
I. Uma técnica não hierárquica da análise de agrupamentos é o método das K-médias.

II. O modelo de análise fatorial procura descrever a variabilidade de um vetor aleatório p-dimensional X, em termos de um vetor aleatório m-dimensional (m<p), linearmente relacionado com X.


III. O objetivo principal da análise de componentes principais é o de explicar a estrutura de variância e covariância de um vetor aleatório através da construção de combinações lineares das variáveis originais.

IV. Na aplicação da análise discriminante é necessário que os grupos para os quais cada elemento amostral pode ser classificado sejam pré-definidos.

Está correto o que se afirma em

Alternativas

ID
554872
Banca
FCC
Órgão
INFRAERO
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Relativamente à Análise Multivariada de Dados, considere:
I. Na análise discriminante, uma suposição para a determinação da função discriminante é a de normalidade multivariada das variáveis independentes.

II. A análise de correspondência não é sensível a observações atípicas, como outliers.

III. A escalagem multidimensional se baseia em distâncias euclidianas em projeção plana entre variáveis.

É correto o que consta APENAS em

Alternativas
Comentários
  • Análise discriminante, vide página 2 de:

    http://www.ufrrj.br/institutos/it/deng/varella/Downloads/multivariada%20aplicada%20as%20ciencias%20agrarias/Aulas/ANALISE%20DISCRIMINANTE.pdf

  • com relação ao item II, em estatística multivariada, é importante se atentar para a presença de outliers, independentemente da técnica que esteja se utilizando, vide página 20 de: http://www.pucrs.br/famat/viali/especializa/realizadas/ceea/multivariada/textos/Introducao.pdf

  • no que diz respeito ao item III: 

    https://www.google.com.br/webhp?sourceid=chrome-instant&rlz=1C1EODB_enBR570BR570&ion=1&espv=2&ie=UTF-8#q=escalonamento+multidimensional
  • Francisco, muito obrigado!


ID
670861
Banca
CONSULPLAN
Órgão
TSE
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Sobre análise multivariada, analise.

I. Os componentes principais amostrais são combinações lineares das variáveis mensuradas que maximizam a variação total da amostra e que são mutuamente ortogonais.

II. O algoritmo das k-médias é um tipo de agrupamento não hierárquico que particiona n objetos em k grupos.

III. O método de correlação canônica analisa combinações não lineares das variáveis em dois grupos para determinar as combinações que possuem a maior correlação.

Assinale

Alternativas

ID
698386
Banca
FCC
Órgão
TRE-SP
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações:

I. Na análise de componentes principais a informação contida em um vetor aleatório
p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional
(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.

II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.

III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.

Dentre as afirmações acima são verdadeiras APENAS

Alternativas
Comentários
  • Substituindo-se correlacionadas por não correlacionadas no item I, o mesmo torna-se correto.  

  • o item III está correto: nenhuma variável é classificada como dependente ou independente

    as observações são agrupadas em dendogramas, ou seja, não há que se falar em dependência ou independência:

    http://www.inf.ufsc.br/~patrec/agrupamentos.html



ID
730912
Banca
FCC
Órgão
TRF - 2ª REGIÃO
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Considere as afirmações abaixo, relativas às técnicas de Análise Multivariada:

I. Na análise de correlação canônica, a ideia básica é resumir a informação de cada conjunto de variáveis resposta em combinações lineares, sendo que a escolha dos coeficientes dessas combinações deve ter como critério a minimização da correlação entre os conjuntos de variáveis resposta.

II. A análise de correspondência é adequada quando se quer examinar a relação entre variáveis categóricas nominais ou entre categorias dessas variáveis.

III. A análise de regressão múltipla é exemplo de uma técnica de interdependência.

É correto o que consta APENAS em

Alternativas
Comentários
  • •Técnica de Dependência

    –É aquela na qual uma variável ou um conjunto de variáveis é identificado como variável dependente a ser predita ou explicada por outras variáveis independentes; (regressão múltipla por exemplo)

    •Técnica de Interdependência

    –É aquela na qual nenhuma das variáveis é definida como dependente ou independente, mas o procedimento envolve a análise simultânea de todas as variáveis no conjunto.


    I. Na análise de correlação canônica, a ideia básica é resumir a informação de cada conjunto de variáveis resposta em combinações lineares, sendo que a escolha dos coeficientes dessas combinações deve ter como critério a MAXIMIZACAO da correlação entre os conjuntos de variáveis resposta. 

    http://www.ufv.br/saeg/saeg45.htm




ID
770080
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Julgue os seguintes itens, acerca de análise multivariada de dados.

Considere a aplicação da técnica das componentes principais com o objetivo de reduzir a dimensão de um conjunto de dados constituído de p variáveis. Considere, ainda, supondo que os autovalores da matriz das correlações entre essas variáveis sejam tais que λ2 = λ3 = ... = λp = 1 - ρ em que ρ representa uma medida de correlação.

Nessa situação, considerando-se p =10, é correto afirmar que ρ < 0,75.

Alternativas
Comentários
  • E

    http://unievangelica.edu.br/gc/imagens/file/mestrados/artigos/RTINF_003092.pdf



ID
797827
Banca
CESPE / CEBRASPE
Órgão
AL-CE
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Com relação à análise discriminante e à rotação varimax, julgue o item.

Muito utilizada em análise fatorial, a rotação varimax é ortogonal, ou seja, os fatores rotacionados não são correlacionados.

Alternativas
Comentários
  • CORRETO

    Método Varimáx é um método de rotação ortogonal (suas variáveis são independentes) que se faz em torno da origem, o efeito final é rotacionar a matriz de pesos (matriz V) e redistribuir a variância, da primeiras componentes principais para as últimas com o obejtivo de obter novos fatores com um padrão mais simples e teoricamente mais significativo. Essa transformação acentua os pesos mais altos e amortiza os menores, a lógica é que a interpretação se torna mais fácil quando as correlações PC-variável sao próximas de mais ou menos um, indicando uma clara associação positiva ou negativa entre a variável e a PC, ou quando as correlações são próximas de zro, apontando uma ausência de associação.

  • O método Varimax de rotação ortogonal é bastante utilizado entre os métodos ortogonais, ele procura minimizar o número de variáveis que apresentam altas cargas em cada fator. Nesse método, os fatores são mantidos independentes (ortogonais) durante o processo de rotação. 

    Portanto, de fato é correto afirmar que a rotação varimax é ortogonal, ou seja, que os fatores rotacionados não são correlacionados. 

    Resposta: C


ID
797830
Banca
CESPE / CEBRASPE
Órgão
AL-CE
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Com relação à análise discriminante e à rotação varimax, julgue o item.

A análise discriminante constitui técnica multivariada que permite classificar os objetos que formam um conjunto de dados e, com base nela, é possível segmentar um conjunto de objetos em k grupos homogêneos sem se dispor de uma informação a priori acerca da alocação desses objetos nesses grupos.

Alternativas
Comentários
  • Os grupos são definidos a priori pelos métodos de agrupamento e ordenação.

     

    Gabarito E.

  • A análise discriminante não é uma técnica utilizada em estudos não supervisionados (quando não há informações a priori), mas sim em estudos supervisionados.


ID
809260
Banca
FAURGS
Órgão
TJ-RS
Ano
2012
Provas
Disciplina
Estatística
Assuntos

A análise fatorial é uma técnica multivariada que busca identificar um número pequeno de fatores capazes de representar relações entre um conjunto de variáveis inter-relacionadas. Com base na teoria de análise fatorial, assinale a alternativa que apresenta a afirmação correta.

Alternativas

ID
831496
Banca
CESPE / CEBRASPE
Órgão
TJ-RO
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Uma análise de componentes principais considerou 20 variáveis. Com base na matriz de covariância entre essas variáveis, observou- se que os cinco maiores autovalores foram iguais a 6, 4, 3, 2 e 1. Considerando esses resultados, assinale a opção correspondente ao percentual de variação explicada por esses cinco maiores autovalores.

Alternativas
Comentários
  • A princípio existem 20 variáveis.

    Como cada autovalor representa um percentual de variação explicada, em relação a todas as 20 variáveis, temos que:

    Maiores autovalores:
    Autovalor1 = 6   {este autovalor representa 6/20=30% da variação total}
    Autovalor2 = 4   {este autovalor representa 4/20=20% da variação total}
    Autovalor 3 = 3   {este autovalor representa 3/20=15% da variação total}
    Autovalor 4 = 2   {este autovalor representa 2/20=10% da variação total}
    Autovalor 5 = 1   {este autovalor representa 1/20=5% da variação total}

    Logo, a variação total explicada por eles é (30+20+15+10+5)% = 80%



    http://br.portalprofes.com/juliozibetti
  • Temos 20 variáveis e, portanto, temos que:

              Total das variações = 20

              Autovalores: 6 + 4 + 3 + 2 + 1 = 16 (corresponde às 5 maiores componentes principais). Logo, as cinco maiores componentes principais têm autovalores que juntos somam 16.

    Dessa maneira, para calcular o percentual de variação que esses 16 correspondem aos 20, basta fazer o seguinte cálculo:

    Portanto, o percentual de variação explicada por esses cinco maiores autovalores corresponde a 80%.

    Resposta: A


ID
852607
Banca
CESPE / CEBRASPE
Órgão
SEDUC-AM
Ano
2011
Provas
Disciplina
Estatística
Assuntos

    Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.

A partir dessa situação, julgue o item.

A análise de componentes principais é uma técnica da análise multivariada que permite formar um ranking dessas escolas com base nesses dados.

Alternativas
Comentários
  • Estatística, parte da disciplina de que trata sobre análise de componentes principais em Análise Multivariada.

    Correta, a assertiva.

    Bons estudos.

  • Não que para cada escola temos 5 variáveis (a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno). Dessa maneira, podemos realizar uma análise de componentes principais para reduzir a quantidade de variáveis com o objetivo de obter uma componente principal que irá explicar a maior parte das variações entre as escolas. 

    Veja que ao se obter apenas uma variável, ou seja, apenas uma componente principal, poderemos utilizar essa variável única para ordenar as escolas em um ranking. 

    Dessa forma, uma maneira de criar o ranking de fato é aplicar a análise de componentes principais, obter a principal componente (que explica a maior parte das variações entre as escolas) e a partir dela ordenar as escolas. Portanto, a alternativa encontra-se correta. 

    Resposta: C


ID
852613
Banca
CESPE / CEBRASPE
Órgão
SEDUC-AM
Ano
2011
Provas
Disciplina
Estatística
Assuntos

    Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.

A partir dessa situação, julgue o item.

A análise discriminante é técnica multivariada equivalente a um modelo de regressão linear múltiplo.

Alternativas
Comentários
  • A regressão linear é para relação entre uma resposta (variável dependente) e uma ou mais variáveis explicativas (variáveis independentes) O caso de uma variável explicativa é chamado de regressão linear simples.


ID
936136
Banca
FCC
Órgão
ANS
Ano
2007
Provas
Disciplina
Estatística
Assuntos

Com relação à análise multivariada de dados, é correto afirmar que a regressão múltipla é uma técnica estatística que

Alternativas
Comentários
  • Resposta B, auxiliando aos nao assinantes...
  • Tanto a regressão linear quanto a múltipla têm variáveis dependentes quantitativas, e as independentes (explicativas) também.
  • b-

    Modelo de Regressão Linear Múltipla é qualquer modelo de regressão que possui mais variáveis explicativas, isto é, para uma única variável dependenteha 2 ou + variáveis independentes. A finalidade de mais variáveis independentes é melhorar a predição.


ID
941911
Banca
CESPE / CEBRASPE
Órgão
INPI
Ano
2013
Provas
Disciplina
Estatística
Assuntos

      Em um banco de dados, foram armazenadas informações relativas a diversas pesquisas realizadas por pesquisadores de institutos renomados. Entre as variáveis constantes desse banco destacam-se: nome, gênero e titulação do pesquisador; valor financiado da pesquisa; instituto ao qual o pesquisador pertence; número de componentes da equipe; e número de artigos publicados pelo pesquisador.
Com base nessas informações, julgue os itens a seguir.

Se, na análise de componentes principais, fossem utilizadas 5 variáveis quantitativas, então, a técnica geraria, no máximo, 3 componentes, se essas correspondessem a, pelo menos, 95% da variância explicada.

Alternativas
Comentários
  • ERRADA: A quantidade de componentes é sempre igual ao número de variáveis.
  • O número de componentes é sempre menor ou igual ao número de variáveis quantitativas

    Geralmente, o número de componentes é menor

  • Lembre-se que caso haja três variáveis originais, será possível gerar três componentes principais, caso haja cinco variáveis originais, será possível gerar cinco componentes principais, e assim sucessivamente, ou seja, o número de variáveis originais será sempre igual ao número máximo de componentes principais. 

    Sendo assim, note que a alternativa está errada, pois o correto seria: “Se, na análise de componentes principais, fossem utilizadas 5 variáveis quantitativas, então, a técnica geraria, no máximo, 5 componentes”.

    Resposta: E


ID
1141924
Banca
FUMARC
Órgão
PC-MG
Ano
2013
Provas
Disciplina
Estatística
Assuntos

São métodos de rotação ortogonal dos fatores de uma análise fatorial, EXCETO:

Alternativas
Comentários
  • São métodos de rotação ortogonal: VARIMAX, QUARTIMAX e EQUIMAX. Veja que o método PROMAX é um método de rotação oblíqua (e não ortogonal). Portanto, a alternativa correta corresponde à letra A. 

    Resposta: A


ID
1185196
Banca
FCC
Órgão
TRT - 16ª REGIÃO (MA)
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Considere as afirmações abaixo relativas à Análise Multivariada.

I. A análise de correspondência permite estudar associação entre variáveis qualitativas.
II. Na análise discriminante a variável dependente deve ser métrica.
III. Na análise de regressão múltipla uma forma de identificar colinearidade entre as variáveis independentes é examinar as correlações entre essas variáveis.
IV. Na análise de conglomerados, as técnicas hierárquicas exigem que o usuário identifique previamente o número de grupos desejado, mas essa exigência não prevalece nas técnicas não hierárquicas.

Está correto o que se afirma APENAS em

Alternativas
Comentários
  • com relação à IV, a identificação prévia do número de grupos refere-se à Análise Discriminante:

    http://www.ufrrj.br/institutos/it/deng/varella/Downloads/multivariada%20aplicada%20as%20ciencias%20agrarias/Aulas/ANALISE%20DISCRIMINANTE.pdf

  • Com relação a II, a variável dependente é qualitativa. Por exemplo: fumante ou não fumante

    http://www.ufrrj.br/institutos/it/deng/varella/Downloads/multivariada%20aplicada%20as%20ciencias%20agrarias/Aulas/ANALISE%20DISCRIMINANTE.pdf

ID
1194349
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Julgue o  item  a seguir, relativo à análise multivariada.

Na análise fatorial, a rotação varimax, que não é ortogonal, tem por objetivo maximizar a variância das cargas fatoriais.

Alternativas
Comentários
  • não são ortogonais: os métodos oblimax e ortomax 

     

  • Método Varimax: é um método de rotação ortogonal e pretende que, para cada componente principal, existam apenas alguns pesos significativos e todos os outros sejam próximos de zero, isto é, o objetivo é maximizar a variação entre os pesos de cada componente principal, daí o nome Varimax;

    Afirmativa errada.

  • Gabarito: Errado

    Método Varimáx é um método de rotação ortogonal (suas variáveis são independentes) que se faz em torno da origem, o efeito final é rotacionar a matriz de pesos (matriz V) e redistribuir a variância, da primeiras componentes principais para as últimas com o obejtivo de obter novos fatores com um padrão mais simples e teoricamente mais significativo. Essa transformação acentua os pesos mais altos e amortiza os menores, a lógica é que a interpretação se torna mais fácil quando as correlações PC-variável sao próximas de mais ou menos um, indicando uma clara associação positiva ou negativa entre a variável e a PC, ou quando as correlações são próximas de zro, apontando uma ausência de associação.

  • Um dos métodos de rotação ortogonal é o método Varimax. Este método de rotação ortogonal é bastante utilizado entre os métodos ortogonais, ele procura minimizar o número de variáveis que apresentam altas cargas em cada fator.  

    Logo, há dois erros na questão: o primeiro é afirmar que a rotação varimax não é ortogonal (o correto seria afirmar que o método Varimax é um método ortogonal) e o segundo erro é afirmar que tem como objetivo maximizar a variância das cargas fatoriais (o correto seria afirmar que o objetivo dele é maximizar a variação entre os pesos de cada componente principal). 

    Resposta: E


ID
1194355
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Julgue o  item  a seguir, relativo à análise multivariada.

No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.

Alternativas
Comentários
  • Afirmativa errada, até porque existem várias formas de se estabelecer os k elementos que formarão as sementes iniciais. Sendo assim, o resultado final pode ser bastante diferente do resultado inicial.

  • Existem várias formas de estabelecer os centroides iniciais, se o número de dimensões crescer e essa escolha dos centroides iniciais for aleatória o algoritmo tende a ter a probabilidade que a questão cita como sendo 0, devido a lei dos grandes números.

    Outro fato interessante desse algoritmo é que se k, o número de centroides for muito grande, o algoritmo pode entrar em overfitting. Na biblioteca Scikit learn o algoritmo k means por padrão treina 10 vezes, sendo a primeira com centroides aleatórios, depois dos dez treinamentos, escolhendo o melhor conjunto de centroides com base em minimizar a inércia, ele executa realmente o algoritmo. Pode se mudar esse número 10 padrão via código no scikitlearn

  • Note que quando a questão se refere ao método de agrupamento por k-médias ela está se referindo ao método não hierárquico. Lembre-se que o método não hierárquico primeiramente escolhe uma partição inicial, logo depois realiza o deslocamento de um objeto de um grupo para outros grupos e, por fim, verifica o valor do critério que está sendo utilizado, decidindo assim pela configuração que apresentar uma melhoria.

    Logo, perceba que a questão se encontra errada, pois existem diversas formas de estabelecer os k elementos que formarão os clusters iniciais e, portanto, o resultado final pode ser diferente do resultado inicial.

    Resposta: E


ID
1194358
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Julgue o  item  a seguir, relativo à análise multivariada.

No agrupamento hierárquico, o critério denominado complete-linkage consiste em atualizar as distâncias entre dois grupos recém-agrupados como sendo o valor mínimo entre eles.

Alternativas
Comentários
  • valor máximo: https://en.wikipedia.org/wiki/Complete-linkage_clustering


ID
1194361
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Julgue o  item  a seguir, relativo à análise multivariada.

Na análise discriminante por meio do escore de Fisher, convencionou-se que os dados seguem distribuição normal.

Alternativas
Comentários
  • Afirmativa errada. Não é necessário supor que as g populações sejam normais multivariadas. Porém, suporemos que as g matrizes de covariância das populações são iguais a uma matriz Σ que é positiva definida.

  • A análise discriminante é uma técnica estatística utilizada para classificação de elementos de uma amostra ou população. É necessário ter conhecimentos a priori das características dos elementos da amostra (ou população). Esse conhecimento é utilizado para classificar novos elementos nos grupos já existentes. Neste método, o número de grupos precisa ser conhecido a priori.


ID
1234588
Banca
FCC
Órgão
TRT - 19ª Região (AL)
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:

I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.

Está correto o que consta APENAS em

Alternativas
Comentários
  • Vamos à análise detida de cada um dos itens:

    CORRETO: II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana. 
    é o caso em que p = 2 em: 
    http://en.wikipedia.org/wiki/Minkowski_distance
    O correto seria:
    I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável DEPENDENTE e UMA OU várias variáveis INDEPENDENTES. 
    III. Na análise discriminante a variável dependente é CATEGÓRICA e a independente é MÉTRICA.
    IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a MAXIMIZAÇÃO da correlação entre os conjuntos de variáveis respostas. 
    observe que a banca tenta "ludibriar" o candidato invertendo os conceitos, trocando palavras, etc



ID
1253224
Banca
IDECAN
Órgão
Colégio Pedro II
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Na análise discriminante, há situações nas quais temos variáveis quantitativas e qualitativas e, por isso, técnicas de discriminação que supõem distribuição normal multivariada podem apresentar sérios problemas. São métodos que podem ser aplicados nessas situações, EXCETO:

Alternativas
Comentários
  • a

    http://www.inf.ufsc.br/~patrec/agrupamentos.html

  • http://www.portalaction.com.br/en/node/1745

  • http://web.tecnico.ulisboa.pt/ana.freitas/bioinformatics.ath.cx/bioinformatics.ath.cx/index651a.html?id=147


ID
1331899
Banca
Quadrix
Órgão
DATAPREV
Ano
2012
Provas
Disciplina
Estatística
Assuntos

A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:

I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.

II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.

III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.

IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.

VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.

Dentre as seis afirmações dadas, quantas são falsas?

Alternativas

ID
1371904
Banca
FCC
Órgão
TRT - 13ª Região (PB)
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Sobre análise multivariada, considere:

I. Na análise fatorial nenhuma variável é definida como dependente ou independente.

II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.

III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.

IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.

Está correto o que consta APENAS em

Alternativas
Comentários
  • https://www.tecconcursos.com.br/conteudo/questoes/216322?materia=estatistica&banca=fcc

  • I. Correto. A análise fatorial é uma técnica de interdependência, pois todas as variáveis são consideradas simultaneamente. Sendo assim, não há variáveis dependentes ou independentes.

    II. Correto. Variância homogênea dentro e heterogênea entre os agrupamentos.

    III. Incorreto. Na correlação canônica queremos maximizar a correlação entre esses dois conjuntos.

    IV. Correto.


ID
1608187
Banca
CESPE / CEBRASPE
Órgão
ANTT
Ano
2013
Provas
Disciplina
Estatística
Assuntos

   Para avaliar o desempenho do transporte público por ônibus em determinada cidade, realizou-se um estudo estatístico mediante o uso de técnicas de análise multivariada de dados. Por meio desse estudo, foram identificados os grupos (homogêneos) de usuários, considerando-se a satisfação global dos serviços de transporte público, assim como os principais fatores que influenciam na opinião sobre esses serviços. O estudo identificou, por exemplo, aspectos como confiabilidade, segurança, tarifa e locais de parada como os mais importantes para se discriminar os usuários insatisfeitos daqueles que se consideram satisfeitos.


No que se refere aos métodos estatísticos de análise multivariada empregados na situação descrita acima, julgue o seguinte item.


Empregando-se a análise discriminante, é possível separar estatisticamente os usuários insatisfeitos daqueles que se consideram satisfeitos, com base nas características do usuário. Essa técnica é uma forma especializada de regressão em que se ajusta a probabilidade de um indivíduo pertencer a um grupo ou a outro grupo com base no seu perfil (como, por exemplo, idade, gênero, renda e escolaridade).


Alternativas
Comentários
  • creio que o erro esteja aqui:

    "Essa técnica é uma forma especializada de regressão"


ID
2311417
Banca
IBFC
Órgão
EBSERH
Ano
2017
Provas
Disciplina
Estatística
Assuntos

Na Análise Fatorial Exploratória, a comunalidade é um dos principais indicadores de ajuste de aplicação da técnica. A definição mais adequada para essa medida é:

Alternativas
Comentários
  • Comunalidade

    A comunalidade é a proporção de variabilidade de cada variável que é explicada pelos fatores. O valor da comunalidade é o mesmo, independentemente se você usa cargas fatoriais de fatores não rotacionados ou cargas fatoriais de fatores rotacionados para a análise.

    Interpretação

    Examine os valores da comunalidade para avaliar quão bem cada variável é explicada pelos fatores. Quanto mais perto a comunalidade estiver de 1, melhor a variável é explicada pelos fatores. Você pode decidir adicionar um fator se o fator contribui significativamente para o ajuste de determinadas variáveis.

     

    Fonte: https://support.minitab.com/pt-br/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/factor-analysis/interpret-the-results/all-statistics-and-graphs/

  • Galera, gravei um vídeo comentando esta questão:

    https://youtu.be/PhZ9a8p-zv8


ID
2347399
Banca
FCC
Órgão
TRT - 5ª Região (BA)
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações:

I. A análise fatorial é, geralmente, aplicada sobre variáveis métricas, apesar de existirem métodos especiais para o emprego dessa técnica a variáveis dicotômicas.
II. Na análise discriminante, a variável dependente deve ser não métrica e as variáveis independentes devem indicar diferenças entre, pelo menos, dois grupos.
III. A análise de correspondência não é adequada para pesquisa aleatória e não é sensível a observações atípicas.
IV. Na análise de agrupamentos, as medidas de similaridade mais utilizadas são as correlacionais.

Está correto o que consta APENAS em

Alternativas

ID
2349580
Banca
FCC
Órgão
TRT - 12ª Região (SC)
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Acerca da Análise Multivariada, considere:
I. Na análise fatorial, o critério varimax é um método de rotação fatorial ortogonal para se conseguir uma estrutura fatorial simplificada.
II. O princípio subjacente da análise de correlação canônica é desenvolver uma combinação linear de cada conjunto de variáveis, dependentes e independentes, visando minimizar a correlação entre os dois conjuntos.
III. A análise de correspondência acomoda tanto dados não métricos quanto relações não lineares.
IV. A análise discriminante é apropriada quando a variável dependente é categórica e as variáveis independentes são métricas.
Está correto o que consta APENAS em 

Alternativas

ID
2355682
Banca
CONSULPLAN
Órgão
TRF - 2ª REGIÃO
Ano
2017
Provas
Disciplina
Estatística
Assuntos

Sobre a análise fatorial e suas propriedades, assinale a afirmativa INCORRETA.

Alternativas

ID
2454646
Banca
INSTITUTO AOCP
Órgão
EBSERH
Ano
2015
Provas
Disciplina
Estatística
Assuntos

São técnicas, da Análise Multivariada, que estudam a estrutura de covariância de um vetor aleatório:

Alternativas

ID
2481466
Banca
NC-UFPR
Órgão
UFPR
Ano
2013
Provas
Disciplina
Estatística
Assuntos

A respeito das medidas de similaridade e dissimilaridade no âmbito da teoria de análise de agrupamentos (cluster), considere as seguintes afirmativas:

1. A distância de Minkowsky entre dois pontos Xl e Xk é muito mais afetada pela presença de valores discrepantes na amostra do que a distância euclidiana. Para λ = 1, a distância de Minkowsky é conhecida como city-block ou Manhattan.

2. O coeficiente de concordância positiva é definido como o número de pares realmente concordantes em relação ao número total de pares. Quanto maior o seu valor, maior é a concordância entre os elementos comparados, razão pela qual é um índice de similaridade.

3. A distância euclidiana média revela que, quanto menor o valor da distância, maior será a similaridade dos elementos comparados; portanto é um índice de discordância ou de dissimilaridade.

4. O coeficiente de Jaccard tem o mesmo objetivo que o coeficiente de concordância positiva. A diferença é que a proporção de pares concordantes é calculada em relação ao número total de pares, excluindo-se os pares do tipo (0 0).

Assinale a alternativa correta.

Alternativas

ID
2628766
Banca
CESPE / CEBRASPE
Órgão
ABIN
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Julgue o item que se segue, relativo a análise multivariada.


Em uma análise de componente principal (PCA), o primeiro componente principal será aquele determinado pelo autovetor do maior autovalor entre aqueles da matriz de variâncias e covariâncias do conjunto em análise.

Alternativas
Comentários
  • A PC1 é definida pela direção que descreve a máxima variância dos dados originais. Já a segunda componente principal, a PC2 tem a direção de máxima variância dos dados no subespaço ortogonal à PC1

     

    Resposta: CERTO

  • Galera gravei um vídeo comentando esta questão

    https://youtu.be/gYzO_3DDRps


ID
2777824
Banca
Instituto Acesso
Órgão
SEDUC-AM
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Algumas análises podem ser realizadas na aplicação de métodos estatísticos multivariados, sendo que existem alguns testes para comparar os vetores de médias de várias amostras multivariadas, com exceção do(a):

Alternativas

ID
2902753
Banca
VUNESP
Órgão
TJ-SP
Ano
2019
Provas
Disciplina
Estatística
Assuntos

No estudo da análise multivariada, existe uma técnica para análise de dados que tem como objetivo dividir os elementos da amostra, ou população, em grupos de forma que os elementos pertencentes a um mesmo grupo sejam similares entre si com respeito às variáveis que neles foram medidas, e os elementos em grupos diferentes sejam heterogêneos com relação a essas mesmas características.


Essa técnica denomina-se análise

Alternativas
Comentários
  • Resposta na página 39:

    https://books.google.com.br/books?id=h4llDwAAQBAJ&pg=PA39&lpg=PA39&dq=forma+que+os+elementos+pertencentes+a+um+mesmo+grupo+sejam+similares+entre+si+com+respeito+%C3%A0s+vari%C3%A1veis+que+neles+foram+medidas,+e+os+elementos+em+grupos+diferentes+sejam+heterog%C3%AAneos+com+rela%C3%A7%C3%A3o+a+essas+mesmas+caracter%C3%ADsticas&source=bl&ots=Q81jpBrggv&sig=ACfU3U3Od9wmoDgiMnk58AjPs-7ZZUxw9A&hl=pt-BR&sa=X&ved=2ahUKEwiG0a_OnubgAhUZH7kGHVW0DBsQ6AEwAXoECAgQAQ#v=onepage&q=forma%20que%20os%20elementos%20pertencentes%20a%20um%20mesmo%20grupo%20sejam%20similares%20entre%20si%20com%20respeito%20%C3%A0s%20vari%C3%A1veis%20que%20neles%20foram%20medidas%2C%20e%20os%20elementos%20em%20grupos%20diferentes%20sejam%20heterog%C3%AAneos%20com%20rela%C3%A7%C3%A3o%20a%20essas%20mesmas%20caracter%C3%ADsticas&f=false

  • d-

    Clustering é um método de machine learning nao-supervisionado. ele permite segmentar automaticamente o conjunto de dados em grupos, de acordo com a similaridade. Porém, em algumas vezes, a Análise de Cluster superestima a semelhança entre os grupos e não trata os pontos de dados como indivíduos.

  • Galera, gravei um vídeo comentando esta questão

    https://youtu.be/l3ALdEJUZJc


ID
2913031
Banca
IF-PA
Órgão
IF-PA
Ano
2019
Provas
Disciplina
Estatística
Assuntos

Dentre os métodos estatísticos multivariados tem-se um dos métodos considerado mais simples de aplicação conhecido como Análise de Componentes Principais (ACP). Quanto ao objetivo desta técnica de análise de dados, pode-se afirmar:

Alternativas

ID
3480868
Banca
INSTITUTO AOCP
Órgão
ADAF - AM
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:


Componente     Autovalor     Percentagem da variância     Percentagem Acumulada

         1                 5,813                       69,095                                     69,095

         2                 2,350                       27,933                                     97,028

         3                 0,25                           2,971                                   100,000


Variável     Autovetor 1     Autovetor 2     Autovetor 3

    X1              -0,39                 0,0                 0,89

    X2               0,95                 0,0                 0,40

    X3               0,00                 1,0                 0,0

Considerando o exposto, assinale a alternativa que apresenta a primeira componente principal.

Alternativas
Comentários