- ID
- 173062
- Banca
- FCC
- Órgão
- MPU
- Ano
- 2007
- Provas
- Disciplina
- Estatística
- Assuntos
A análise fatorial tem como objetivo principal descrever a variabilidade original de um vetor aleatório X com m componentes
A análise fatorial tem como objetivo principal descrever a variabilidade original de um vetor aleatório X com m componentes
Quanto a (algumas) técnicas de Análise Multivariada, é INCORRETO afirmar:
Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:
I. Na análise de componentes principais a obtenção das componentes principais envolve a decomposição da matriz de covariâncias do vetor aleatório de interesse.
II. Na análise discriminante não é necessário que os grupos nos quais cada elemento amostral pode ser classificado sejam conhecidos à priori.
III. O escalonamento dimensional gera uma medida de ajuste denominada Stress que quanto mais próxima de 1 estiver melhor será o ajuste.
IV. Na análise de agrupamentos, para que se possa proceder ao agrupamento de elementos, é necessário se decidir à priori a medida de similaridade ou dissimilaridade que será usada.
Dentre essas afirmações citadas são verdadeiras SOMENTE
Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:
I. Na análise de correspondência usa-se como medida de similaridade a distância Euclidiana média.
II. O objetivo principal da análise de componentes principais é o de explicar a estrutura de variância e covariância de um vetor aleatório, composto por n variáveis aleatórias, através da construção de combinações lineares das variáveis originais.
III. O escalonamento dimensional é uma técnica matemática apropriada para representar graficamente n elementos num espaço de dimensão menor que o original, tendo-se em consideração a distância ou similaridade que os elementos têm entre si.
IV. Na análise de agrupamentos, uma medida de similaridade que pode ser utilizada é a distância Euclidiana.
Dentre essas afirmações citadas são verdadeiras SOMENTE
Julgue os itens subsecutivos, acerca de análise multivariada e distribuições conjuntas.
Para dados não correlacionados, a distância de Mahalanobis é proporcional à distância euclidiana.
Relativamente à Análise Multivariada de Dados, considere as afirmativas abaixo.
I. A análise fatorial é um exemplo de técnica de interdependência, o que significa que nenhuma variável ou grupo de variáveis é definida como sendo dependente ou independente.
II. A análise de correlação canônica não é adequada se as variáveis independentes são quantitativas.
III. A análise discriminante múltipla é adequada se a única variável dependente for categórica.
IV. A análise de correspondência não é adequada para teste de hipóteses.
Está correto o que se afirma APENAS em
Julgue os itens subsecutivos, referentes ao método de componentes
principais.
A técnica de componentes principais pode ser utilizada para se diagnosticar multicolinearidade em problemas de regressão linear.
Oobjetivo principal da Análise de Componentes Principais é:
Considere as afirmativas abaixo.
I. Uma técnica não hierárquica da análise de agrupamentos é o método das K-médias.
II. O modelo de análise fatorial procura descrever a variabilidade de um vetor aleatório p-dimensional X, em termos de um vetor aleatório m-dimensional (m<p), linearmente relacionado com X.
Está correto o que se afirma em
Relativamente à Análise Multivariada de Dados, considere:
I. Na análise discriminante, uma suposição para a determinação da função discriminante é a de normalidade multivariada das variáveis independentes.
II. A análise de correspondência não é sensível a observações atípicas, como outliers.
III. A escalagem multidimensional se baseia em distâncias euclidianas em projeção plana entre variáveis.
É correto o que consta APENAS em
Sobre análise multivariada, analise.
I. Os componentes principais amostrais são combinações lineares das variáveis mensuradas que maximizam a variação total da amostra e que são mutuamente ortogonais.
II. O algoritmo das k-médias é um tipo de agrupamento não hierárquico que particiona n objetos em k grupos.
III. O método de correlação canônica analisa combinações não lineares das variáveis em dois grupos para determinar as combinações que possuem a maior correlação.
Assinale
Considere as seguintes afirmações:
I. Na análise de componentes principais a informação contida em um vetor aleatório
p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional
(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.
II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.
III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.
Dentre as afirmações acima são verdadeiras APENAS
Considere as afirmações abaixo, relativas às técnicas de Análise Multivariada:
I. Na análise de correlação canônica, a ideia básica é resumir a informação de cada conjunto de variáveis resposta em combinações lineares, sendo que a escolha dos coeficientes dessas combinações deve ter como critério a minimização da correlação entre os conjuntos de variáveis resposta.
II. A análise de correspondência é adequada quando se quer examinar a relação entre variáveis categóricas nominais ou entre categorias dessas variáveis.
III. A análise de regressão múltipla é exemplo de uma técnica de interdependência.
É correto o que consta APENAS em
Julgue os seguintes itens, acerca de análise multivariada de dados.
Considere a aplicação da técnica das componentes principais com o objetivo de reduzir a dimensão de um conjunto de dados constituído de p variáveis. Considere, ainda, supondo que os autovalores da matriz das correlações entre essas variáveis sejam tais que λ2 = λ3 = ... = λp = 1 - ρ em que ρ representa uma medida de correlação.
Nessa situação, considerando-se p =10, é correto afirmar que ρ < 0,75.
Com relação à análise discriminante e à rotação varimax, julgue o item.
Muito utilizada em análise fatorial, a rotação varimax é ortogonal, ou seja, os fatores rotacionados não são correlacionados.
Com relação à análise discriminante e à rotação varimax, julgue o item.
A análise discriminante constitui técnica multivariada que permite classificar os objetos que formam um conjunto de dados e, com base nela, é possível segmentar um conjunto de objetos em k grupos homogêneos sem se dispor de uma informação a priori acerca da alocação desses objetos nesses grupos.
A análise fatorial é uma técnica multivariada que busca identificar um número pequeno de fatores capazes de representar relações entre um conjunto de variáveis inter-relacionadas. Com base na teoria de análise fatorial, assinale a alternativa que apresenta a afirmação correta.
Uma análise de componentes principais considerou 20 variáveis. Com base na matriz de covariância entre essas variáveis, observou- se que os cinco maiores autovalores foram iguais a 6, 4, 3, 2 e 1. Considerando esses resultados, assinale a opção correspondente ao percentual de variação explicada por esses cinco maiores autovalores.
Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.
A partir dessa situação, julgue o item.
A análise de componentes principais é uma técnica da análise multivariada que permite formar um ranking dessas escolas com base nesses dados.
Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.
A partir dessa situação, julgue o item.
A análise discriminante é técnica multivariada equivalente a um modelo de regressão linear múltiplo.
Com relação à análise multivariada de dados, é correto afirmar que a regressão múltipla é uma técnica estatística que
Em um banco de dados, foram armazenadas informações relativas a diversas pesquisas realizadas por pesquisadores de institutos renomados. Entre as variáveis constantes desse banco destacam-se: nome, gênero e titulação do pesquisador; valor financiado da pesquisa; instituto ao qual o pesquisador pertence; número de componentes da equipe; e número de artigos publicados pelo pesquisador.
Com base nessas informações, julgue os itens a seguir.
Se, na análise de componentes principais, fossem utilizadas 5 variáveis quantitativas, então, a técnica geraria, no máximo, 3 componentes, se essas correspondessem a, pelo menos, 95% da variância explicada.
São métodos de rotação ortogonal dos fatores de uma análise fatorial, EXCETO:
Considere as afirmações abaixo relativas à Análise Multivariada.
I. A análise de correspondência permite estudar associação entre variáveis qualitativas.
II. Na análise discriminante a variável dependente deve ser métrica.
III. Na análise de regressão múltipla uma forma de identificar colinearidade entre as variáveis independentes é examinar as correlações entre essas variáveis.
IV. Na análise de conglomerados, as técnicas hierárquicas exigem que o usuário identifique previamente o número de grupos desejado, mas essa exigência não prevalece nas técnicas não hierárquicas.
Está correto o que se afirma APENAS em
Julgue o item a seguir, relativo à análise multivariada.
Na análise fatorial, a rotação varimax, que não é ortogonal, tem por objetivo maximizar a variância das cargas fatoriais.
Julgue o item a seguir, relativo à análise multivariada.
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.
Julgue o item a seguir, relativo à análise multivariada.
No agrupamento hierárquico, o critério denominado complete-linkage consiste em atualizar as distâncias entre dois grupos recém-agrupados como sendo o valor mínimo entre eles.
Julgue o item a seguir, relativo à análise multivariada.
Na análise discriminante por meio do escore de Fisher, convencionou-se que os dados seguem distribuição normal.
Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:
I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
Na análise discriminante, há situações nas quais temos variáveis quantitativas e qualitativas e, por isso, técnicas de discriminação que supõem distribuição normal multivariada podem apresentar sérios problemas. São métodos que podem ser aplicados nessas situações, EXCETO:
A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?
Sobre análise multivariada, considere:
I. Na análise fatorial nenhuma variável é definida como dependente ou independente.
II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.
III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.
IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.
Está correto o que consta APENAS em
Para avaliar o desempenho do transporte público por
ônibus em determinada cidade, realizou-se um estudo estatístico
mediante o uso de técnicas de análise multivariada de dados. Por
meio desse estudo, foram identificados os grupos (homogêneos) de
usuários, considerando-se a satisfação global dos serviços de
transporte público, assim como os principais fatores que
influenciam na opinião sobre esses serviços. O estudo identificou,
por exemplo, aspectos como confiabilidade, segurança, tarifa e
locais de parada como os mais importantes para se discriminar os
usuários insatisfeitos daqueles que se consideram satisfeitos.
No que se refere aos métodos estatísticos de análise multivariada
empregados na situação descrita acima, julgue o seguinte item.
Empregando-se a análise discriminante, é possível separar
estatisticamente os usuários insatisfeitos daqueles que se
consideram satisfeitos, com base nas características do usuário.
Essa técnica é uma forma especializada de regressão em que se
ajusta a probabilidade de um indivíduo pertencer a um grupo
ou a outro grupo com base no seu perfil (como, por exemplo,
idade, gênero, renda e escolaridade).
A respeito das medidas de similaridade e dissimilaridade no âmbito da teoria de análise de agrupamentos (cluster), considere as seguintes afirmativas:
1. A distância de Minkowsky entre dois pontos Xl e Xk é muito mais afetada pela presença de valores discrepantes na amostra do que a distância euclidiana. Para λ = 1, a distância de Minkowsky é conhecida como city-block ou Manhattan.
2. O coeficiente de concordância positiva é definido como o número de pares realmente concordantes em relação ao número total de pares. Quanto maior o seu valor, maior é a concordância entre os elementos comparados, razão pela qual é um índice de similaridade.
3. A distância euclidiana média revela que, quanto menor o valor da distância, maior será a similaridade dos elementos comparados; portanto é um índice de discordância ou de dissimilaridade.
4. O coeficiente de Jaccard tem o mesmo objetivo que o coeficiente de concordância positiva. A diferença é que a proporção de pares concordantes é calculada em relação ao número total de pares, excluindo-se os pares do tipo (0 0).
Assinale a alternativa correta.
Julgue o item que se segue, relativo a análise multivariada.
Em uma análise de componente principal (PCA), o primeiro
componente principal será aquele determinado pelo autovetor
do maior autovalor entre aqueles da matriz de variâncias e
covariâncias do conjunto em análise.
No estudo da análise multivariada, existe uma técnica para análise de dados que tem como objetivo dividir os elementos da amostra, ou população, em grupos de forma que os elementos pertencentes a um mesmo grupo sejam similares entre si com respeito às variáveis que neles foram medidas, e os elementos em grupos diferentes sejam heterogêneos com relação a essas mesmas características.
Essa técnica denomina-se análise
Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:
Componente Autovalor Percentagem da variância Percentagem Acumulada
1 5,813 69,095 69,095
2 2,350 27,933 97,028
3 0,25 2,971 100,000
Variável Autovetor 1 Autovetor 2 Autovetor 3
X1 -0,39 0,0 0,89
X2 0,95 0,0 0,40
X3 0,00 1,0 0,0
Considerando o exposto, assinale a alternativa que apresenta a primeira
componente principal.