SóProvas



Questões de Covariância, Correlação


ID
70819
Banca
FCC
Órgão
TRT - 3ª Região (MG)
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Ao analisar o diagrama de dispersão entre duas variáveis aleatórias X e Y, optou-se por utilizar uma forma de relação tal que Y = a + bX para a previsão de Y em função de X (os valores de a e b foram obtidos pelo método dos mínimos quadrados). Estas duas variáveis apresentam um coeficiente de correlação linear igual a r, tal que r > 0. Então, o

Alternativas
Comentários
  • Comentário objetivo:

    b) coeficiente de correlação linear entre as variáveis (2X) e (5Y) também é igual a r.

    Uma das propriedades da correlação (r) diz que ela não é influenciada por operações de soma, subtração, multiplicação ou divisão, exceto pelo sinal. Decorre disso que r(x, y) = r(2x, 5y).

    Outros exemplos seriam:
    r(x, y) = r(3x, 4y)
    r(x, y) = r(x + 4, y - 8)
    r(x, y) = r(2x -1, 3y - 3) 
    r(x, y) = r(9x -2, 9y + 2)

  • o coef de correlacao é livre de escala

    isso significa dizer que se correlaçao entre x e y é r

    a correlacao entre 2x e 5y também será r

     

  • Fiquei com dúvida, afinal a COV(2X ; 5Y) = 2x5xCOV(X;Y) = 10xCOV(X;Y) que é diferente de COV(X;Y) e

    Var(2X)xVar(5Y) = 4Var(X)x25Var(Y) = 100Var(X)xVar(Y) 


    r = COV(X;Y) / Var(X)xVar(Y) 

    que neste exemplo é: r = 10xCOV(X;Y) / 100xVar(X)xVar(Y) = COV(X;Y) / 10xVar(X)xVar(Y) que é diferente de r.

    por que é igual?


  • A correlação não é influenciada nem por operações de soma, nem de subtração,nem de produto, e nem de divisão, exceto pelo sinal.

    Como é isso? Vamos ver, por meio de vários exemplos: Uma questão de prova pode dizer que a correlação entre duas variáveis quaisquer x e y é igual a 0,8. Ou seja, r(x,y)=0,8. E perguntar qual a correlação entre (2x-3 e 3y+5). Ou seja,perguntar: r(2x-3, 3y+5)=?

    Como resolveremos essa questão? Analisando as operações que ocorreram com asvariáveis x e y.

                  Vejamos. Temos: r(x,y)=0,8 e r(2x-3, 3y+5)=?

                      A variável x virou o quê? Virou 2x-3. Quais as operações que ocorreram com o x? Ele foi multiplicado por 2, e

                      depois,subtraído de 3. Produto ou subtração afetam a correlação? Não! Por último: o x mudou de sinal?Não!

                      Quais as operações que ocorreram com o y? Ele foi multiplicado por 3, e depois, somadoa cinco. Produto e soma

                      não influenciam a correlação! Por fim, o y não mudou de sinal. Assim, desconsiderando as operações que não

                     influenciam na Correlação, teremos que: r(2x-3, 3y+5) = r(x,y) = 0,8 Viram? O que temos a fazer é apenas

                    desconsiderar aquelas operações que não influenciam na correlação, e depois ver o que sobrou!


    Apenas fiquemos atentos, e muito, paraverificar se o sinal das variáveis x e y vai mudar ou não!

    Mais um exemplo.

                     Exemplo 2) Sabendo que r(x,y)=0,8, quanto será r(2x-3, -3y+5)? Novamente, teremos que desconsiderar aquelas

                      operações que não alteram o valor dacorrelação. Fazendo isso, teremos: r(2x-3, -3y+5) Estão todos vendo que ao

                      cortar o 3 que está multiplicando com o y, restou um sinal demenos antes dele?

                      Assim, teremos que: r(2x-3, -3y+5) = r(x,-y) = -0,8


ID
73705
Banca
FGV
Órgão
SEFAZ-RJ
Ano
2008
Provas
Disciplina
Estatística
Assuntos

O coeficiente de determinação de um modelo de regressão linear serve como uma importante ferramenta para avaliar o grau de ajustamento do modelo aos dados.

A respeito desse coeficiente, assinale a afirmativa incorreta.

Alternativas
Comentários
  • Comentário objetivo:

    a) Seu valor varia entre 0 e 1.
    O coeficiente de determinação (R2) é o quadrado do coeficiente de correlação e sendo este último um número real variando de
    -1 até +1, o coeficiente de determinação estará compreendido entre 0 e 1;

    b) É invariante a uma mudança de escala das variáveis independentes.
    Uma mudança na escala de valores das variáveis não altera o coeficiente de correlação e conseqüentemente não alterará o R2 (coeficiente de determinação);


    c) É utilizado para escolher modelos com número de variáveis independentes diferentes.   
    A letra C está incorreta pois diz que é utilizado para escolher modelos com número de variáveis aleatórias independentes diferentes, quando, na realidade, pode ser utilizado, mas não é essa a principal finalidade do R2.

    d) É uma função não decrescente no número de variáveis independentes no modelo.
    Ao aumentarmos o número de variáveis independentes o R2 pode aumentar ou ficar igual, mas nunca decrescerá;


    e) Representa a participação relativa da soma dos quadrados da regressão sobre a soma dos quadrados total.
    A opção da letra E também está correta, pois o coeficiente de determinação indica quantos % a variação explicada pela regressão representa da variação total e é obtido por R2 = VE / VT, onde VE é a variação explicada pelo modelo (soma dos quadrados da regressão) e VT é a variação total (soma total dos quadrados, ou seja, regressão + residuais);

ID
124303
Banca
FGV
Órgão
SEFAZ-RJ
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Duas variáveis aleatórias x e y têm coeficiente de correlação linear igual a 0,8.

Se w e z são tais que w = 2x - 3 e z = 4 - 2y então o coeficiente de correlação entre w e z será igual a:

Alternativas
Comentários
  • Sabemos que  a=Y-βX, onde β eh o coeficiente angular.
    A correlação entre x e y é 0,8;
    A correlação entre w e x é igual a 1, pois o coeficiente angular (β = 2) é positivo;
    A correlação entre z e y é igual a −1, pois o coeficiente angular (β = −2) é negativo;
    Para encontrar o coeficiente de correlação entre w e z, basta fazer:
    ρwz = ρxy ⋅ ρwx ⋅ ρzy ⇒ ρwz = 0,8 ⋅1⋅ (−1) ⇒ ρwz = −0,8 .
    Letra A.
  • Primeiramente, é necessário saber que "O coeficiente de correlação pode variar de –1,00 a + 1,00, com um coeficiente de +1, indicando
    uma correlação linear positiva perfeita".

  •         Inicialmente, recorde a propriedade da correlação que estudamos:

    Correlação(a.X + b, c.Y + d) = sinal(ac) Correlação(X, Y)

    Assim, podemos dizer que:

    Correlação(2x – 3, 4 – 2y) = sinal (2. -2) Correlação (X, Y)

    Correlação(2x – 3, 4 – 2y) = - Correlação (X, Y)

    Correlação(2x – 3, 4 – 2y) = - 0,8

    Resposta: A

  • r(x,y) = 0,8

    r(2x-3,4-2y) = sinal de (2*-2) + r(x,y)

    r(2x - 3,4 - 2y) = - 0,8

  • GABARITO: Letra A

    Questão quase dada de graça.

    O coeficiente de correlação linear de pearson não é afetado por somas, multiplicações, divisões ou multiplicações. Logo, se o coeficiente inicial era 0,80, eventuais alterações constantes não irão alterar o valor. Assim, sabemos que a resposta deve ser a letra A ou a letra E.

    Contudo, o coeficiente linear pode alterar de sinal. Para sabermos quando altera o sinal, é só olhar os números multiplicadores/divisores. Veja:

    • w = 2x - 3
    • z = 4 - 2y

    Observem que em ambos há o 2 multiplicando X e o Y. A diferença é que no W é positivo, mas no Z é negativo.

    Toda vez que ocorrer multiplicações com mesmo sinal (++ ou --), o coeficiente linear não altera de sinal.

    Por outro lado, toda vez que ocorrer multiplicações com sinais opostos (+- ou -+), o coeficiente linear altera seu sinal. É o caso da nossa questão.

    Assim, nosso coeficiente linear será -0,80, pois os sinais são invertidos.


ID
129490
Banca
CESPE / CEBRASPE
Órgão
CEHAP-PB
Ano
2009
Provas
Disciplina
Estatística
Assuntos

O custo médio nacional para a construção de habitação com padrão de acabamento normal, segundo levantamento realizado em novembro de 2008, foi de R$ 670,00 por metro quadrado, sendo R$ 400,00/m2 relativos às despesas com materiais de construção e R$ 270,00/m2 com mão-de-obra. Nessa mesma pesquisa, os custos médios regionais apontaram para os seguintes valores por metro quadrado: R$ 700,00 (Sudeste), R$ 660,00 (Sul), R$ 670,00 (Norte), R$ 640,00 (Centro-Oeste) e R$ 630,00 (Nordeste).

Sistema Nacional de Pesquisa de Custos e Índices da Construção
Civil.
SINAPI/IBGE, nov./2008 (com adaptações).

Considerando o par de variáveis (X , Y), em que X representa o custo médio por metro quadrado (em R$) e Y representa os atributos Sudeste, Norte, Sul, Centro-Oeste ou Nordeste, assinale a opção correta.

Alternativas
Comentários
  • Séries Geográficas, Espaciais, Territoriais ou de Localização
    Descrevem os valores da variável, em determinado instante, discriminados segundo regiões.
    Exemplo:
    custo médio por metro quadrado (em R$)
    Regiões custo por metro
    sudeste
    norte
    centro-oeste
    nordeste
    sul
     

     

  • Comentário objetivo:

    a) A correlação linear de Pearson entre X e Y é positiva.
    ERRADO: Nada se pode afirmar sobre a correlação linear de X e Y pois Y é uma variável qualitativa.

    b) As variáveis X e Y são qualitativas.
    ERRADO: X é uma variável quantitativa e Y é uma variável qualitativa.

    c) As variáveis X e Y formam uma série geográfica.
    CORRETO! Conforme explicação da colega acima.

    d) O gráfico de X versus Y é um histograma.
    ERRADO: Trata-se de um gráfico de dispersão. 

  • Olá,

    A variável Y é qualitativa. Portanto, em primeiro lugar, é preciso ter em mente que não é possível calcular correlação quando uma das variáveis é qualitativa. Como Y é a região do espaço, as variáveis X e Y realmente formam uma série geográfica. Por fim, não dá para entender o erro da letra “d” apontado pela banca. De fato, é possível construir um histograma a partir dessas variáveis. Não há problema nenhum nisso, pois o histograma pode ser construído com uma variável qualitativa.

    Comentário do professor Thiago Cardoso, GranCursos


ID
135625
Banca
FGV
Órgão
SEAD-AP
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Se no ajuste de uma reta de regressão linear simples de uma variável Y em uma variável X o coeficiente de determinação observado foi igual a 0,64, então o módulo do coeficiente de correlação amostral entre X e Y é igual a:

Alternativas
Comentários
  • Numa regressão, o coeficiente de determinação é R^2 e o coeficiente de correlação é R. Foi dito que R^2 = 0,64, o que resulta R = 0,80.Letra E.Opus Pi.
  • O coeficiente de determinação (R2) é uma medida que nos diz sobre a qualidade da regressão, ou em outras palavras, o quanto meu modelo conseque estimar corretamente os valores da variável dependente (Y);

    Ou seja, R2 o de uma regressão indica a proporção da variável de Y é explicada pelo conheicmento da variação de X (variável independente);

    Sua fórmula é o quadrado do coeficiente de correlação, como a correlação varia entre -1 e 1, o coeficiente de determinação varia de 0 a 1.

    Como o R2 = 0.64, então o coeficiente de correlação é a raíz de 0.64, logo p = 0.8


    RESPOSTA E

ID
199537
Banca
CESPE / CEBRASPE
Órgão
MS
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Se o coeficiente de correlação linear entre as variáveis é igual a zero, então não existe nenhuma relação entre as variáveis X e Y.

Alternativas
Comentários
  • Se o coeficiente de correlação linear entre as variáveis é igual a zero, então, não existe nenhuma relação linear entre as variáveis X e Y.

    GABARITO: ERRADO.

  • Gabarito: Errado.

    Caso as variáveis sejam independentes, isto é, não possuam nenhuma relação, podemos afirmar que o coeficiente de correlação é igual a zero, nulo (r=0).

    Entretanto, a recíproca não é verdadeira. Ou seja, se r=0 (nulo), as variáveis podem ou não ser independentes (não terem nenhuma relação). Logo, não se pode afirmar, conforme a questão, que quando r=0 não existe nenhuma relação entre as variáveis X e Y.

  • Talvez não exista correlação LINEAR, mas pode haver outras relações: quadrática, exponencial, etc.

  • ERRADO

    1. O resultado de correlação linear igual a zero indica que não há uma correlação linear entre as variáveis
    • (cuidado! Dizer que não há correlação linear não exclui o fato de existir correlações de outra natureza, como quadrática, cúbica, exponencial etc.).

    Fonte: Alfacon Professor Rodolfo 

  • O coeficiente de correlação linear, como o nome já diz, irá nos fornecer se existe uma correlação LINEAR entre as variáveis. Mas podem existir outros tipos de correlação, por exemplo, quadrática, trigonométrica, etc.

    Quando a questão fala "então não existe nenhuma relação entre as variáveis X e Y" não tem como garantir que não existam outros tipos de correlações.

  • Independência entre variáveis mostra que a correlação é nula, mas a recíproca não é verdadeira.


ID
313276
Banca
CESPE / CEBRASPE
Órgão
TJ-ES
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Julgue os itens que se seguem, acerca de análise exploratória de
dados, análise de dados discretos, análise de regressão e inferência
estatística.

Considere duas variáveis X e Y com correlação linear de Pearson igual a 0,75. Nesse caso, somente se a variância de Y for superior ao dobro da variância de X, a variável Y tenderá a crescer pelo menos 1,5 unidades para cada unidade que aumentar a variável X .

Alternativas
Comentários
  • Sabemos que Beta é dado pelo quociente da covariancia pela variancia de x. E que, a correlacao é dada pela covariancia dividida pelo produtos dos desvios de x e y. Sendo assim, dividindo o valor da correlacao pelo desvio de x, em ambos os lados do sinal de igualdade de sua equacao, chegamos em:
    0,75*Sy = B*Sx. Façamos B = 1,5: tem-se que >> Sy = 2*Sx. Se no enunciado da questao substituirmos a palavra variancia por desvio-padrao o problema ficará correto, do contrário, ele está errado. Embora o gabarito marque a resposta como correta, ela não está.

     


ID
339649
Banca
COSEAC
Órgão
DATAPREV
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Considere X e Y variáveis aleatórias e , a correlação entre X e Y. Pode-se afirmar que:

Alternativas

ID
350530
Banca
CESPE / CEBRASPE
Órgão
IJSN-ES
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Considerando os conceitos associados a probabilidade e estatística,
julgue os itens de 108 a 116.

O coeficiente de correlação linear de Pearson, que mede o grau de correlação linear entre duas variáveis, é alterado quando todos os valores de uma das duas variáveis são multiplicados ou divididos por uma constante diferente de zero.

Alternativas
Comentários
  • Quando multiplicamos , ou dividimos , as variáveis por constantes, o coeficiente de correlação pode não ser alterado ou pode simplesmente trocar de sinal

    Errado

    Fonte Estratégia Concursos

    Prof. Guilherme Neves

  • Só é alterado se uma das variáveis tiver sinal negativo.

  • ERRADO

    O coeficiente de correlação não será afetado com + / - ou multiplicação / divisão em constantes positivas , porém em constantes negativas teremos a inversão do sinal .

  • r(x,y) = r(5x+6,8y+2)

  • Se as constantes tiverem o mesmo sinal: O coeficiente de correlação não será alterado

    Se as constante tiverem sinais contrários: O coeficiente de correlação trocará de sinal

  • SE SOMAR --> NÃO ACONTECE NADA NO COEFICIENTE DE CORRELAÇÃO.

    SE MULTIPLICAR/ DIVIDIR --> NÃO ALTERA OU MUDA O SINAL (mesmo sinal = não altera/ sinais diferentes = troca o sinal)


ID
513832
Banca
FMP Concursos
Órgão
TCE-RS
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Considere os dois modelos de regressão linear simples:
Yi = ß0 ß1 Xi + µi e Zi = a0 + a1 Wi + vi , onde µi e vi são as variáveis residuais e a0 , a1 , ß0 , ß1 , os respectivos parâmetros. O segundo modelo se diferencia do primeiro por suas variáveis Zi e Wi apresentarem escalas diferentes de Yi e Xi . (Zi = aYi e Wi = bXi, com a e b constantes positivas).
Das afirmativas abaixo:
I. Os estimadores de mínimos quadrados (ordinários) a0 e a1 são iguais aos de ß0 e ß1.
II. A variância estimada de vi é a2 vezes a variância estimada de µi.
III. Os coeficientes de determinação dos dois modelos são iguais.
É correto afirmar que:

Alternativas

ID
554434
Banca
CESPE / CEBRASPE
Órgão
ABIN
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Considerando que as variáveis X e Y estejam relacionadas de forma não linear, julgue o item abaixo.

O valor absoluto da correlação de Pearson entre X e Y é maior que o valor absoluto da correlação de Spearman entre essas variáveis.

Alternativas
Comentários

ID
554845
Banca
FCC
Órgão
INFRAERO
Ano
2011
Provas
Disciplina
Estatística
Assuntos

Sejam f(k), k=1,2,3,... e h(k), k=1,2,3,..., respectivamente, as funções de autocorrelação e autocorrelação parcial de um processo ARMA(p,q).

Sabe-se que:

I. f(k) ≠ 0, para k=1 e 2, e é igual a zero para outros valores de k.
II. h(k) é dominada por uma mistura de exponenciais e senoides amortecidas.

As características (I) e (II) nos levam a identificar para p e q, respectivamente, os valores

Alternativas

ID
563206
Banca
CESGRANRIO
Órgão
Petrobras
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Uma medida do grau de desigualdade de uma distribuição de renda é o(a)

Alternativas
Comentários
  • O Índice de Gini, criado pelo matemático italiano Conrado Gini, é um instrumento para medir o grau de concentração de renda em determinado grupo.Ele aponta a diferença entre os rendimentos dos mais pobres e dos mais ricos. Numericamente, varia de zero a um (alguns apresentam de zero a cem). O valor zero representa a situação de igualdade, ou seja, todos têm a mesma renda. O valor um (ou cem) está no extremo oposto, isto é, uma só pessoa detém toda a riqueza.

     

    Gabarito: B

     

    Fonte: http://www.ipea.gov.br/desafios/index.php?option=com_content&id=2048:catid=28&Itemid=23


ID
563980
Banca
CESGRANRIO
Órgão
Petrobras
Ano
2010
Provas
Disciplina
Estatística
Assuntos

O coeficiente de correlação entre as variáveis aleatórias X e Y é zero. Sendo V( ) o operador variância, conclui-se, a respeito de X e Y, que

Alternativas
Comentários
  • GABARITO: Letra A

    Se a correlação é zero, então a covariância também é zero. Logo:

    a) CERTO.

    A soma de duas variâncias é: V (X+Y) = V(X) + V(Y) + 2*Cov(X,Y). Porém, Cov(X,Y) = 0. Logo, resta: V (X+Y) = V(X) + V(Y)

    b) ERRADO. Não se pode afirmar isso. Pode-se afirmar apenas o que está na letra a)

    c) ERRADO. Ter correlação zero não significa ter média zero.

    d) ERRADO. Se duas variáveis são independentes, então a correlação entre elas será zero. Contudo, se a correlação é zero, não necessariamente podemos afirmar que as variáveis são independentes. Ou seja: a reciproca não é verdadeira.

    e) ERRADO. A covariância é zero.


ID
564007
Banca
CESGRANRIO
Órgão
Petrobras
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Um pesquisador estimou os parâmetros a, b e c do modelo estatístico de regressão linear y = a + bx + cz + u. Sabe-se que Y é um vetor coluna com os níveis educacionais dos filhos, X e Z são vetores colunas com os níveis educacionais dos pais e das mães e u é um vetor de variáveis aleatórias normais, independentes, de média zero e desvio padrão constante. A técnica usada foi de minimização da soma dos quadrados dos erros. A correlação positiva entre os dados em X e em Z pode gerar, para a estimação, um problema de

Alternativas

ID
583492
Banca
CESGRANRIO
Órgão
Petrobras
Ano
2006
Provas
Disciplina
Estatística
Assuntos

O coeficiente de correlação entre duas variáveis aleatórias X e Y é a(o):

Alternativas
Comentários
  • CadÊ os grandes pra me falaram porquê eu acertei?


ID
600376
Banca
CESGRANRIO
Órgão
BNDES
Ano
2011
Provas
Disciplina
Estatística
Assuntos

As variáveis aleatórias X e Y têm variâncias iguais e possuem coeficiente de correlação igual a 0,2. O coeficiente de correlação entre as variáveis aleatórias X e 5X – 2Y é

Alternativas
Comentários
  • O exercício pede para calcular: C(x, 5x-2y) = COV(x, 5x-2y)/(DP(x) * DP(5x-2y))

    Como C (x,y) = 0,2, C(x,y) = COV (x,y)/ DP(x) * DP (y) e DP(X) = DP(Y), pois Var(X) = Var(Y), temos que: COV (x,y) = 0,2 DP(x)2 = 0,2Var(X)

    1º Passo: calcular  DP(5x-2y)
    A variância da soma de duas VA (a e b) quaisquer é dada por:
    Var(ax + by) = a2 Var(x) + b2 Var(y) + 2ab * COV(x,y)
    Assim, temos: Var (5X-2Y) = 52 Var(x) + (-2)2 Var(y) + 2 * 5 * (-2) COV(x,y) = 25 Var(x) + 4 Var (y) - 20 Cov(x,y). Como Var(X) = Var(Y) e COV(x,y) = 0,2Var(X), a fórmula resulta em: 29Var(x) - 20*0,2*Var(x) = 25 Var(x)
    Se Var (5x-2y) = 25 Var(x), então DP (5x-2y) = raiz quadrada da Variância = 5 DP(x).

    2º Passo: calcular COV (x, 5x-2y)
    Sabemos que COV(x,y) = E(xy) - E(x) * E(Y)
    Portanto, COV(x, 5x-2y) = E[(x)*(5x-2y)] - E(x)*E(5x-2y) = E(5x2 - 2xy) - E(x)*(5E(x)-2E(y)) = 5E(x2) - 2E(xy) - 5 (E(x))2 + 2E(x)E(y) = 5[E(x2)-(E(x))2] - 2[Cov(x,y) + E(x)*E(y)] + 2E(x)E(y) = 5Var(x) -  2COV(x,y) = 5Var(x) - 2*0,2Var(x) = 4,6Var(x).

    C(x,5x-2y) = COV(x, 5x-2y)/(DP(x) * DP(5x-2y)) = 4,6Var(x) / (DP(x) * 5DP(x) = 4,6Var(x)/5Var(x) = 0,92

    Resposta: letra e




  • Devemos Lembrar que foi dado do problema que Var(x) = Var(y), ou seja, d.p(x) = d.p(Y) 
    Para calcularmos a Cov(x,5x-2y), devemos saber o valor da Cov(x,5x-2y) e do d.p(x) e o d.p(5x-2y)

    Cor(x,y) = Cov(x,y) / d.p(x)*d.p(y)
    0,2 = Cov(x,y) / Var
    Cov(x,y) = 0,2 Var

    Var(5x-2y) = 52 Var(x) + 2*5*(-2) Cov(x,y) + 22 Var(y)
    Var(5x-2y) = 25 Var - 20 Cov(x,y) + 4 Var
    Var(5x-2y) = 25 Var - 20*0,2 Var + 4 Var
    Var(5x-2y) = 25 Var - 4 Var + 4 Var
    Var(5x-2y) = 25 Var
    d.p (5x-2y) = 5 sigma

    Cov(x,5x-2y) = E(x,5x-2y) - E(x) * E(5x-2y)
    Cov(x,5x-2y) = E(5x2-2xy) - E(x) * [5 E(x) - 2 E(y)]
    Cov(x,5x-2y) = 5 E(x2) - 2 E(x,y) - 5 (E(x))2 - 2 E(x) *E(y)
    Cov(x,5x-2y) = [5 E(x2- 5 (E(x))2] - [2 E(x,y)  - 2 E(x) *E(y)]
    Cov(x,5x-2y) = 5 Var(x) - 2 Cov(x,y)
    Cov(x,5x-2y) = 5 Var(x) - 2*0,2 Var(x)
    Cov(x,5x-2y) =  4,6 Var(x)

    Cor(x,5x-2y) =  Cov(x,5x-2y) /d.p(x) * d.p(5x-2y)
    Cor(x,5x-2y) = 4,6Var / Sigma * 5 Sigma
    Cor(x,5x-2y) = 4,6Var / 5Var = 0,92



ID
670864
Banca
CONSULPLAN
Órgão
TSE
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Na análise de regressão múltipla foram encontrados:

• soma dos quadrados da regressão: 40.000.

• soma dos quadrados dos erros: 10.000.


Assim, o coeficiente de determinação múltipla (R2 ) dessa regressão é

Alternativas
Comentários
  • r^2 = SQR / SQT

    r^2 = 40 / (40 + 50)

    r^2 = 40/50

    r^2 = 0,8
  • O Coeficiente de determinação, também chamado de é uma medida de qualidade do modelo econométrico em relação à sua habilidade de estimar corretamente os valores da variável resposta y \,\!.
    O indica quanto da variância da variável resposta é explicada pela variância das variáveis explicativas. Seu valor está no intervalo de 0 a 1: Quanto maior, mais explicativo é o modelo. Por exemplo, se o de determinado modelo é 0,8234, significa que 82,34% da variância de y\,\! é explicada pela variância de X\,\!.
    Fórmulas

    SQ_\text{tot}=\sum_{i=1}^n (y_i-\bar{y})^2\,

    Soma dos Quadrados Total (variação da variável resposta - de cada um dos valores observados subtrai-se o valor da média aritmética, eleva-se o resultado ao quadrado e somam-se os resultados);

     

    SQ_\text{exp}=\sum_{i=1}^n (\hat{y_i} -\bar{y})^2\,

    Soma dos Quadrados Explicada (variação da variável resposta que é explicada pelo modelo - de cada um dos valores estimados pelo modelo subtrai-se o valor da média aritmética dos valores observado, usada acima, eleva-se o resultado ao quadrado e somam-se os resultados);

     

    SQ_\text{res}=\sum_{i=1}^n (\hat{y_i} - y_i)^2\,

    Soma dos Quadrados dos Resíduos ou dos erros (variação da variável resposta que não é explicada pelo modelo).

     

    SQ_\text{tot}=SQ_\text{exp}+SQ_\text{res}\,,


    onde y_i \,\! é a variável resposta na observação i\,\!; \bar{y}\,\! é sua média amostral e \hat{y_i}\,\! é o valor estimado pelo modelo na observação i\,\!.

     

    R^2=\frac{SQ_\text{exp}}{SQ_\text{tot}}=1-\frac{SQ_\text{res}}{SQ_\text{tot}}

    Fazendo as contas ficaria assim:

    R² = 40.000 / (40.000 + 10.000) = 40.000/ 50.000 = 0,8

ID
670876
Banca
CONSULPLAN
Órgão
TSE
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Sobre o modelo de regressão ponderada espacialmente (Geographically Weighted Regression – GWR), é correto afirmar que

Alternativas

ID
730942
Banca
FCC
Órgão
TRF - 2ª REGIÃO
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Sejam f(k) e g(k), k = 1, 2, ..., respectivamente, a função de autocorrelação parcial e a função de autocorrelação, de um processo ARIMA (p,d,q). Sabendo que g(k) é uma mistura de exponenciais ou ondas senoides amortecidas e que para f(k) somente f(1) e f(2) são diferentes de zero, então:

Alternativas
Comentários
  • como identificar: 
    http://www2.dbd.puc-rio.br/pergamum/tesesabertas/0124945_03_cap_04.pdf


ID
817258
Banca
COPESE - UFT
Órgão
DPE-TO
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Considere dois conjuntos de dados X e Y (com igual número de dados entre si) onde X é a variável preditora de Y. Sabendo-se que o coeficiente de correlação entre X e Y é diretamente proporcional e positivo, pergunta-se:

Qual é o tipo de gráfico, a ser realizado em planilha Excel da Microsoft Office 2007, que permitirá estimar corretamente a equação de regressão e coeficiente de determinação da regressão linear entre X e Y.

Alternativas
Comentários
  • GAB A

    Gráfico de dispersão é usado para estimar a equação da regressão linear. É adequado, inclusive, na analise dos resíduos ou erro aleatório para se verificar homocedasticidade ou heterocedasticidade.


ID
831439
Banca
CESPE / CEBRASPE
Órgão
TJ-RO
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Com respeito ao modelo de regressão linear simples, assinale a opção correta.

Alternativas
Comentários
  • RESPOSTA: B. 

    A inclinação da reta é igual à tangente do ângulo formado entre a reta e o eixo X.

    A inclinação da reta tem tudo a ver com a correlação das variáveis. Imagine o gráfico X-Y com os dados distribuídos, mas imagine tudo disperso, logo a inclinação é próxima de zero, ou seja, para vc traçar a reta que se ajusta melhor a esses pontos fica difícil, então vc traçará uma reta horizontal, agora imagine os dados tiverem uma tendência ascendente, logo essa reta para se ajustar terá uma inclinação positiva, por fim uma inclinação descendente teremos uma inclinação negativa.

    Essa é a equação da regressão: Y = a + bX. O enunciado fala que alfa é zero, lgo ficamos com Y = bX, sendo b a inclinação. Assim, como X é o inverso da inclinação teremos um cancelando o outro, isto é, Y = 1.

    A inclinação da reta é dada pela tangente, não pelo cosseno.
  • A inclinação da reta (b) é dada por Sxy / Sxx. 

    A correlação é dada por: Sxy / (Sx*Sy).
    Observe que a inclinação é proporcional à covariância Sxy. A correlação também o é.
    Logo, há proporcionalidade entre a inclinação e a correlação. 

ID
874204
Banca
CESPE / CEBRASPE
Órgão
ANP
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Com relação ao modelo de regressão linear simples e ao conceito de correlação, julgue os itens a seguir.


Em um modelo de regressão linear múltipla, o coeficiente de determinação é igual ao coeficiente de determinação ajustado apenas se o tamanho amostral for suficientemente grande.

Alternativas
Comentários
  • http://www.portalaction.com.br/892-coeficiente-de-determina%C3%A7%C3%A3o-ajustado

    $$R^2_a=1-\left(\frac{n-1}{n-(p+1)}\right)(1-R^2_p).$$  

     observe que para n grande o termo (n - 1) / (n - (p+1)) se reduz a 1
    assim, para n grande, o coef de det = coef de det ajust

  • Para n grande,o coeficiente de determinação é igual ao coeficiente de determinação ajustado.

  • certo, o R2 é igual o ajustado somente se n grande, mas o inverso: ajustado é igual o R2 se n grande ou R2 for igual a 1


ID
887554
Banca
CESPE / CEBRASPE
Órgão
ANP
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Com relação aos métodos estatísticos, julgue o  item  que se segue. 


A correlação nula entre duas variáveis indica que há independência entre essas variáveis.

Alternativas
Comentários
  • A independencia entre variaveis mostra que a correlação é nula, o contrario nao confere.

  • Correlação não é sinônimo de causa e consequência.

    A correlação de duas variáveis pode ser positiva perfeita ou negativa perfeita, e mesmo assim não quer dizer que é uma causa e consequência.

    O mesmo é para uma relação nula, não quer dizer que a consequência disso é por serem independentes. Contudo, como disse o colega acima, variáveis independentes têm correlação nula, mas o contrário não é verdade.

  • Se o coeficiente linear é 0,então não existe relação linear.Mas pode existir outros tipos de relação.

  • Complementando: Quando as variaveis são independentes, não necessariamente o coeficiente de correlação será nulo. Podemos ter variáveis x e y fortemente correlatas e sem nenhuma causalidade em comum, simplesmente por acaso... É o que se conhece por CORREAÇÕES ESPÚRIAS.

  • Me ajudou a decorar pensando assim:

    É só imaginar como um se..então.

    P - > Q, onde (P)=Se as variáveis são independentes(V),(então)(Q)= eu posso dizer que a correlação é nula(V)

    Note que a sentença Q tem que ser V pra que o se..então seja V. Mas a sentença P, pode apresentar qualquer dos dois valores, V ou F, e P -> Q ainda será V.

    O se...então não admite troca de ideias.

  • A correlação nula significa que HÁ UMA CORRELAÇÃO, mas não é linear!

    Logo, não podemos afirmar que elas são independentes

  • Correlação nula = 0

    Correlação = 0 NAO SERA NECESSARIAMENTE NULA.

    Gab. E

  • Corr nula não indica independência entre variáveis.

    Independências entre variáveis indica corr nula.

  • Correlação

    • Variáveis independentes → Covariância = 0 e Correlação = 0, entretanto o contrário eu não posso garantir

    (CESPE 2013) A correlação nula entre duas variáveis indica que há independência entre essas variáveis. (ERRADO, se as variáveis são independentes com certeza a covariância será 0 e a correlação será 0, mas o contrário eu não posso garantir)

    (CESPE 2010) Se o coeficiente de correlação linear entre as variáveis é igual a zero, então não existe nenhuma relação entre as variáveis X e Y. (ERRADO)

    (CESPE 2011) A correlação linear entre X e Y é nula; disso se conclui que ambas são independentes. (ERRADO)

    (CESPE 2014) Em um modelo de regressão linear, se a variável explicativa e a variável resposta não se correlacionam, o coeficiente de determinação seria próximo de 0. Além disso, se o coeficiente de determinação fosse próximo de 0, as variáveis explicativa e resposta seriam independentes. (ERRADO)

    A título de curiosidade

    y= variável resposta/ dependente

    x= variável explicativa / independente

    Ah, até parece que isso cai...

    (CESPE) A variável Y é denominada variável explicativa, e a variável X é denominada variável dependente. (ERRADO)

    Também é importante saber

    • - 1 a 1 (correlação perfeita)
    • 0,5 a 1 (forte)
    • 0,5 a 0 (fraca)
    • 0 (nula)

    (CESPE 2021) Os valores de covariância podem variar de –1 a +1. (Errado, correlação)

    (CESPE 2020) Em se tratando da técnica de correlação, utiliza-se uma escala de 1 a -1 para indicar o grau de similaridade entre duas variáveis distintas. (CERTO)

    (CESPE 2016) A correlação entre x e y é maior que 1. (ERRADO, varia de -1 a 1, logo, não há como ser superior a 1)

  • eu fiz uma prova e confirmei q ta certo


ID
891667
Banca
Aeronáutica
Órgão
CIAAR
Ano
2012
Provas
Disciplina
Estatística
Assuntos

O coeficiente de correlação linear de Pearson foi calculado para as variáveis X e Y a partir de 50 elementos amostrais; o valor encontrado foi igual a 0,8. Qual a proporção da variação em Y que poderá ser explicada pela relação linear entre X e Y?

Alternativas

ID
891868
Banca
IBFC
Órgão
INEP
Ano
2012
Provas
Disciplina
Estatística
Assuntos

O instrumento empregado para a medida da correlação linear de Pearson é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação. Assinale a alternativa que indica adequadamente a interpretação de um determinado resultado obtido r = 0,98 para o coeficiente de correlação de Pearson: 

Alternativas
Comentários
  • o coeficiente de correlação de person varia entre -1 a 1

    Sendo que 1, siguinifica a correlação perfeita entre as variáveis; 0, as variáveis não dependem linearmente das mesmas; -1, correlação negativa perfeita.

    no caso em tela como o coeficiente é 0,98, logo bem próximo ao 1, então a "Correlação linear positiva altamente significativa entre as variáveis." 

    Gab. A

  • (mais perto do -1 mais fraca é) -1_______-__0_+______0,98__1 (mais perto do 1 mais forte é)

    GAB: A

  • O valor do coeficiente de correlação linear de Pearson está sempre no intervalo de -1 a 1

    Quanto mais próximo de 1 mais forte será!


ID
941998
Banca
CESPE / CEBRASPE
Órgão
INPI
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Considere que, em um modelo de regressão linear múltipla, a variância associada à média da resposta estimada para um vetor X* de novas observações seja σ 21 e a variância do erro de predição correspondente, σ 22.

Nessa situação, é correto afirmar que o quadrado médio do resíduo será QMR ≤ σ 22  -  σ 21.

Alternativas
Comentários
  • Alguma alma pode comentar esta questão?


ID
1071673
Banca
ESAF
Órgão
MTur
Ano
2014
Provas
Disciplina
Estatística
Assuntos

O coe?ciente de correlação linear entre as variáveis aleatórias x e y é igual a 0,99. A partir disso pode-se, corretamente, a?rmar que:

Alternativas
Comentários
  • https://www.tecconcursos.com.br/conteudo/questoes/160514?orgao=mtur&cargo=estatistico-mtur&ano=2014

  • O coeficiente de relação linear, r , mede o quão forte é a relação linear entre X e Y.

    Tem-se que -1 < = r < = 1

    r > 0 relação linear direta

    r < 0 relação linear inversa

    r = 0 ausência de relação linear

    r = 1 relação linear perfeita 

    Na questão r = 0,99, ou seja > 0. Relação linear direta. Letra D

  • Vitor Menezes (Tecconcursos)

    Alternativa A - INCORRETA. O coeficiente de correlação mede o quão forte é a relação linear entre x e y. Se ele é praticamente igual a 1 (como é o caso), é porque o diagrama de dispersão para x e y é praticamente uma reta. Isto significa que, quando uma variável varia, a outra varia praticamente na mesma proporção.

     

    Para que r seja próximo de 1, pouco importa se elas assumem os mesmos valores ou não. Pode ser que sejam sempre diferentes entre si, o que importa é que se comportem segundo uma reta.

     

    Alternativa B - INCORRETA. Quem nos fornece o quanto uma variável explica da outra é o coeficiente de determinação que, no modelo de regressão linear simples, corresponde ao quadrado do coeficiente de correlação.

     

    Alternativa C - INCORRETA. Quando o coeficiente de correlação é positivo (como no caso da questão), temos indicativo de relação direta entre as variáveis: quando uma aumenta, a outra tende a aumentar também. Quando uma diminui, a outra diminui também.

     

    Alternativa D - CORRETA. Vide comentários da letra C.

     

    Alternativa E - INCORRETA. A covariância é igual ao produto do coeficiente de correlação pelos desvios padrão das variáveis. Desde que a questão não nos informou σx e nem σy, não temos como calcular a covariância.


ID
1071721
Banca
ESAF
Órgão
MTur
Ano
2014
Provas
Disciplina
Estatística
Assuntos

De uma população foi retirada uma amostra de 5 elementos de cada uma das variáveis X e Y. Para saber se há ou não correlação linear entre essas duas variáveis na população, da qual foi retirada esta amostra, foi realizado um teste de hipóteses bilateral, para veri? car a nulidade do coe? ciente de correlação linear, ? na população. O valor da estimativa do coe? ciente de correlação foi igual a 0,95. Sabendo-se que o teste foi realizado com um nível de signi? cância de 5 %, então o valor calculado da estatística de teste é igual a

Alternativas
Comentários
  • estatística de teste para teste do coeficiente de correlação:

    r * raiz de ((n - 2) / (1 - r^2))

    Onde r é o coeficiente de correlação. Neste caso, r = 0,95

    http://www.cfh.ufsc.br/gcn7008/documents/AULA11Correlacao.pdf

ID
1141912
Banca
FUMARC
Órgão
PC-MG
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Sejam X e Y duas variáveis aleatórias e a e b duas constantes quaisquer. Qual das seguintes afirmativas sobre a covariância e a correlação entre X e Y é FALSA?

Alternativas
Comentários
  • D

    correlação é livre de escala, ou seja, correlação entre x e y é mesma coisa que correlação entre cx e cy para qualquer c diferente de zero.. o mesmo vale para covariância


ID
1192354
Banca
CESPE / CEBRASPE
Órgão
FUB
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Com relação à análise de variância para verificação da qualidade de ajuste de um modelo de regressão, julgue os itens seguintes.

O coeficiente de correlação múltipla R2 pode ser calculado dividindo a soma de quadrados do resíduo pela soma de quadrado total.

Alternativas
Comentários
  • E

    R^2 = sqreg / sqtot

  • O coeficiente de determinação é calculado, pela divisão da SQE (Soma dos Quadrados Explicados) pela SQT (Soma dos Quadrados Totais).

  • R^2=SOMA DE QUADRADOS DO MODELO / SOMA DE QUADRADOS TOTAL

  • GAB. E

    Para calcular o coeficiente de determinação:

    A- SQE/SQT, ou;

    B- 1- SQR/SQT

    SQE = soma dos quadrados da equação/modelo/regressao

    SQR = soma dos quadrados dos residuos/erro

    SQT = soma dos quadrados totais


ID
1194247
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

       Pedro e João são os oficiais de justiça no plantão do fórum de determinado município. Em uma diligência distribuída a Pedro, X é a variável aleatória que representa o sucesso (X = 1) ou fracasso (X = 0) no cumprimento desse mandado. Analogamente, Y é a variável aleatória que representa o sucesso (Y = 1) ou fracasso (Y = 0) de uma diligência do oficial João. 

Com base nessa situação hipotética e considerando a soma S = X + Y, e que P(X = 1) = P(Y = 1) = 0,6 e E(XY) = 0,5, julgue o  item  que se segue, acerca das variáveis aleatórias X, Y e S.


A correlação linear entre as variáveis X e Y é superior a 0,6.

Alternativas
Comentários
  • Corr(X,Y) = Cov(X,Y) / (Sigma(X) * Sigma(Y))

    Cov (X,Y) = E(XY) - E(X)*E(Y) = 0,5 - 0,6*0,6 = 0,5 - 0,36 = 0,14

    Sigma(X) = raiz(0,6*0,4) = raiz(0,24)

    Sigma(Y) = raiz(0,6*0,4) = raiz(0,24)

    Corr(X,Y) = Cov(X,Y) / (Sigma(X) * Sigma(Y)) = 0,14 / (raiz(0,24)*raiz(0,24)) = 0,14/0,24 = 0,583.

    Afirmativa errada.

  • Devemos levar em conta que é um distribuição Bernoulli, onde:

    Para X → p = 0.6 ; q = 0,4

    Para Y → p = 0,6 ; q = 0,4

    Variância(x) = p . q = 0,24

    Variância(y) = p . q = 0,24

    DP(x) = √ 0,24 → Desvio padrão de x

    DP(y) = √ 0,24 → Desvio padrão de y

    E(x) = p = 0,6 → Esperança de x

    E(y) = p = 0,6 → Esperança de y

    A fórmula da correlação linear é:

    r = Cov(x,y) / DP(x) . DP(y)

    Fazendo a multiplicação dos desvios padrões:

    DP(x) . DP(y) = √ 0,24 . √ 0,24 = 0,24

    Com essas informações devemos achar a covariância que é dada pela seguinte fórmula:

    Cov(x,y) = E(xy) - E(x) . E(y)                   →                       E(xy) foi dado no enunciado = 0,5

    Cov(x,y) = 0,5 - (0,6 . 0,6) = 0,14

    Agora é só colocar na fórmula da correlação linear:

    r = 0,14 / 0,24 = 0.583

    Diferente do que propõe a pergunta, a correlação linear é inferior a 0,6

    GAB = Errado

  • COV (X,Y) / DP(X).DP(Y)

    COV (X, Y) = E(XY) - E(X).E(Y) => 0,5 - 0,36 = 0,14

    VAR(X) = VAR(Y) => 0,6.0,4 = 0,24

    UTILIZANDO MÉTODO RAIZ QUADRADA EASY

    25+24/2.RAIZ[25] => 4,9

    4,9/RAIZ[100] => 0,49

    0,49.0,49 => 0,24

    SUBSTITUI OS VALORES NA FÓRMULA E CORRE PRO ABRAÇO:

    COV (X,Y) / DP(X).DP(Y)

    0,14 / 0,24 => 0,5...

    0,5 < 0,6

    ERRADO!


ID
1194316
Banca
CESPE / CEBRASPE
Órgão
STF
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Julgue o  item  seguinte , relativo à  técnica de amostragem.

Considerando que um pesquisador, ao estimar a taxa de homicídios ( R) em determinada unidade da Federação, tenha coletado uma amostra de municípios para se obter a estimativa r da taxa R, que X é o tamanho da população de um dos municípios e Y é a quantidade de homicídios ali registrados no ano, então o viés do estimador razão para a taxa de homicídios

E [r - R] ≈   1  {Rσ2x  - ρxy  x σy x σx}
                μ 2x


será pequeno sempre que Rσ2x > cov(XY)  em que μ x < ∞ é a média do tamanho populacional dos municípios, σx e σy; são os respectivos desvios padrão, e ρXY é a correlação entre X e Y.

Alternativas
Comentários
  • observe que  ρxy  x σy x σx = sxy

  • não sei nem errar!


ID
1198060
Banca
FGV
Órgão
DPE-RJ
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Suponha que no modelo de regressão linear múltipla Yi = α + β.Xi + y.W εi +  , onde Y é a variável dependente, X e W são as ditas independentes, ε é o termo estocástico e α ,β  e y os parâmetros. Depois de estimados os parâmetros, por MQO, e obtidos os resíduos, a inferência detectou algumas divergências com relação aos pressupostos clássicos. Observou-se uma alta correlação entre X e W, a presença de causalidade de Y sobre W e variâncias dos resíduos não constantes. Consideradas nesta ordem e tudo mais constante, tais divergências implicam, respectivamente,

Alternativas
Comentários
  • eficiência: variância constante

  • Multicolinearidade ocorre quando algumas variáveis preditoras (independentes) no modelo estão correlacionadas a outras variáveis preditoras.

     


ID
1232344
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Com relação à análise de regressão linear, julgue os itens que se seguem.

Em um modelo de regressão linear, se a variável explicativa e a variável resposta não se correlacionam, o coeficiente de determinação seria próximo de 0. Além disso, se o coeficiente de determinação fosse próximo de 0, as variáveis explicativa e resposta seriam independentes.

Alternativas
Comentários
  • e

    independência acarreta correlação igual a zero, porém, a recíproca não é verdadeira

  • Errado, pois elas não teriam relação linear, mas poderiam ter outro tipo de relação, assim, não podendo afirmar que são independentes!

  • Gab: errado 

    coeficiente linear de Pearson é um grau de relação entre duas variáveis quantitativas e exprime o grau de correlação através de valores situados entre -1 e 1. Basicamente ele mensura a correlação entre duas variáveis LINEARES. Com isso, podemos afirmar que se as variáveis foram quantitativas e lineares e r = 0 elas não possuem relação, no entanto não podemos dizer que elas são independentes. 

    Ela pode, por exemplo, ser não linear, mas o que é não linear? Uma função x² por exemplo. Pra isso você pode utilizar outros coeficientes para analisar a correlação entre essas diferentes variáveis. Ex: 

    Coeficiente de Correlação de Spearman - Não precisa ser linear e nem quantitativa.   

    Coeficiente de Correlação de Kendall - Especificamente para variáveis ordinais.

  • Correlação

    • Variáveis independentes → Covariância = 0 e Correlação = 0, entretanto o contrário eu não posso garantir

    (CESPE 2013) A correlação nula entre duas variáveis indica que há independência entre essas variáveis. (ERRADO, se as variáveis são independentes com certeza a covariância será 0 e a correlação será 0, mas o contrário eu não posso garantir)

    (CESPE 2010) Se o coeficiente de correlação linear entre as variáveis é igual a zero, então não existe nenhuma relação entre as variáveis X e Y. (ERRADO)

    (CESPE 2011) A correlação linear entre X e Y é nula; disso se conclui que ambas são independentes. (ERRADO)

    (CESPE 2014) Em um modelo de regressão linear, se a variável explicativa e a variável resposta não se correlacionam, o coeficiente de determinação seria próximo de 0. Além disso, se o coeficiente de determinação fosse próximo de 0, as variáveis explicativa e resposta seriam independentes. (ERRADO)

    Também é importante saber

    • - 1 a 1 (correlação perfeita)

    (CESPE 2021) Os valores de covariância podem variar de –1 a +1. (Errado, correlação)

    (CESPE 2020) Em se tratando da técnica de correlação, utiliza-se uma escala de 1 a -1 para indicar o grau de similaridade entre duas variáveis distintas. (CERTO)

    (CESPE 2016) A correlação entre x e y é maior que 1. (ERRADO, varia de -1 a 1, logo, não há como ser superior a 1)

  • Quando as variáveis são INDEPENDENTES

    • correlação e R² ≅ 0

    Quando a correlação e R² ≅ 0, posso dizer que as variáveis são independentes?

    • Não, porquê elas podem ter alguma outra relação não medida pelo coeficiente de correlação linear

ID
1232353
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Com relação à análise de regressão linear, julgue os itens que se seguem.

Um modelo de regressão linear múltipla com duas variáveis explicativas será inequivocamente ajustado se essas variáveis forem proporcionais.

Alternativas
Comentários
  • e

    http://www.portalaction.com.br/919-multicolinearidade

  • se essas variáveis forem proporcionais teremos multicolinearidade, o que não é desejado no ajuste do modelo

  • errado


ID
1238671
Banca
FCC
Órgão
DPE-RS
Ano
2013
Provas
Disciplina
Estatística
Assuntos

As variáveis aleatórias X e Y representam, respectivamente, os anos de experiência e os salários, em reais, dos empregados em um determinado ramo de atividade. Sejam os pares (x1, y1), (x2, y2), . . . , (xn, yn), em que xi e yi (1 ≤ i ≤ n) são os valores de X e Y, respectivamente. Para prever yi em função de xi , optou-se por utilizar uma forma de relação linear entre X e Y tal que yi = 2.000 + 45xi, obtida pelo método dos mínimos quadrados, verificando-se que nem todos os pontos pertencem a uma mesma reta. Se o coeficiente de correlação linear entre X e Y for igual a r (r ≠ zero), então

Alternativas
Comentários
  • A) r= 1 errada - Pois na questão ele fala que nem todos os pontos passam pela reta, daí com isso é possível perceber que não tem ocmo a correlação ser =1 pois para isso todos os pontos tem que estar na reta;

    B) multiplicando por 0,5 todos os valores xi e por 0,8 todos os valores yi , verifica-se que o novo coeficiente de correlação linear dos dois novos conjuntos é igual a 0,4r. errada - Pois, quando multiplicamos os valores de xi e yi por constantes o valor da correlação (r) permanece o mesmo, ele só altera o sinal caso o valor das constantes multiplicadas seja de sinais diferentes.

    C) é possível que r seja negativo. errada - Pois a equação da reta dada é yi = 2.000 + 45xi, com isso é possível perceber que o b (coeficiente angular) da equação é igual a 45, como ele é positivo a correlação também é necessariamente positiva.

    D) r = 0,45. (pule para a alternativa E, pois, eu pelo menos, não sei como calcular o r nessa questão e acho melhor não perder tempo calculando kkkk

    E) o valor de r é positivo. CORRETA . Pois a equação da reta dada é yi = 2.000 + 45xi, com isso é possível perceber que o b (coeficiente angular) da equação é igual a 45, sendo ele positivo necessariamente o r vai ser positivo.

  • mt bom!


ID
1243453
Banca
FEPESE
Órgão
Prefeitura de Florianópolis - SC
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Com o objetivo de diminuir os casos de afogamento na temporada de 2015, uma prefeitura de uma cidade litorânea encomendou estudos estatísticos que identificassem prováveis fatores de risco.

A empresa contratada comparou os dados disponíveis e entregou um relatório com a seguinte tabela.

             Consumo de sorvete                 Quantidade de
                    no mês (kg)                     afogamentos no mês
                    100.000                                          8
                     75.000                                           6
                     88.000                                           7
                     50.000                                           4
                     25.000                                           1

Aplicando o modelo estatístico de regressão linear aos dados da tabela abaixo, podemos afirmar que:

Alternativas
Comentários
  • Uma correlação espúria é uma associação estatística existente entre duas variáveis, mas onde não existe nenhuma relação causa-efeito entre elas (tomar sorvete X afogamento). Pode ocorrer por pura coincidência ou por causa de uma terceira variável. Neste caso, por mais que haja uma correlação linear, supõe ser hipotética - espúria, não necessariamente indica-se causalidade.


ID
1313620
Banca
CETRO
Órgão
Prefeitura de São Paulo - SP
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Levando em consideração um teste de correlação cruzada, pode-se concluir que

Alternativas
Comentários
  • Recursos para o ISS SP

    por Vítor Menezes em 16/05/2014

    Olá pessoal, trago hoje recursos para a prova de RLQ/Financeira/Estatística do ISS SP.


    41) Levando  em  consideração  um  teste  de  correlação cruzada, pode-se concluir que
    (A)  a  relação  entre  a  variável  de  entrada  e  de  saída  é binomial.
    (B)  somente é usado com variáveis discretas.
    (C)  pode haver atraso entre as variáveis.
    (D)  para  variáveis  fortemente  não  lineares  é  um  teste perfeito.
    (E)  pode  ser  utilizado  para  entradas  de  variáveis discretas e saídas com variáveis discretas.

    Esta questão cobra o conteúdo de correlação cruzada, que pode ser usada para medir a correlação de um sinal com ele mesmo, atrasado, ou seja, deslocado no tempo.

    Este assunto não está previsto no edital do concurso, devendo a questão ser anulada.

    ESTATÍSTICA – 1. Estatística Descritiva: Gráficos, tabelas, medidas de posição e de variabilidade. 2. Probabilidade: Conceito, axiomas e distribuições (binominal, normal, poisson, qui-quadrado etc.). 3. Amostragem: Amostras casuais e não casuais. Processos de amostragem, incluindo estimativas de parâmetros. 4. Inferência: Intervalos de confiança. Testes de hipóteses para médias e proporções. 5. Correlação e Regressão.

    A banca poderia argumentar que a menção genérica a "correlação", no item 5, daria a possibilidade de cobrança da correlação cruzada. No entanto, observe-se que o estudo de correlação e regressão trata de:

    • avaliar o comportamento simultâneo de duas variáveis, verificando-se o grau de associação linear entre elas
    • estudar que modelo linear pode expressar a relação entre tais variáveis

    Observem que só tratamos, portanto, de variáveis aleatórias.

    Em momento algum este estudo inclui o fator tempo aplicado a determinada variável. Assim, podemos estudar a correlação entre temperatura e altitude (duas variáveis diferentes), mas não temos como estudar a correlação da temperatura consigo mesma, pois isso envolveria modelar a temperatura como um processo estocástico, o que não foi previsto no edital.

    Por este motivo, correlação cruzada é estudada apenas em livros que tratam de processos estocásticos ou séries temporais, nunca em livros que falam simplesmente de regressão linear e correlação.

    Infelizmente, estou sem meus livros aqui para melhor fundamentar o recurso. Mudei recentemente para São Paulo, e meus livros estão todos em minha querida Jacareí. Fico devendo então um suporte bibliográfico.

    fonte: https://www.tecconcursos.com.br/dicas-dos-professores/recursos-para-o-iss-sp


ID
1331890
Banca
Quadrix
Órgão
DATAPREV
Ano
2012
Provas
Disciplina
Estatística
Assuntos

Determine o coeficiente de correlação linear e avalie se a correlação é ou não é forte entre as variáveis X e Y, cujos valores são dados na tabela seguinte.


                  X        1   3   4   6   8   9   11   14
                  Y        1   2   4   4   5   7    8     9


Dados: √14 ≅ √33 ≅5,7

Alternativas
Comentários
  • Precisaria ter a raiz de 14 que é de 3,7

    r = (yi - ymed) X (xi-Xmed) / (yi-ymed)2 X (xi-xmed)2

    o segredo para agilizar os calculos raiz de 56 (yi-ymedio)2= 2^3 X 7 ou 2^2 X14 e raiz de 132 (xi-xmedio)2 = 2^2X33 ai é so tirar o 2 da raiz e substituir os valores dados.


ID
1630465
Banca
CESGRANRIO
Órgão
IBGE
Ano
2010
Provas
Disciplina
Estatística
Assuntos

A metodologia geoestatística procura extrair, de uma aparente aleatoriedade dos dados coletados, as características estruturais probabilísticas do fenômeno regionalizado, ou seja, uma função de correlação entre os valores situados em uma determinada vizinhança e a direção no espa- ço amostrado. O método de estimativa básico utilizado é o da krigagem, por meio do qual são resultados semivariogramas, que expressam o comportamento espacial da variável regionalizada.

Em um semivariograma, a distância a partir da qual as amostras passam a não possuir correlação espacial, e a relação entre elas torna-se aleatória é denominada

Alternativas
Comentários
  • Também chamada de ALCANCE


ID
1630597
Banca
CESGRANRIO
Órgão
IBGE
Ano
2010
Provas
Disciplina
Estatística
Assuntos

Um bom teste, como qualquer outro instrumento de medida, deve ser fidedigno e válido. Normalmente são utilizados três métodos para estimar a fidedignidade de um teste: teste-reteste, formas paralelas e Método das duas Metades. O Método das duas Metades é a correlação entre os escores do estudante em

Alternativas

ID
1670932
Banca
FCC
Órgão
TRT - 3ª Região (MG)
Ano
2015
Provas
Disciplina
Estatística
Assuntos

O modelo abaixo foi ajustado a uma série temporal de produção de certo produto:

Zt = at + 0,5Zt−1 + 0,5at−1 , t = 1,2, ...


onde at é o ruído branco de média zero e variância 3.

Considere:

I. As condições de estacionariedade e invertibilidade de Zt estão satisfeitas.

II. As funções de autocorrelação e autocorrelação parcial de Zt decaem exponencialmente após o lag 1.

III. A variância de Zt é igual a 7.

IV. A função de autocorrelação de Zt independe do valor da variância do ruído.

Está correto o que consta em


Alternativas
Comentários
  • I. As condições de estacionariedade e invertibilidade de Zt estão satisfeitas.

    Correto. Os parâmetros do modelo em módulo são menores do que 1.

    II. As funções de autocorrelação e autocorrelação parcial de Zt decaem exponencialmente após o lag 1.

    Correto. Trata-se de um ARMA(1,1) que tem essa natureza na fac e facp.

    IV. A função de autocorrelação de Zt independe do valor da variância do ruído.

    Correto. Como estamos diante de uma série estacionária, a função de autocorrelação de Zt independe do valor da variância do ruído.

    Logo, de acordo com as disposições das alternativas, o item III também está correto.

    Letra D

     

     

  • https://www.bauer.uh.edu/rsusmel/phd/ec2-4.pdf


ID
1779436
Banca
FUNIVERSA
Órgão
Secretaria da Criança - DF
Ano
2015
Provas
Disciplina
Estatística
Assuntos

Dadas duas variáveis X e Y, que apresentam as seguintes propriedades: E (X)=30; E (Y)=40; E(X²)= 1300; E(Y²)=2500 e E (XY)=1500, é correto afirmar que a correlação linear de Pearson entre X e Y é igual a 

Alternativas
Comentários
  • O coeficiente de correlação ρX, Y entre duas variáveis aleatórias X e Y com valores esperados μX e μY e desvios padrão σX e σY é definida como:

    cov(X,Y) / σX σY   então     E((X -μX) x (Y - μY) / σX σY  

    onde E é o operador valor esperado e cov significa covariância. Como μX = E(X), σX² = E(X²) − E²(X) e , do mesmo modo para Y, podemos escrever também

    E(XY) - E(X)x(EY) / [√(E(X2)xE2(X))  x √(E(Y2)xE2(Y))]

    Logo, temos o seguinte:(1500 - 40x30) / [√(1300 - 30^2) x √(2500 - 40^2)] = 300 / [√400 x √900) = 300 / ( 20 x 30) = 1/2

  • A questão exigiu a fórmula alternativa da variância, média dos quadrados subtraído do quadrado da média.

    Fórmula do coeficiente de correlação linear: cov(x,y) / Sx * Sy.

    Passo a passo: Encontrar a covariância, desvio de x e desvio de y, e por fim montar a fórmula.

    1° Covariância de (X,Y):

    cov(x,y) = E(XY) - E(X) * E(Y)

    cov(x,y) = 1500 - 30 * 40

    cov(x,y) = 1500 - 1200

    cov(x,y) = 300

    2° Desvio padrão de X: Utilizando a fórmula alternativa da variância.

    var² (x) = E(xi²) - X² (média de X ao quadrado).

    var² (x) = 1300 - 900

    var² (x) = 400

    Sx = O desvio padrão é a raiz quadrada da variância = 20.

    3° Desvio padrão de Y: Utilizando a fórmula alternativa da variância.

    var² (y) = E(yi²) - Y² (média de Y ao quadrado).

    var² (y) = 2500 - 1600

    var² (y) = 900

    Sy: O desvio padrão é a raiz quadrada da variância = 30.

    4° Montar a fórmula do coeficiente de correlação:

    r = cov(x,y) / Sx * Sy

    r = 300 / 20 * 30 (corta corta)

    r = 3 / 2 * 3

    r = 3 / 6 = 1/2

    O caminho é difícil. Então, tenha fé, força e perseverança e não pare de lutar enquanto não ganhar a batalha. Vamos conseguir!

  • GAB C

    Correlação = COV / dpx . dpy

    COV = 1500 - 30 . 40 =

    300

    dpx = √ 1300 - 900 =

    20

    dpy = √ 2500 - 1600 =

    30

    R = 300 / 20 . 30

    R = 0,5 ou 1/2


ID
1785799
Banca
Marinha
Órgão
CAP
Ano
2015
Provas
Disciplina
Estatística
Assuntos

Quando duas variáveis estão ligadas por uma relação estatística, pode-se dizer que entre elas existe uma:

Alternativas

ID
1859680
Banca
FGV
Órgão
Prefeitura de Recife - PE
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Uma variável aleatória X tem média igual a 2 e desvio padrão igual a 2. Se Y = 6 – 2X, então a média de Y, a variância de Y e o coeficiente de correlação entre X e Y valem, respectivamente,

Alternativas
Comentários
  • Gabarito letra C

     

    A Média de Y é influenciada pela soma, subtração e multiplicação e divisão Y = 6 - 2.2 = 2

     

    Variancia influencia somente pela multiplicação ou divisao - 2. (2) = 4^2 = 16

     

    Coeficiente de correlação é influenciado somente pelo sinal mais ou menos = -1 (nao é influenciado por nenhuma operação, somente pelo sinal mais ou menos)

  • Coef. correlação ENTRE X e Y-> CR(x)- CR(Y)

    CR(X)= DP(X)/ MEDIA(X) = 2/2 =1

    CR(Y)= 4/2= 2

    Cr(x)- Cr(y)= 1-2 = -1

  • Para a média basta fazer a seguinte substituição::

    Y = 6 - 2X

    MédiaY = 6 - 2.MédiaX

    MédiaY = 6 - 2 . 2

    MédiaX = 2

    Para a variância, nós devemos ignorar aquele termo que está apenas somando/subtraindo (no caso o 6), e elevar ao quadrado o termo que está multiplicando X (o -2), ficando:

    VariânciaY = (-2) x VariânciaX

    VariânciaY = 4 x 4

    VariânciaY = 16

                   Já podemos marcar a alternativa C, que é o gabarito. Vamos agora calcular o coeficiente de correlação entre X e Y. Para isto, lembre que:

    Correlação(a.X + b, c.Y + d) = sinal(ac) Correlação(X, Y)

    Correlação (X, -2X + 6) = sinal(1.-2) Correlação (X,X)

    Correlação (X, -2X + 6) = - Correlação (X,X)

    Correlação (X, -2X + 6) = - 1

    Resposta: C


ID
1859686
Banca
FGV
Órgão
Prefeitura de Recife - PE
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Numa regressão linear simples, obteve-se um coeficiente de correlação igual a 0,78. O coeficiente de determinação é aproximadamente igual a

Alternativas
Comentários
  • coeficiente de determinação, também chamado de R², é uma medida de ajustamento de um modelo estatístico linear generalizado, como a regressão linear, em relação aos valores observados. O R² varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue explicar os valores observados.


    Corficiente de Correlação (R)

    R=0,78²=0,6084

  • O Coeficiente de Correlação é a raiz quadrada do Coeficiente de Determinação.


ID
1877569
Banca
FGV
Órgão
TJ-RO
Ano
2015
Provas
Disciplina
Estatística
Assuntos

Seja X = número de anos de condenação e Y = nível de renda do condenado (mil reais). São fornecidas ainda as seguintes informações:


Var(X) = 25; Var (Y) = 16 e Var (X+Y) = 21


Assim sendo, a correlação (Pearson) entre X e Y é igual a: 

Alternativas
Comentários
  • Fiz essa questão e a resposta foi letra D) -0.5.

    Usei a propriedade Var (X+Y)=Var(X)+Var(Y)+2cov(X,Y)

    achei cov(X,Y)=-10. dai, r=-10/(20)=-1/2. Alguém fez e achou letra B)??

  • Fiz essa questão e a resposta foi letra D) -0.5.

    Usei a propriedade Var (X+Y)=Var(X)+Var(Y)+2cov(X,Y)

    achei cov(X,Y)=-10. dai, r=-10/(20)=-1/2. Alguém fez e achou letra B)??


ID
1916383
Banca
MPE-RS
Órgão
MPE-RS
Ano
2015
Provas
Disciplina
Estatística
Assuntos

Para se verificar a natureza e a extensão da associação linear entre duas variáveis, deve-se usar

Alternativas
Comentários
  • WHAT??? kkk

  • GABARITO: letra D

     

    Em estatística descritiva, o coeficiente de correlação de Pearson, também chamado de "coeficiente de correlação produto-momento" ou simplesmente de "ρ de Pearson" mede o grau da correlação (e a direção dessa correlação - se positiva ou negativa) entre duas variáveis de escala métrica (intervalar ou de rácio/razão).

     

    Na estatística, o coeficiente de correlação de postos de Spearman, chamado assim devido a Charles Spearman e normalmente denominado pela letra grega ρ (rho), é uma medida de correlação não-paramétrica, isto é, ele avalia uma função monótona arbitrária que pode ser a descrição da relação entre duas variáveis, sem fazer nenhumas suposições sobre a distribuição de frequências das variáveis.

    (Fonte: Wikipédia)


ID
2027182
Banca
Aeronáutica
Órgão
CIAAR
Ano
2009
Provas
Disciplina
Estatística
Assuntos

Preencha as lacunas abaixo e, em seguida, assinale a alternativa correta.

Uma das técnicas de análise multivariada tem por objetivo explicar a estrutura de variância e covariâncias de um vetor aleatório, composto de p-variáveis aleatórias, através de combinações lineares das variáveis originais. Estas combinações são chamadas de ________________________ e são ______________________________.  

Alternativas

ID
2076145
Banca
CESGRANRIO
Órgão
IBGE
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Se duas variáveis aleatórias, X e Y, têm correlação linear negativa, então:

Alternativas
Comentários
  • E(X)+Y)= E(X) + E(Y) - 2 COV (XY)

  • Observem que D e E são logicamente inversas. A resposta tem que  ser uma das duas, se uma é falsa a outra tem que ser verdadeira.

  • V(aX) = a^2 V(X)

     

    V(bY) = b^2 V(Y)

     

    V(aX) + V(bY) = a^2 V(X) + b^2 V(Y)

     

    V(aX+bY) = a^2 V(X) + b^2 V(Y) + 2.a.b.Cov(x,y)

     

    Corr(x,y) = Cov(x,y)/DP(X).DP(Y)

     

    Valor Negativo . DP(X) . DP(Y) = Cov(x,y)

     

    Cov(x,y) = Valor Negativo, pois DP(X) . DP(Y) > 0.

     

    Logo: 

     

    V(aX+bY) = a^2 V(X) + b^2 V(Y) - 2.a.b.Cov(x,y)

     

    V(aX) + V(bY) > V(aX+bY)

     

    a^2 V(X) + b^2 V(Y) > a^2 V(X) + b^2 V(Y) - 2.a.b.Cov(x,y)

     

    Resposta: A soma das variâncias de X e Y é estritamente maior do que a variância de X + Y.

     

    E. 

     

  • Vamos usar um exemplo (demorei pra entender)

    Var (x) = 10

    Var (y) = 10

    Soma das duas 20

    Beleza,

    Agora, se usarmos (x+y) será x+y + 2.cov

    A nossa covariância é negativa. E como sei disso ?

    Eles falam que existe "correlação linear negativa", quando isso ocorre quem negativa a correlação é a cov, visto que os desvios são não negativos.

    Vamos dizer que a cov é -1

    então, o cálculo será 10+10+ 2*(-1)= 18

    Logo, valida a ALTERNATIVA E.

    Qualquer erro, mandem msg.


ID
2080036
Banca
CESPE / CEBRASPE
Órgão
TCE-PR
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Se satisfação no trabalho e saúde no trabalho forem indicadores com variâncias populacionais iguais a 8 e 2, respectivamente, e se a covariância populacional entre esses indicadores for igual a 3, então a correlação populacional entre satisfação no trabalho e saúde no trabalho será igual a

Alternativas
Comentários
  • X - variável satisfação no trabalho
    Y - variável saúde no trabalho

    Dados da questão:

    CoV (X,Y) = 3

    VAR(X) = 8; 

    VAR (Y) = 2; 

    Coeficiente de correlação (p)

    p = CoV (X,Y)/ (desvpadX).(desvpadY)

    p = 3 / (raiz de 8). (raiz de 2)

    p = 3 / (raiz de 16)

    p = 3/4

    p=0,75

     

  • CovariânciaXY

        σX *  σY

     

    Obs.: √ da variância teremos o desvio padrão. 

     

     Gab. Letra E.

  • Os professores de estatística do QC já se aposentaram?

  • covariância = cov=3

    σ²(satisfação)= 8;

    σ²(saúde)= 2;

    correlação = cov/(σx *  σy)

    3/(Raiz(2*8)

    3/4= 0.75

  • Correlação = COV(X,Y) / desvio padrão de X . desvio padrão de Y

    Desvio padrão eh a raiz da variância. A variância de X e Y foram dadas. 2x8 = 16. Raiz de 16 eh 4.

    A questão deu a COV(X,Y) = 3.

    -> 3/4 = 0,75.

    GAB. E

  • GABARITO LETRA "E"

    Se as variâncias da satisfação e da saúde são 8 e 2, respectivamente, então seus desvios padrões √8 e √2.

    A correlação é calculada assim: Correlação (X, Y) = Covariância (X, Y) / Desvio Padrão ( X ) x Desvio Padrão ( Y )

    Aplicando essa fórmula ao nosso caso:

    Correlação (satisfação, saúde) = 3 / √8 x √4

    Correlação (satisfação, saúde) = 3 / √16

    Correlação (satisfação, saúde) = 3 / 4

    Correlação (satisfação saúde)= 0,75

    FONTE: Prof. Arthur Lima

    "Se não puder se destacar pelo talento, vença pelo esforço".

  • X - variável satisfação no trabalho

    Y - variável saúde no trabalho

    Dados da questão:

    CoV (X,Y) = 3

    VAR(X) = 8;

    VAR (Y) = 2;

    Coeficiente de correlação (p)

    p = CoV (X,Y)/ (desvpadX).(desvpadY)

    p = 3 / (raiz de 8). (raiz de 2)

    p = 3 / (raiz de 16)

    p = 3/4

    p=0,75


ID
2096365
Banca
CESPE / CEBRASPE
Órgão
TCE-PA
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Uma regressão linear simples é expressa por Y = a + b × X + e, em que o termo e corresponde ao erro aleatório da regressão e os parâmetros a e b são desconhecidos e devem ser estimados a partir de uma amostra disponível. Assumindo que a variável X é não correlacionada com o erro e, julgue o item subsecutivo, no qual os resíduos das amostras consideradas são IID, com distribuição normal, média zero e variância constante.

Se, em uma amostra de tamanho n = 25, o coeficiente de correlação entre as variáveis X e Y for igual a 0,8, o coeficiente de determinação da regressão estimada via mínimos quadrados ordinários, com base nessa amostra, terá valor R2 = 0,64.

Alternativas
Comentários
  • GABARITO CERTO

     

    √R² = p

    R² = p² = 0,8² = 0,64

  • Questão - Se, em uma amostra de tamanho n = 25, o coeficiente de correlação entre as variáveis X e Y for igual a 0,8, o coeficiente de determinação da regressão estimada via mínimos quadrados ordinários, com base nessa amostra, terá valor R² = 0,64.

    Coeficiente de Correlação = (R)² = (0,8)²

    Coeficiente de Determinação = = (0,8)² = 0,64

    Coeficiente de Determinação = Coeficiente de Correlação = (R)²

  • Só os PF's

  • Questão de Raciocínio Lógico Estatístico kkkk

    Primeiro: Colete os dados dispostos no enunciado.

    r = 0,8

    n = 25

    Segundo: Deve-se ter guardada a fórmula:

    r = √R²

    Aplicando-lhe: (cálculo de padaria, nem precisa queimar tanta pestana)

    0,8 = √R²

    0,8² = R²

    0,64 = R²

    OBS: (Apenas para relembrar).

    A fórmula de R² = SQE/SQT

    GABARITO = CERTO

  • Povo que morre de medo de estatística, apesar de uma matéria complicada, ainda há questões que dá para matar se souber os conceitos e tiver decorado as fórmulas, se der mole tu nem faz cálculo.

    Por isso, ESTUDE, se tiver com medo, vá com medo mesmo, se tu tem medo de estatística, vai se borrar quando ouvir um tiro vindo pro teu lado.

  • Se ele tivesse falado que era Correlação linear de Pearson eu tinha acertado! kkkkkkkk


ID
2096368
Banca
CESPE / CEBRASPE
Órgão
TCE-PA
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Uma regressão linear simples é expressa por Y = a + b × X + e, em que o termo e corresponde ao erro aleatório da regressão e os parâmetros a e b são desconhecidos e devem ser estimados a partir de uma amostra disponível. Assumindo que a variável X é não correlacionada com o erro e, julgue o item subsecutivo, no qual os resíduos das amostras consideradas são IID, com distribuição normal, média zero e variância constante.

Considere que as estimativas via método de mínimos quadrados ordinários para o parâmetro a seja igual a 2,5 e, para o parâmetro b, seja igual a 3,5. Nessa situação, assumindo que X = 4,0, o valor predito para Y será igual a 16,5, se for utilizada a reta de regressão estimada.

Alternativas
Comentários
  • y = a + b*x

    y = 2,5 + 3,5*4 = 16,5

  • Os cálculos são simples de resolver, porém a que se ter atenção ao enunciado, quando é dito que "x" é não correlacionado com o erro "e", dessa forma na analise do resultado calculado, desconsiderei o "e" e optei pelo CERTO na questão. Vejam, posso estar enganado em minha analise, principalmente por não ter havido comentários de professores ainda, mas acredito que esteja no caminho correto e não no mero chute. Abraços a todos.

  •  Método de mínimos quadrados ordinários-->Erro é igual a ZERO.

  • Basta só saber a fórmula da Regressão Linear:

    Y= a+b.x+e

    a=2,5

    b=3,5

    x=4,0

    e=0

    Y=2,5+3,5x4,0

    Y=16,5

    lembrando que:

    a=alfa=coeficiente linear

    b=beta=coeficiente angular

  • Método de mínimos quadrados ordinários = Erro é igual a ZERO

    Yi = α + β.Xi + εi

    Yi = 2,5 + 3,5.4 + 0

    Yi = 2,5 + 14

    Yi = 16,5

  • essa é aquela que você marca e antes de ver o resultado, pensa.. lá vem a pegadinha

  • Todo enunciado de estatística do CESPE só serve para botar medo àquele que não estudou. Tudo se resolve na base do 1+1.


ID
2111836
Banca
Marinha
Órgão
CAP
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Dado n pares de valores (X1, Y1) , (X2,Y2) ... (Xn , Yn) , a covariância entre as variáveis X e Y é dada por:

Alternativas

ID
2128432
Banca
Marinha
Órgão
CAP
Ano
2011
Provas
Disciplina
Estatística
Assuntos

O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação. Sendo r o coeficiente de correlação de Pearson, dado n o número de observações, é correto dizer que quando r = + 1:

Alternativas

ID
2183464
Banca
CESPE / CEBRASPE
Órgão
FUNPRESP-JUD
Ano
2016
Provas
Disciplina
Estatística
Assuntos

A respeito de risco e retorno e dos resultados clássicos relacionados à teoria de carteiras, julgue o seguinte item.

O risco de um portfólio composto por dois ativos reduz-se à medida que o coeficiente de correlação entre esses ativos aumenta.

Alternativas
Comentários
  • O risco de um portfólio composto por dois ativos AUMENTA à medida que o coeficiente de correlação entre esses ativos aumenta.

  • O aumento do coeficiente de correlação significa que se o valor do ativo A cai (desvaloriza), é maior a tendência de que o valor do ativo B também caia. Dessa forma, o risco AUMENTA, pois haveria desvalorização dos dois ativos ao mesmo tempo.

  • materia para doido

  • Lembrem-se que quanto maior for o coeficiente de relação maior será a relação direta entre as variáveis. Ou seja, se X sobe Y sobe também, mas se X cai Y vai cair também, aumentando assim os riscos. Numa relação inversa enquanto X cai Y sobe e vice versa, atenuando os riscos.

  • O coeficiente de variação (CV) nada mais é do que o desvio-padrão dividido pela média aritmética. Tal medida é útil, pois permite expor, em relação a ativos de risco, o quanto de risco existe (desvio-padrão) por unidade de retorno (média). Quanto maior for tal indicador, mais dispersa é a amostra estudada, ou maior é o risco do ativo avaliado.


ID
2197516
Banca
INSTITUTO AOCP
Órgão
EBSERH
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Seja o modelo MA(q) que pode ser escrito na forma Zt = θ(B)at em que Zt corresponde a série temporal modelada, θ(B) é o polinômio característico e at é o ruído branco aleatório, é correto afirmar que as funções de autocorrelação ρk, (FAC) e autocorrelação parcial, Φkk, (FACP) são, respectivamente:

Alternativas

ID
2219743
Banca
Marinha
Órgão
CAP
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Um estudo verificou que a correlação entre a velocidade de oscilação do centro de gravidade e o ângulo de abdução do quadril de militares era de 0,128. Nesse caso, pode-se afirmar que:

Alternativas

ID
2219812
Banca
Marinha
Órgão
CAP
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Sejam X e Y duas variáveis aleatórias com variâncias iguais a 25 e 4, respectivamente. Se a covariância entre X e Y é igual a 9, determine o coeficiente de correlação linear e assinale a opção correta.

Alternativas

ID
2293081
Banca
FCC
Órgão
TRT - 20ª REGIÃO (SE)
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Sejam f(k) e h(k), k = 1,2,3,..., respectivamente, as funções de autocorrelação e autocorrelação parcial de um modelo ARIMA(p,d,q). Considere as seguintes afirmações:
I. No modelo ARIMA(0,d,1), a região de admissibilidade do modelo é −1 < θ < 1, onde θ é o parâmetro de médias móveis do modelo.
II. No modelo ARMA(0,d, 2), f(1) = f(2) e f(k) = 0 para k > 2
III. No modelo ARIMA(1,d,1) f(k) decai exponencialmente após k = 1 e h(k) é dominada por senoides amortecidas após k = 1.
IV. No modelo ARIMA(1,d, 0) , f(1) = φ, onde φ é o parâmetro autorregressivo do modelo.

Está correto o que se afirma APENAS em

Alternativas

ID
2293084
Banca
FCC
Órgão
TRT - 20ª REGIÃO (SE)
Ano
2016
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações relativas à Análise Multivariada:

I. A análise de Correlação canônica é considerada uma técnica de interdependência, isto é, nessa análise as variáveis em questão não podem ser consideradas como dependentes ou independentes.
II. O propósito básico da análise discriminante é estimar a relação entre uma variável dependente categórica com base em um conjunto de variáveis independentes métricas.
III. A análise de agrupamentos é uma técnica analítica cujo objetivo é classificar uma amostra de entidades (indivíduos ou objetos) em um número menor de grupos mutuamente excludentes, com base nas similaridades entre as entidades.
IV. A análise de correspondência usa o qui-quadrado para padronizar os valores de contingência e formar a base para a associação ou similaridade.

Está correto o que se afirma APENAS em 

Alternativas

ID
2311477
Banca
IBFC
Órgão
EBSERH
Ano
2017
Provas
Disciplina
Estatística
Assuntos

Considere uma situação em que existam duas variáveis ordinais com 3 ou mais categorias cada uma delas. Nesse caso, a correlação mais indicada é a:

Alternativas

ID
2347384
Banca
FCC
Órgão
TRT - 5ª Região (BA)
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Sejam f (k) e g (k) as funções de autocorrelação e autocorrelação parcial de um processo de médias móveis de ordem 1, MA (1), com parâmetro de médias móveis igual a 0,5. Nessas condições, é correto afirmar que

Alternativas

ID
2349556
Banca
FCC
Órgão
TRT - 12ª Região (SC)
Ano
2013
Provas
Disciplina
Estatística
Assuntos

A análise de agrupamentos, também conhecida como cluster ou como análise de conglomerados, tem sido bastante utilizada na avaliação de metas de desempenho em instituições bancárias, empresariais e educacionais. Relativamente às técnicas de conglomerados, considere:
I. O conceito de similaridade é fundamental e as medidas de similaridade dominantes nas aplicações são medidas correlacionais, de associação e de distância.
II. A suposição de normalidade dos dados é fundamental.
III. As técnicas não hierárquicas requerem que o usuário especifique previamente o número de grupos (clusters) desejados.
IV. Se as variáveis de entrada apresentarem multicolinearidade, uma medida de distância que compensa a correlação é a de Mahalanobis.
Está correto o que consta APENAS em  

Alternativas

ID
2408257
Banca
Marinha
Órgão
Quadro Técnico
Ano
2016
Provas
Disciplina
Estatística
Assuntos

O agrupamento de dados em classes faz o cálculo do desvio padrão ser conduzido a certo erro. Assim, para que tal erro seja corrigido, subtrai-se um termo corretivo denominado

Alternativas

ID
2433367
Banca
Marinha
Órgão
Quadro Técnico
Ano
2015
Provas
Disciplina
Estatística
Assuntos

A respeito do coeficiente de correlação, analise as afirmativas abaixo e assinale, a seguir, a opção correta.


 I - O coeficiente de correlação independe das unidades de medida das variáveis x e y.

II - O coeficiente de correlação depende da origem em relação à qual os valores que o compõem são calculados.

III- O coeficiente de correlação é uma medida cujo valor se situa entre -1 e 1.

Alternativas

ID
2433418
Banca
Marinha
Órgão
Quadro Técnico
Ano
2015
Provas
Disciplina
Estatística
Assuntos

Com relação às características especiais das funções de autocorrelação (fac) e de autocorrelação parcial (facp) que apresentam os processos AR(p), MA(q) e ARMA(p,q) é correto afirmar que um processo

Alternativas

ID
2433427
Banca
Marinha
Órgão
Quadro Técnico
Ano
2015
Provas
Disciplina
Estatística
Assuntos

A correlação por postos de Spearman (rsp) é uma técnica não paramétrica utilizada para avaliar o grau de relacionamento entre as observações emparelhadas de duas variáveis, quando os dados se dispõem em postos. Assinale a opção que corresponde à fórmula pela qual pode ser testada a hipótese nula rsp =0, quando se deseja testar a significância de rsp para situações em que n é maior que 10.

Alternativas

ID
2433433
Banca
Marinha
Órgão
Quadro Técnico
Ano
2015
Provas
Disciplina
Estatística
Assuntos

Um oficial estatístico buscou relacionar as alturas atingidas por um projetil x com as alturas atingidas por um projetil y e, para isso, construiu dois modelos de regressão simples. No primeiro modelo, a variável y é dependente e x independente, resultando no modelo de regressão y=15+2,5x. Para o segundo modelo, a variável x é dependente e y independente, resultando no modelo de regressão x=2+0,2y. Com base nesses resultados, assinale a opção que corresponde ao coeficiente de correlação linear entre as alturas x e y. 

Alternativas

ID
2460130
Banca
Marinha
Órgão
Quadro Técnico
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Sabe-se que o coeficiente de correlação entre as notas finais em estatística e cálculo I para uma turma de 30 alunos foi calculado como sendo 0,75. Determine o intervalo de confiança de 95% para μz, e assinale a opção correta.

Dado: log10 7 = 0,845

Alternativas

ID
2460157
Banca
Marinha
Órgão
Quadro Técnico
Ano
2014
Provas
Disciplina
Estatística
Assuntos

Calcule o tamanho mínimo necessário de uma amostra para que um coeficiente de correlação populacional seja significativamente diferente de zero, em um nível de significância de 0,01, sendo o coeficiente de correlação amostral 0,42, e assinale a opção correta.

Alternativas

ID
2481451
Banca
NC-UFPR
Órgão
UFPR
Ano
2013
Provas
Disciplina
Estatística
Assuntos

Considere duas variáveis aleatórias, X1 e X2, independentes, e ambas normalmente distribuídas com média 2,00 e variância 8,00. Seja Y = X1X2. Assinale a alternativa correta que apresenta o valor do coeficiente de correlação entre X1 e Y.

Alternativas

ID
2621413
Banca
Marinha
Órgão
CAP
Ano
2017
Provas
Disciplina
Estatística
Assuntos

Se a correlação linear entre duas variáveis é perfeita e positiva, então o valor de seu coeficiente de correlação linear é igual a

Alternativas

ID
2639005
Banca
FGV
Órgão
TJ-AL
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Os pressupostos do modelo de regressão linear simples estão relacionados às propriedades dos estimadores de Mínimos Quadrados Ordinários (MQO), Melhor Estimador Linear Não Tendencioso (BLUE) e Máxima Verossimilhança (MV).


Sobre essas vinculações, é correto afirmar que:

Alternativas

ID
2639014
Banca
FGV
Órgão
TJ-AL
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Após estimado um Modelo de Regressão Múltipla e obtidas as estimativas dos parâmetros, o passo seguinte é a análise da variância, através das somas de quadrados. A propósito estão disponíveis as seguintes informações:


SQE = soma de quadrados da equação = 2.400

SQR = soma de quadrados dos resíduos = 1.600

Tamanho da amostra n = 41

Número de regressores = 8

P(F8,32 > 3 ) = 0,9874

Assim sendo, é correto afirmar que:

Alternativas
Comentários
  • R² = SQE      R² = 2400       R² = 0,6 

           SQT               4000*

     

    *Como a questão não traz o valor de SQT será necessário encontrar esse valor. Para tal utilizaremos a fórmula: SQR = SQT - SQE

    1600 = SQT - 2400      1600 + 2400 = SQT     4000 = SQT

    Já dá pra eliminar a alternativa A! 

     

    Para o cálculo da estatística F, utilizaremos a seguinte fórmula:

                                       0,6                          0,075                         0,075                   F = 6

               k                           8                    F = ................            F = ................

    F = .................    F = .................                      0,4                           0,0125

             1 - R²                   1 - 0,6                          32

            n - k - 1               41 - 8 - 1

     

    GABARITO LETRA B 

     


ID
2639017
Banca
FGV
Órgão
TJ-AL
Ano
2018
Provas
Disciplina
Estatística
Assuntos

A multicolinearidade é uma das dificuldades que pode ocorrer no processo de estimação de Modelos de Regressão Múltipla. Em casos mais severos, a multicolinearidade chega a impossibilitar a obtenção de estimativa, mas mesmo quando tal não se dá, outros problemas podem advir.


Como exemplo, seria possível dizer que:

Alternativas

ID
2799475
Banca
CESPE / CEBRASPE
Órgão
Polícia Federal
Ano
2018
Provas
Disciplina
Estatística
Assuntos

    O intervalo de tempo entre a morte de uma vítima até que ela seja encontrada (y em horas) denomina-se intervalo post mortem. Um grupo de pesquisadores mostrou que esse tempo se relaciona com a concentração molar de potássio encontrada na vítima (x, em mmol/dm3 ). Esses pesquisadores consideraram um modelo de regressão linear simples na forma y = ax + b + ε, em que a representa o coeficiente angular, b denomina-se intercepto, e ε denota um erro aleatório que segue distribuição normal com média zero e desvio padrão igual a 4.
    As estimativas dos coeficientes a e b, obtidas pelo método dos mínimos quadrados ordinários foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram, respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi igual a 5 horas.

A respeito dessa situação hipotética, julgue o item a seguir.


O coeficiente de explicação do modelo (R2 ) foi superior a 0,70.

Alternativas
Comentários
  • PM= LS + LI /2

    10 +2,5 / 2 = 6,25

    errado, foi MENOR que 0,70.

    erros corrijam-me por favor

  • O examinador fez uma troca de símbolos, representando por a o que geralmente é representado por b.

    R² = quadrado do coeficiente de correlação

    R² = [Cov (x,y)]/dp(x) * dp(y)]²

    No caso dessa questão, o coeficiente que acompanha o x é o a, que é dado por:

    a = Cov (x,y) / var (x)

    2,5 = Cov (x,y) / 2,56

    Cov (x,y) = 6,4

    Substituindo na fórmula do R²

    R² = (6,4 / 1,6 * 5)²

    R² = 40,96 / 64

    R² = 0,64

    Gabarito: errado

  • ERRADO

    b =(r * Sy) / Sx

    r = (b * Sx) / Sy

    r = (2,5 * 1,6) / 5

    r = 0,8

    r² = 0,64 < 0,7

  • O coeficiente angular (2,5) da regressão é dado por:

    a = cov(X,Y) / var(X)

    Como o desvio padrão de X é 1,6, a sua variância é o quadrado disso, ou seja, 2,56. Assim:

    2,5 = cov(X,Y) / 2,56

    cov(X,Y) = 6,4

    A correlação entre X e Y é:

    Correlação(X,Y) = cov(X,Y) / (dpX . dpY)

    O desvio padrão de X é dpX = 1,6, e o desvio padrão de y é dpY = 5. Portanto,

    Correlação (X,Y) = 6,4 / (1,6 . 5) = 0,8

    O coeficiente de determinação é o quadrado da correlação, ou seja,

    R2 = 0,8^2 = 0,64.

    Item ERRADO

  • Essa prova é um murro na cara de quem está começando estudar a matéria..

  • GABARITO: ERRADO

    Fórmula:

    a = r x (dp(y)/dp(x))

    a -> coeficiente angular (a banca quis perguntar o candidato aqui!!! Geralmente "a" representa o intercepto...)

    r -> coeficiente de correlação linear

    dp(y) -> desvio padrão da variável y (variável a ser explicada no modelo de regressão)

    dp(x) -> desvio padrão da variável x

    A banca quer que encontremos r^2, que é o coeficiente de explicação/determinação, então:

    r = a x dp(x) / dp(y) = 2,5 x 1,6 / 5 = 4/5 = 0,8

    r^2 = 0,64

    Portanto, 0,64 <<< 0,7!!!

  • Reiterando os comentários explanados:

    r= coeficiente correlação linear é dado pelo produto entre o coeficiente angular (2,5) e o desvio padrão da variável aleatória x (1,6 mmol/dm^3), seguido por divisão pelo desvio-padrão da variável aleatória y (5 horas pós-mortem):

    r= a * Sx / Sy

    r= 2,5 x 1,6 / 5

    r= 0.8

    Assim, o coeficiente de explicação é dado pelo quadrado deste coeficiente de correlação linear, ou seja, 0,8^2= 0,64 (<0,70).

  • O coeficiente angular (2,5) da regressão é dado por:

    a = cov(X,Y) / var(X)

    Como o desvio padrão de X é 1,6, a sua variância é o quadrado disso, ou seja, 2,56. Assim:

    2,5 = cov(X,Y) / 2,56

    cov(X,Y) = 6,4

    A correlação entre X e Y é:

    Correlação(X,Y) = cov(X,Y) / (dpX . dpY)

    O desvio padrão de X é dpX = 1,6, e o desvio padrão de y é dpY = 5. Portanto,

    Correlação (X,Y) = 6,4 / (1,6 . 5) = 0,8

    O coeficiente de determinação é o quadrado da correlação, ou seja,

    R2 = 0,8^2 = 0,64.

    Item ERRADO

  • Vamos por partes, primeiro observem que a questão inverteu as funções das variáveis a e b.

    Então, a fórmula normal para resolver esse problema é: r * sy = b * sx.

    Onde r é o coeficiente de correlação; sy é o desvio padrão de y; sx desvio padrão de x; b é o coeficiente angular.

    --

    Para essa questão vamos inverter a fórmula também, ficando: r * sy = a * sx

    Vamos isolar o R para encontrarmos ele e depois elevar seu valor ao quadrado, ficando: r = (a * sx) / sy

    R = (2,5 * 1,6) / 5

    R = 4 / 5

    R = 0,8

    R² = 0,64

  • Dado a relação entre coeficiente de regressão linear (a, nesta questão), a correlação linear (r) e os desvios padrão das variáveis x e y (sx e sy, respectivamente), e que o coeficiente de determinação r² = (r)², temos:

    b = r . (sy/sx)

    2,5 = r . (5/1,6) ==> r = 2,5/3,125 ==> r = 0,8

    r² = (r)² ==> r² = r . r ==> r² = 0,8 . 0,8 = 0,64

    0,64 < 0,70 (Errado)

  • Assertiva E

    O coeficiente de explicação do modelo (R2 ) foi superior a 0,70.

  • Resolução da prova de estatística de papiloscopista com o Guilherme Neves, em vídeo aula - https://www.youtube.com/watch?v=VQO3E5imF_M

  • Questão sagaz. Tentarei explicar de forma simples meu passo a passo.

    A questão quer saber o valor do R-quadrado.

    Primeiro temos que achar o valor da Covariância, pois a partir daí facilmente calcularemos a Correlação e, a Correlação elevada ao quadrado É IGUAL AO R-quadrado (ou seja, possuem o mesmo valor). Vamos lá!

    o valor do Beta SEMPRE é o que multiplica o x, nesta questão é 2,5 (note que, na equação linear fornecida na questão o Beta é o "a" que multiplica o x). E o desvio padrão de X é 1,6.

    A formula Beta=COV/variância é útil p sabermos o valor de Beta, mas podemos encontrar a COV ou VAR também.

    2,5 = COV/1,6(elevo o desvio padrão ao quadrado pq devo dividir pela VAR). --> 2,5=COV/2,56..............COV=6,4

    Encontramos a Covariância.

    A Correlação é dada pela formula COV/desvio padrão de x . desvio padrão de y.

    O enunciado nos dá os referidos desvios. Portanto:

    CORR = 6,4/1,6 . 5

    CORR = 0,8

    Como salientei no inicio, R-quadrado = CORR elevada ao quadrado. Dessa forma, para finalizar:

    R-quadrado = 0,8 . 0,8 = 0,64

    GABARITO ERRADO, é INFERIOR a 0,70

  • Recomendo o vídeo do Guilherme Neves com as explicações das questões desta prova:

    youtu.be/VQO3E5imF_M

  • por que está todo mundo usando 1,6 como desvio-padrão de X? A questão diz que 1,6 é o desvio-padrão amostral? Dá no mesmo??

  • Existe uma fórmula que relaciona o coeficiente angular (valor que multiplica 'x') com a correlação linear. Para uma regressão do tipo, y = ax + b, temos:

    • a = r.(sy/sx), em que:

    a = coeficiente angular;

    r = correlação linear;

    sy = desvio padrão amostral de y;

    sx = desvio padrão amostral de x;

    Substituindo os valores que temos no enunciado na fórmula, temos:

    2,5 = r.(5/1,6)

    r = 0,8

    Mas a questão pede o coeficiente de determinação R² que o quadrado da correlação linear 'r'. Logo, R² = 0,8² = 0,64.

    Questão errada

  • A questão pede o coeficiente de explicação do modelo R².

    R²= SQM/STQ

    Calculamos os dois valores e jogamos na fórmula.

    SQM= a². Somatório (xi - x)²

    Ele forneceu na questão o desvio padrão de x=1,6 então a Var(x)= 2,56 (quadrado do dp)

    Sabendo que a Var(x) = Somatório (xi - x)² / n-1 ; então já temos o valor de Var(x)= 2,56 só substituir na fórmula:

    2,56= Somatório (xi - x)² / 101-1 ; então o Somatório (xi - x)² = 256

    Substitui na fórmula e encontra-se o (SQM) - SQM= 2,5² . 256 - SQM=1600

    Cálculo do valor de SQT:

    SQT = Somatório (yi - y)²

    Ele forneceu na questão o desvio padrão de y=5 então a Var(y)= 25 (quadrado do dp)

    Sabendo que a Var(y) = Somatório (yi - y)² / n-1 ; então já temos o valor de Var(y)= 25 só substituir na fórmula:

    25= Somatório (yi - y)² / 101-1 ; então o Somatório (yi - y)² = 2500

    Por fim substitui os valores encontrados na fórmula do coeficiente R²;

    R² = SQM/SQT

    R² = 1600/2500

    R² = 0,64 < 0,70

    GABARITO: ERRADO

  • Rumo à NASA.

  • R² = a² * (var(x) / var(y) )

    onde

    var(x) = (desvio padrão de x)²

    e

    var(y) = (desvio padrão de y)²

  • R² = SQM / SQT

    SQM = a² . ∑ (Xi - Xbarra)²

    Descobrir o ∑ (Xi - Xbarra)²

    Var(x) = [ ∑ (Xi - Xbarra)² ] / (n - 1)

    DP(x) = 1,6 (enunciado)

    Então Var(x) = DP(x)² = 1,6² = 2,56

    Var(x) = 2,56

    Aplicando na fórmula Var(x) = [ ∑ (Xi - Xbarra)² ] / (n - 1)

    2,56 = [ ∑ (Xi - Xbarra)² ] / 101 - 1

    passa o 100 multiplicando:

    2,56 . 100 = ∑ (Xi - Xbarra)²

    Então, ∑ (Xi - Xbarra)² =256

    Aplica na fómula para descobrir SQM

    SQM = a² . ∑ (Xi - Xbarra)²

    SQM = 2,5² . 256

    SQM = 6,25 . 256

    SQM = 1600

    -------------

    SQT = ∑ (Yi - Ybarra)²

    Descobrir o ∑ (Yi - Ybarra)²

    Var(y) = [ ∑ (Yi - Ybarra)² ] / (n-1)

    DP(y) = 5 (enunciado)

    Então, Var(y) = DP(y)² = 5² = 25

    Var(y) = 25

    Aplicando na fórmula Var(y) = [ ∑ (Yi - Ybarra)² ] / (n-1)

    25 = Var(y) = [ ∑ (Yi - Ybarra)² ] / (101 - 1)

    passa o 100 multiplicando:

    25 . 100 = ∑ (Yi - Ybarra)²

    Então, ∑ (Yi - Ybarra)² = 2500

    Voltando a fórmula do SQT = ∑ (Yi - Ybarra)²

    SQT = 2500

    ---------

    Aplicando na R² = SQM / SQT

    R² = 1600 / 2500

    R² = 0,64

  • Resolução em 15min54s

    https://www.youtube.com/watch?v=VQO3E5imF_M

  • Por que esse desgraçado trocou o a pelo b? Os cálculos ficaram demoníacos!

  • O exercício forneceu o valor de Beta (que no caso, ele chamou de A). A = 2,5.

    Uma das formas de se calcular o Beta (A) é: Cov(x,y) / Var(x).

    Assim sendo: 2,5 = Cov(x,y) / 2,56 (desvio padrão de X ao quadrado)

    Cov(x,y) = 2,5 * 2,56 = 6,4.

    Agora ele pede para calcular o R². Bem, é mais fácil calcular o R (índice de Correlação), que é dado por:

    R = Cov(x,y) / DP(x) * DP(y). A covariância já calculamos, que é 6,4. DP(x) = 1,6 e DP(y) = 5, tudo fornecido pelo exercício. Agora é só calcular:

    R = 6,4 / 1,6 * 5

    R = 6,4 / 8

    R = 0,8

    R² = 0,8² = 0,64

    0,64 < 0,70

    Gab Errado

  • esse pergunta e fisica quântica, nao estou vendo nada de estatistica ai nao

  • Por que este raciocínio esta errado?

    Corr(x;y)= Corr(x;2,5x+10) = sinal(1*2,5)*corr(x;x) = 1 -> R^2 = 1


ID
3007639
Banca
Marinha
Órgão
Quadro Técnico
Ano
2019
Provas
Disciplina
Estatística
Assuntos

Seja o modelo de regressão linear y = β0 + β1 x1 + β2 x2 + β3 x3 ajustado a 12 observações e sabendo-se que os coeficientes de correlação linear entre as variáveis X1 e X2, X1 e X3, X2 e X3 são respectivamente r12=0,82, r13=0,77 e r23=0,8, o coeficiente de correlação parcial linear entre X1 e X2, mantendo X3 constante, é dado por:

Alternativas

ID
3007750
Banca
Marinha
Órgão
Quadro Técnico
Ano
2019
Provas
Disciplina
Estatística
Assuntos

Seja a equação de regressão y= 2,93 — 38,56x, o coeficiente de determinação associado a essa reta é dado por 0,81. Qual é o coeficiente de correlação entre as variáveis x e y?

Alternativas
Comentários
  • O quadrado do coeficiente de correlação de Pearson é chamado de coeficiente de determinação ou simplesmente R. Como o valor de b é negativo, o coeficiente de correlação também recebe o sinal negativo, já que o numerador da fórmula de ambos é igual.

    Resposta: letra A


ID
3007756
Banca
Marinha
Órgão
Quadro Técnico
Ano
2019
Provas
Disciplina
Estatística
Assuntos

Considerando os modelos de regressão linear, coloque F (falso) ou V (verdadeiro) nas afirmativas abaixo e assinale a opção correta.

( ) Se duas variáveis são correlacionadas, pode-se concluir que há uma relação de causalidade entre elas.
( ) Ao verificar que uma variável dependente e uma independente estão estritamente relacionadas, pode-se concluir que o ajuste do modelo de regressão é bom.
( ) Os valores de y são preditos com base em valores dados ou conhecidos de x. A variável y é chamada variável independente, e a variável x variável dependente.

Alternativas
Comentários
  • I - Correlação NÃO é causalidade, ou seja, uma correlação forte entre duas variáveis não implica que há uma relação de causa-efeito entre elas. (F)

    II - A análise de resíduos tem uma importância fundamental na verificação da qualidade dos ajustes de modelos, ou seja, uma conclusão sobre o ajuste (bom ou não) está ligada a análise dos resíduos. (F)

    III - Y - variável explicada ou dependente (aleatória); X - variável explicativa ou independente, medida sem erro (não aleatória). (F)

    Resposta: letra C


ID
3009457
Banca
Exército
Órgão
EsFCEx
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Analise as afirmativas sobre o coeficiente de correlação de Pearson, colocando entre parênteses a letra “V”, quando se tratar de afirmativa verdadeira, e a letra “F” quando se tratar de afirmativa falsa. A seguir, assinale a alternativa que apresenta a sequência correta.


( ) O coeficiente de correlação de Pearson nulo significa que não existe associação linear ou não-linear entre as variáveis.

( ) O coeficiente de correlação de Pearson pode ser calculado como a média dos produtos dos valores padronizados de duas variáveis.

( ) O coeficiente de correlação de Pearson avalia o quanto a nuvem de pontos no gráfico de dispersão se aproxima de uma reta.

Alternativas

ID
3015520
Banca
FAURGS
Órgão
UFRGS
Ano
2018
Provas
Disciplina
Estatística
Assuntos

A análise de ____________ permite estudar a relação entre dois conjuntos de valores e quantificar o quanto um está relacionado com o outro, no sentido de determinar a intensidade e a direção dessa relação. Isto é, essa análise indica se, e com que intensidade, os valores de uma variável aumentam ou diminuem enquanto os valores da outra variável aumentam ou diminuem.

Assinale a alternativa que completa corretamente a lacuna do texto acima.

Alternativas
Comentários
  • A correlação linear (r) busca quantificar o quanto uma variável interfere na outra, qual forte é a relação entre si. A correlação entre as duas variáveis pode assumir valores apenas entre -1 e 1.

    Correlação Positiva: Quando a correlação entre duas variáveis é positiva, ela assume valores maiores que zero e menores que 1, e quando assumir valor igual a 1, temos uma correlação positiva perfeita. Portanto, na correlação positiva as duas variáveis são diretamente proporcionais, à medida que o valor de uma aumenta o valor da outra também aumenta, o mesmo ocorre quando diminui.

    Correlação Negativa: Quando a correlação entre duas variáveis é negativa, ela assume valores menores que zero e maiores que -1, e quando assumir um valor igual a -1, temos uma correlação negativa perfeita. Portanto, na correlação negativa, as duas variáveis são inversamente proporcionais, à medida que o valor de uma aumenta o da outra diminui.

    Correlação Nula: Quando a correlação entre duas variáveis é igual a zero, temos uma correlação nula. Nesse caso, não podemos afirmar que as duas variáveis são independentes entre si. Mas podemos afirmar o contrário, que quando tivermos duas variáveis independentes a correlação entre elas será nula.

    COMPLEMENTANDO

    A correlação linear, quantifica a intensidade da correlação entre as duas variáveis.

    A regressão linear, explica a relação entre as duas variáives.

    Créditos: Professor Rodolfo Schmidt e Patrícia Albernaz - Alfacon!

  • Gabarito: Letra A

    Coeficiente de correlação = R = quão intensa é a relação entre duas variáveis.


ID
3155356
Banca
VUNESP
Órgão
ARSESP
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Usando dados amostrais para estudar a correlação entre preço x da gasolina (em reais) e movimento y de vendas semanais (em litros) em postos de combustíveis de certa região, um grupo de pesquisadores verificou existir correlação linear entre as duas variáveis. A reta de regressão y = βx + α estabelecida no estudo tem coeficiente angular –4,50 e coeficiente linear 15500 (valores aproximados). Suponha que o preço R$ 4,00 por litro pertença ao intervalo de preços verificados na pesquisa. Usando a reta de regressão para uma estimativa do movimento de vendas,e considerando uma unidade de venda (ou posto) com preço da gasolina de R$ 4,00 por litro, então o movimento semanal de vendas (em litros) estimado nesse posto será de

Alternativas
Comentários
  • Equação da Regressão:

    y = -4,5x + 15.500

    Substituindo o que ele pede no enunciado, para x = 4

    y = -4,5 * 4 + 15.500

    y = - 18 + 15.500

    y = 15.482

  • a = coeficiente linear

    b= coeficiente angular ( sempre está junto do "x" que é a variável independente)

    Agora só substitua na fórmula dada no enunciado(equação da regressão)

    y = bx + a

    y = -4,5x + 15.500

    no caso, ele pede quanto será o movimento y de vendas semanais (em litros) quando o valor da gasolina for 4 reais, ou seja, qnd x=4

     

    y = -4,5(4) + 15.500

    y= 15.482


ID
3480919
Banca
INSTITUTO AOCP
Órgão
ADAF - AM
Ano
2018
Provas
Disciplina
Estatística
Assuntos

Considere as variáveis aleatórias X: nota na disciplina de Estatística e Y: nota na disciplina de matemática. Essas variáveis foram observadas em 5 alunos, ao final do semestre. Os dados estão apresentados a seguir.


X 4,0 5,0 6,0 7,0 8,0

Y 3,0 4,0 7,0 8,0 10,


Calcule o coeficiente de correlação de Pearson.

Alternativas
Comentários
  • Questão de aplicação de fórmulas:

    Correlação(X,Y) = Covariância(X,Y) / [ desvio(X) * desvio(Y) ]

    Covariância = E(XY) - E(X) * E(Y)

    ______________________________________________

    Precisamos calcular a Média, Variância e Desvio Padrão de cada uma das variáveis

    E(X) = (4+5+6+7+8)/5 = 6,00

    E(Y) = (3+4+7+8+10)/5 = 6,40

    E(XY) = (12 + 20 + 42 + 56 + 80) / 5 = 42,00

    V(X) = (4 + 1 + 0 + 1 + 4)/5 = 2,00

    V(Y) = [ (3-6,4)² + (4-6,4)² + (7-6,4)² + (8-6,4)² + (10-6,4)² ] /5 = 6,64

    desv(X) = raiz(Var(X)) = raiz(2,00) = 1,41

    desv(Y) = raiz(Var(Y)) = raiz(6,64) = 2,58

    ______________________________________________

    Covariância = E(XY) - E(X) * E(Y)

    Covariância = 42 - 6,0 * 6,4 = 3,60

    Correlação = 3,60 / (1,41 * 2,58) = 0,99

    ______________________________________________

    Bastante cálculo, mas é cargo de Estatístico.

    Serve pra revisão dos conceitos.

  • Respondi sem Calculo , da pra ver que a correlação é quase perfeita e positiva


ID
3858358
Banca
IBFC
Órgão
EBSERH
Ano
2020
Provas
Disciplina
Estatística
Assuntos

Para entender a relação entre a variável independente X e a variável dependente Y, foi calculado o coeficiente de correlação linear de Pearson r=0,90. Sabe-se que existe uma relação de causa-efeito entre X e Y, então foi proposto um modelo de regressão linear simples. Acerca da explicação que este modelo será capaz de fornecer sobre a variabilidade da variável resposta, assinale a alternativa correta.

Alternativas
Comentários
  • O coeficiente de correlação (R) quantifica o quão intensa é a relação entre as variáveis.

    O coeficiente de determinação (R²) EXPLICA o quanto uma variável interfere na outra.

    A questão pediu o valor de R².

    Eu fiz da seguinte forma:

    0,9*0,9= 0,81

    0,81*100= 81% (gabarito, letra C)

    O coeficiente de correlação é igual a raiz quadrada do coeficiente de determinação, logo, a raiz quadrada de 0,81=0,9

    Espero que tenha dado pra entender.

  • Interpretei da seguinte forma (sujeita a erros):

    A correlação é dada pelo produto da covariância entre as variáveis x e y, dividido pelo produto dos respectivos desvios-padrão.

    Como a correlação entre as variáveis necessariamente passa pelo produto de ambas, eu considerei que ambas valem 0,9. Logo x*y = 0,9*0,9 = 0,81.

    Para achar o percentual, é só multiplicar 0,81 por 100 = 81%

    GAB C

    Indo além do que a questão pede, se considerarmos que o coeficiente de pearson mede o comportamento de uma variável em relação a outra, e que esse coeficiente varia de -1 até + 1, então quanto mais próximo dos extremos (- 1, +1), podemos dizer que há uma forte correlação entre elas. Ou seja, uma varia, a outra varia também. O que vai influenciar e o sentido.

    + 1, varia no mesmo sentido. - 1 varia no sentido oposto.

    Erros, avisem por DM.


ID
3858409
Banca
IBFC
Órgão
EBSERH
Ano
2020
Provas
Disciplina
Estatística
Assuntos

Com relação ao coeficiente de correlação linear (r), é incorreto afirmar que:

Alternativas
Comentários
  • B

    Próximo do -1 e +1 é forte

    Próximo de 0(zero) é fraca

  • Gab B

    -1 ……………-0,5 ……………0……………0,5……………1

    pessoal, quanto mais perto do -1 ou do 1 será forte, se for no zera será fraca.

    obs: -1 ou 1 indica que o gráfico está em sintonia negativamente ou positivamente.

    assiti aí esse vídeo:

    youtube: canal matemática rápidola

    coeficiente de correlação linear ep 1


ID
4188145
Banca
CONSULPLAN
Órgão
CFC
Ano
2020
Provas
Disciplina
Estatística
Assuntos

O conceito de correlação visa explicar o grau de relacionamento verificado no comportamento de duas ou mais variáveis. Assim, a correlação entre duas variáveis indica a maneira como elas se movem em conjunto. Uma empresa obteve uma covariância entre as variáveis “nível de produção” e “nível da taxa de juros” de −0,63%; o desvio-padrão da primeira variável foi de 14,08% e da segunda de 4,65%. Ao analisar a correlação entre as variáveis, pode-se afirmar que:

Alternativas
Comentários
  • Conceito: Correlação é a covariância dividida pelo produto dos desvios padrões.

    Fica assim: -0,0063/0,1408x0,0465 = -0,96

    Como o resultado é negativo, próximo a -1, isso implica que existe uma correlação negativa.

    Isto é, caso uma aumenta, outro diminui.

    O único gabarito que atende essa opção é a letra d.

    Questão difícil de aplicação de conceito estatístico

    Gabarito  D. 

    Fonte: Curso Contabilidade facilitada - Gabriel Rabelo

  • muito obrigado

  • Não é necessário realizar cálculo nessa questão. É só saber que a correlação é calculada pela covariância dividida pelo produto dos desvios-padrão.

    Covariância

    s' . s''

    Se já sabe que a parte superior da equação é negativa e que a parte inferior será positiva, já sabe que o resultado será negativo porque negativo/positivo = negativo. Ou seja, é uma correlação negativa (ou inversa) que vai indicar que as variáveis não vão na mesma direção (um vai aumentar enquanto o outro diminuir).

  • r (coeficiente de correlação linear)

    .

    r = cov / Sx * Sy

    r = -63 / (14,08 * 4,65)

    r = -0,96

    .

    A correlação é significativa e negativa, portanto quando uma variável aumenta, a outra diminui.

  • Gravei um vídeo explicando a resolução desta questão.

    Segue o link: https://www.youtube.com/watch?v=SZRVmFh5fUg

  • Se a covariância é negativa, o comportamento são opostos.

    Se uma variável aumenta, a outra variável diminui.


ID
4838722
Banca
Exército
Órgão
EsFCEx
Ano
2020
Provas
Disciplina
Estatística
Assuntos

Considere uma relação entre o tamanho da população e o índice de criminalidade de 300 cidades. A correlação entre essas duas variáveis é r = 0,03. A esse respeito, é correto afirmar que

Alternativas
Comentários
  • PMMG

    (r = 1) ou próximo a 1, configura-se na existência de uma relação linear forte, positiva, no qual há uma tendência nos dados , que pode ser modelada por uma linha reta. 

    Percebe-se que o valor 0,03 há uma relação fraca, não podendo ser representado por uma linha reta, e portanto não existe uma relação linear.


ID
5329771
Banca
Exército
Órgão
EsFCEx
Ano
2020
Provas
Disciplina
Estatística
Assuntos

Considere uma relação entre o tamanho da população e o índice de criminalidade de 300 cidades. A correlação entre essas duas variáveis é r = 0,03. A esse respeito, é correto afirmar que

Alternativas

ID
5393524
Banca
CESPE / CEBRASPE
Órgão
PC-DF
Ano
2021
Provas
Disciplina
Estatística
Assuntos

     Determinado pesquisador reuniu dados de vários municípios brasileiros e estimou um modelo de regressão linear múltipla por mínimos quadrados ordinários. A variável dependente foi a taxa de homicídios, e as variáveis independentes incluíam variáveis, como, por exemplo, PIB per capita, média de anos de estudo, índice de Gini e outras variáveis socioeconômicas. Após a estimação, o pesquisador calculou a correlação entre os resíduos e as variáveis independentes e notou que essas correlações foram iguais a zero.

Com referência a essa situação hipotética, julgue o próximo item.

A ausência de correlação entre as variáveis independentes e os resíduos da regressão mostra que as variáveis independentes são exógenas.

Alternativas
Comentários
  • Item passível de anulação por fazer parte da aréa de econometria.

    Definição: Em modelos  , uma variável exógena refere-se a uma variável que é determinada fora do modelo e representa as  de um modelo. Em outras palavras, variáveis exógenas são fixadas no momento em que são introduzidas no modelo.

  • .JUSTIFICATIVA - ERRADO. A mecânica de cálculo dos coeficientes de Mínimos Quadrados Ordinários faz que os resíduos não sejam correlacionados com as variáveis independentes. Então, esse fato de não correlação não traz informação sobre o fato de as variáveis independentes serem ou não exógenas. 

  • Estatística para PF 2021 e PCDF 2021 veio totalmente fora da curva.

  • Acrescentando:

    Variáveis independentes -

    aquelas que são manipuladas

    variáveis dependentes-

    são apenas medidas ou registradas. 

    -------------------------------------------------------

    Os termos variável dependente e independente aplicam-se principalmente à pesquisa experimental, onde algumas variáveis são manipuladas, e, neste sentido, são "independentes" dos padrões de reação inicial, intenções e características dos sujeitos da pesquisa (unidades experimentais).Espera-se que outras variáveis sejam "dependentes" da manipulação ou das condições experimentais. Ou seja, elas dependem "do que os sujeitos farão" em resposta. Contrariando um pouco a natureza da distinção, esses termos também são usados em estudos em que não se manipulam variáveis independentes, literalmente falando, mas apenas se designam sujeitos a "grupos experimentais" baseados em propriedades pré-existentes dos próprios sujeitos. Por exemplo, se em uma pesquisa compara-se a contagem de células brancas (White Cell Count em inglês, WCC) de homens e mulheres, sexo pode ser chamada de variável independente e WCC de variável dependente.

    ---------------------------------------

    Bons estudos!!

  • Alguém poderia me dizer qual a utilidade disso para um agente de polícia? Um perito eu até acho razoável.


ID
5497423
Banca
FADESP
Órgão
Prefeitura de Marabá - PA
Ano
2019
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações:
I. a rotação VARIMAX tem por característica o fato de minimizar a ocorrência de uma variável possuir altas cargas fatoriais para diferentes fatores;
II. o modelo matemático da Análise de Fator pode ser expresso por Y = ATX , onde AT, são as cargas fatoriais e X representa os fatores comuns;
III. a rotação ortogonal mantém os fatores perpendiculares entre si, isto é, correlacionados entre eles;
IV. o objetivo principal da Análise de Fator (Análise Fatorial) é identificar fatores não diretamente observáveis a partir da correlação entre um conjunto de variáveis.
Estão/Está correto(s) o(s) itens/item 

Alternativas

ID
5497429
Banca
FADESP
Órgão
Prefeitura de Marabá - PA
Ano
2019
Provas
Disciplina
Estatística
Assuntos

Considere as seguintes afirmações:
I. Massa é dada pelas frequências divididas pelo total, de tal forma que a soma das entradas da tabela seja igual a 1,0.
II. Sem os requisitos de normalidade, linearidade e homoscedasticidade, a Análise de Conglomerado (Cluster) não é possível de ser realizada.
III. A Análise de Componentes Principais se concentra na explicação da variância comum enquanto a Análise Fator (Fatorial) se concentra na explicação da variância total.
IV. Os Fatores são independentes entre si e os escores fatoriais são normalmente distribuídos quando se utiliza a matriz de correlação.
Estão/Está correto(s) o(s) itens/item

Alternativas