Valor esperado de , el coeficiente de determinación, bajo la hipótesis nula

12

Tengo curiosidad acerca de la declaración hecha en la parte inferior de la primera página de este texto con respecto al ajusteRadjusted2

Radjusted2=1(1R2)(n1nm1).

El texto dice:

La lógica del ajuste es la siguiente: en la regresión múltiple ordinaria, un predictor aleatorio explica en promedio una proporción 1/(n1) de la variación de la respuesta, de modo que m predictores aleatorios explican juntos, en promedio, m/(n1) de la variación de la respuesta; en otras palabras, el valor esperado de R2 es E(R2)=m/(n1) . Al aplicar la fórmula [ Radjusted2 ] a ese valor, donde todos los predictores son aleatorios, se obtiene Radjusted2=0 ".

Esto parece ser una motivación muy simple e interpretable para Radjusted2 . Sin embargo, no he podido calcular ese E(R2)=1/(n1) para un único predictor aleatorio (es decir, no correlacionado).

¿Podría alguien señalarme en la dirección correcta aquí?

gregory_britten
fuente
En caso de que el enlace falle en el futuro, ¿podría proporcionar una referencia completa? Gracias.
Richard Hardy

Respuestas:

10

Esta es una estadística matemática precisa. Vea esta publicación para la derivación de la distribución de bajo la hipótesis de que todos los regresores (salvo el término constante) no están correlacionados con la variable dependiente ("predictores aleatorios").R2

Esta distribución es Beta, siendo el número de predictores sin contar el término constante, el tamaño de la muestra,nmn

R2Beta(m2,nm12)

y entonces

E(R2)=m/2(m/2)+[(nm1)/2]=mn1

Esta parece ser una forma inteligente de "justificar" la lógica detrás del ajustado : si de hecho todos los regresores no están correlacionados, entonces el ajustado es "en promedio" cero.R 2R2R2

Alecos Papadopoulos
fuente
2
¡Justo la información que necesitaba! ¡Gracias! Y larga vida a Stack Exchange!
gregory_britten
1
Me interesaría el caso en el que no todos los regresores no están correlacionados con la variable dependiente. ¿Tendrías alguna referencia sobre esto?
Olivier
@ Olivier No, me temo que no. Mire bajo "Prueba F para la significación de regresión, distribución bajo la alternativa", o algo así.
Alecos Papadopoulos