¿Cuál es la relación entre y F-Test?

17

Me preguntaba si hay una relación entre y una prueba F.R2

Por lo general, y mide la fuerza del relación lineal en la regresión.

R2=(Y^tY¯)2/T1(YtY¯)2/T1

Una prueba F solo prueba una hipótesis.

¿Existe una relación entre y una prueba F?R2

Le Max
fuente
2
La fórmula para R2 parece incorrecta, no solo porque le faltan algunos caracteres en el denominador: esos términos " 1 " no pertenecen. La fórmula correcta se parece mucho más a una estadística F :-).
whuber

Respuestas:

23

Si se cumplen todos los supuestos y tiene la forma correcta para R2 entonces el estadístico F habitual se puede calcular como F=R21R2×df2df1 . Este valor se puede comparar con la distribución F apropiada para hacer una prueba F. Esto se puede derivar / confirmar con álgebra básica.

Greg Snow
fuente
2
¿podría definir df1 y df2?
bonobo
1
@bonobo, df1 es el grado de libertad del numerador (basado en el número de predictores) y df2 es el grado de libertad del denominador.
Greg Snow
1
Para aclarar más acerca de los grados de libertad: df1 = k, donde k es el número de predictores. df1 se llama "grados de libertad del numerador", aunque esté en el denominador de esta fórmula. df2 = n− (k + 1), donde n es el número de observaciones yk es el número de predictores. df2 se llama el "denominador grados de libertad", aunque está en el numerador de esta fórmula.
Tim Swast
55
@GregSnow ¿podría considerar agregar las definiciones de los grados de libertad a la respuesta? Sugerí tal cambio en stats.stackexchange.com/review/suggested-edits/175306 pero fue rechazado.
Tim Swast
22

Recuerde que en una configuración de regresión, el estadístico F se expresa de la siguiente manera.

F=(TSSRSS)/(p1)RSS/(np)

donde TSS = suma total de cuadrados y RSS = suma residual de cuadrados, es el número de predictores (incluida la constante) es el número de observaciones. Esta estadística tiene una distribución con grados de libertad y .pnFp1np

Recuerde también que

R2=1RSSTSS=TSSRSSTSS

el álgebra simple le dirá que

R2=1(1+Fp1np)1

donde F es la estadística F de arriba.

Esta es la relación teórica entre el estadístico F (o la prueba F) y .R2

La interpretación práctica es que un más grande conduce a valores altos de F, por lo que si es grande (lo que significa que un modelo lineal se ajusta bien a los datos), el estadístico F correspondiente debería ser grande, lo que significa que Debería haber una fuerte evidencia de que al menos algunos de los coeficientes son distintos de cero.R2R2

Zheng Li
fuente
1

Intuitivamente, me gusta pensar que el resultado de la relación F da primero una respuesta de sí a no a la pregunta, '¿puedo rechazar ?' (esto se determina si la relación es mucho mayor que 1, o el valor p < ).H0α

Entonces, si determino que puedo rechazar , indica la fuerza de la relación entre.H0R2

En otras palabras, una relación F grande indica que hay una relación. Alto luego indica cuán fuerte es esa relación.R2

Entropica
fuente
-1

Además, rápidamente:

R2 = F / (F + np / p-1)

Por ejemplo, el R2 de una prueba F de 1df = 2.53 con un tamaño de muestra 21, sería:

R2 = 2.53 / (2.53 + 19) R2 = .1175

rystoli
fuente
1
No veo cómo esto agrega algo más allá de lo que ya está en la respuesta de Zheng Li.
Glen_b -Reinstate Monica el