La prueba F clásica para subconjuntos de variables en regresión multilineal tiene la forma dondeSSE(R)es la suma de los errores al cuadrado bajo el modelo 'reducido', que anida dentro del modelo 'grande'B, ydfson los grados de libertad de los dos modelos. Bajo la hipótesis nula de que las variables adicionales en el modelo 'grande' no tienen poder explicativo lineal, la estadística se distribuye como una F condfR-dfBydfBgrados de libertad.
¿Cuál es la distribución, sin embargo, bajo la alternativa? Supongo que es una F no central (espero que no sea doblemente no central), pero no puedo encontrar ninguna referencia sobre cuál es exactamente el parámetro de no centralidad. Supongo que depende de los verdaderos coeficientes de regresión , y probablemente de la matriz de diseño X , pero más allá de eso no estoy tan seguro.
Aquí está el código R (perdón por el estilo, todavía estoy aprendiendo):
fuente