¿Pueden los grados de libertad ser un número no entero?

> library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of freedom AIC: 158.4294 Number of Local Scoring Iterations: 2 Anova for Parametric Effects Df Sum Sq Mean Sq F value Pr(>F) lo(wt) 1.0 847.73 847.73 127.06 1.239e-11 *** Residuals 26.6 177.47 6.67

Respuestas:

Los grados de libertad no son enteros en varios contextos. De hecho, en algunas circunstancias, puede establecer que los grados de libertad para ajustar los datos para algunos modelos particulares deben estar entre algún valor $k$ y $k+1$ .

Generalmente pensamos en los grados de libertad como el número de parámetros libres, pero hay situaciones en las que los parámetros no son completamente libres y pueden ser difíciles de contar. Esto puede suceder al suavizar / regularizar, por ejemplo.

Los casos de regresión ponderada localmente / métodos de kernel y splines suavizados son ejemplos de tal situación: un número total de parámetros libres no es algo que pueda contar fácilmente sumando predictores, por lo que se necesita una idea más general de los grados de libertad.

gam $\hat y = Ay$ $\operatorname{tr}(A)$ $\operatorname{tr}(AA^T)$ $\operatorname{tr}(2A-AA^T)$ $\operatorname{tr}(A)$ $X$ $A$

$\operatorname{tr}(A)$

$\sum_i \frac{\partial \hat y_i}{\partial y_i}$ $\operatorname{tr}(A)$ $\hat y$ $\frac{\partial \hat y_i}{\partial y_i}$

Para modelos como los instalados gam, esas diversas medidas generalmente no son enteras.

(Recomiendo encarecidamente leer la discusión de estas referencias sobre este tema, aunque la historia puede volverse bastante más complicada en algunas situaciones. Ver, por ejemplo, [4])

[1] Hastie, T. y Tibshirani, R. (1990),
Generalized Additive Models
London: Chapman and Hall.

[2] Hastie, T., Tibshirani, R. y Friedman, J. (2009),
The Elements of Statistical Learning: Data Mining, Inference, and Prediction , 2ndEd
Springer-Verlag.
https://statweb.stanford.edu/~tibs/ElemStatLearn/

[3] Ye, J. (1998),
"Sobre la medición y corrección de los efectos de la minería de datos y la selección de modelos",
Journal of the American Statistical Association , vol. 93, núm. 441, págs. 120-131

[4] Janson, L., Fithian, W. y Hastie, T. (2013),
"Grados efectivos de libertad: una metáfora defectuosa"
https://arxiv.org/abs/1312.7851

Glen_b -Reinstate a Monica
fuente

No es relevante para este caso, pero la prueba t de Welch de dos muestras cuando las varianzas son desiguales puede tener un número no entero de grados de libertad.

Michael R. Chernick

Como puede el epsilon corregido df en medidas repetidas ANOVA.

David Lane,

Otra referencia es statweb.stanford.edu/~tibs/ElemStatLearn/printings/… sección 5.4.1 Grados de libertad y matrices más suaves

Adrian

@Adrian gracias; Había estado lanzando si agregar solo esa referencia (y en particular si mencionar la ecuación 5.16 en la sección a la que apunta). Llegué a la conclusión de que es una buena idea agregarlo.

Glen_b -Reinstalar Monica