Sin querer tomar el crédito por la respuesta de @ttnphns, quise sacar la respuesta de los comentarios (particularmente considerando que el enlace al artículo había muerto). La respuesta de Matt Krause proporciona una discusión útil sobre la distinción entre y R 2 a d j, pero no discute la decisión de qué fórmula de R 2 a d j usar en un caso dado.R2R2adjR2adj
Como discuto en esta respuesta , Yin y Fan (2001) proporcionan una buena visión general de las muchas fórmulas diferentes para estimar la varianza de la población explicadas , todas las cuales podrían etiquetarse como un tipo de R 2 ajustado .ρ2R2
Realizan una simulación para evaluar cuál de una amplia gama de fórmulas r-cuadrado ajustadas proporciona la mejor estimación imparcial para diferentes tamaños de muestra, e intercorrelaciones de predictores. Sugieren que la fórmula de Pratt puede ser una buena opción, pero no creo que el estudio haya sido definitivo al respecto.ρ2
Actualización: Raju et al (1997) señalan que las fórmulas de ajustadas difieren en función de si están diseñadas para estimar el R 2 ajustado asumiendo los precursores de x fijo o aleatorio. Específicamente, la fórmula de Ezekial está diseñada para estimar ρ 2 en el contexto de x fijo, y las fórmulas de Olkin-Pratt y Pratt están diseñadas para estimar ρ 2 en el contexto de x aleatorio. No hay mucha diferencia entre las fórmulas Olkin-Pratt y Pratt. Los supuestos de x fijo se alinean con los experimentos planificados, los supuestos de x aleatorio se alinean cuando se supone que los valores de las variables predictoras son una muestra de posibles valores, como suele ser el caso en los estudios observacionales. VerR2R2ρ2ρ2esta respuesta para más discusión . Tampoco hay mucha diferencia entre los dos tipos de fórmulas, ya que los tamaños de muestra se hacen moderadamente grandes (vea aquí para una discusión sobre el tamaño de la diferencia ).
Resumen de reglas generales
- Si supone que sus observaciones para las variables predictoras son una muestra aleatoria de una población, y desea estimar para la población completa de predictores y criterios (es decir, suposición aleatoria x), utilice la fórmula de Olkin-Pratt (o La fórmula de Pratt).ρ2
- Si asume que sus observaciones son fijas o no desea generalizar más allá de sus niveles observados del predictor, entonces calcule con la fórmula de Ezequiel.ρ2
- Si desea obtener información sobre la predicción fuera de la muestra utilizando la ecuación de regresión de la muestra, entonces debería considerar alguna forma de procedimiento de validación cruzada.
Referencias
- Raju, NS, Bilgic, R., Edwards, JE y Fleer, PF (1997). Revisión metodológica: Estimación de la validez de la población y la validez cruzada, y el uso de pesos iguales en la predicción. Medición psicológica aplicada, 21 (4), 291-305.
- Yin, P. y Fan, X. (2001). Estimación de la contracción de en regresión múltiple: una comparación de diferentes métodos analíticos The Journal of Experimental Education, 69 (2), 203-224. PDFR2