Una de las publicaciones vinculadas anteriores alude al uso de una prueba de razón de probabilidad, aunque sus modelos deben estar anidados entre sí para que esto funcione (es decir, todos los parámetros en uno de los modelos deben estar presentes en el modelo con el que lo está probando) .
RMSE es claramente una medida de qué tan bien el modelo se ajusta a los datos. Sin embargo, también lo es la razón de probabilidad. La probabilidad para una persona determinada, dice la Sra. Chen, es la probabilidad de que una persona con todos sus parámetros tenga el resultado que tuvo. La probabilidad conjunta del conjunto de datos es la probabilidad de la Sra. Chen * la probabilidad de la Sra. Gundersen * la probabilidad de la Sra. Johnson * ... etc.
Agregar una covariable, o cualquier número de covariables, realmente no puede empeorar la razón de probabilidad, no creo. Pero puede mejorar la razón de probabilidad en una cantidad no significativa. Los modelos que se ajusten mejor tendrán una mayor probabilidad. Puede probar formalmente si el modelo A se ajusta mejor al modelo B. Debería tener algún tipo de función de prueba LR disponible en cualquier software que use, pero básicamente, el estadístico de prueba LR es -2 * la diferencia de los registros de las probabilidades, y se distribuye chi-cuadrado con df = la diferencia en el número de parámetros.
Además, comparar el AIC o BIC de los dos modelos y encontrar el más bajo también es aceptable. AIC y BIC son básicamente las probabilidades de registro penalizadas por el número de parámetros.
No estoy seguro de usar una prueba t para los RMSE, y realmente me apoyaría en ella a menos que pueda encontrar algún trabajo teórico que se haya realizado en el área. Básicamente, ¿sabes cómo los valores de RMSE se distribuyen asintóticamente? No estoy seguro. Alguna discusión adicional aquí:
http://www.stata.com/statalist/archive/2012-11/index.html#01017