Cálculo de probabilidad de RMSE

13

Tengo un modelo para predecir una trayectoria (x en función del tiempo) con varios parámetros. Por el momento, calculo el error cuadrático medio (RMSE) entre la trayectoria prevista y la trayectoria registrada experimentalmente. Actualmente, minimizo esta diferencia (el RMSE) usando simplex (fminsearch en matlab). Si bien este método funciona para dar buenos ajustes, me gustaría comparar varios modelos diferentes, por lo que creo que necesito calcular la probabilidad para poder usar la estimación de máxima probabilidad en lugar de minimizar el RMSE (y luego comparar los modelos usando AIC o BIC ) ¿Hay alguna forma estándar de hacer esto?

Jason
fuente

Respuestas:

20

La raíz del error cuadrático medio y la probabilidad en realidad están estrechamente relacionados. Supongamos que tiene un conjunto de datos de pares y desea modelar su relación utilizando el modelo . Decide minimizar el error cuadrático.f{Xyo,zyo}F

yo(F(Xyo)-zyo)2

¿No es esta elección totalmente arbitraria? Claro, desea penalizar las estimaciones que están completamente equivocadas más que las que son correctas. Pero hay una muy buena razón para usar el error al cuadrado.

Recuerde la densidad gaussiana: donde es la constante de normalización que no nos importa por ahora. Supongamos que sus datos de destino se distribuyen de acuerdo con un gaussiano. Entonces podemos escribir la probabilidad de los datos. Zz1ZExp-(X-μ)22σ2Zz

L=yo1ZExp-(F(Xyo)-zyo)22σ2

Ahora, si tomas el logaritmo de esto ...

Iniciar sesiónL=yo-(F(Xyo)-zyo)22σ2-Iniciar sesiónZ

... resulta que está muy relacionado con el rms: las únicas diferencias son algunos términos constantes, una raíz cuadrada y una multiplicación.

Larga historia corta: minimizar el error cuadrático medio es equivalente a maximizar la probabilidad logarítmica de los datos.

bayerj
fuente
Gracias por la explicación clara. Entonces, si quiero comparar dos modelos (no integrados) usando BIC, ¿puedo simplemente soltar los términos sigma ^ 2 y Z (suponiendo que sean iguales en todos los modelos) al calcular la probabilidad?
Jason
σσ
1
Iniciar sesiónL=yo(F(Xyo)-zyo)22σ2-Iniciar sesiónZ
2
¿Falta un signo negativo en la distribución gaussiana?
Manoj
1
σ