Estoy usando la glmfit
función en MATLAB. La función solo devuelve la desviación y no la probabilidad de registro. Entiendo que la desviación es básicamente el doble de la diferencia entre las probabilidades de registro de los modelos, pero lo que no obtengo es que solo estoy usando glmfit
para crear un modelo, pero de alguna manera estoy obteniendo una desviación.
- ¿El cálculo de la probabilidad de log -2 requiere 2 modelos?
- ¿Cómo se puede analizar la desviación cuando solo hay un modelo?
Otra pregunta que tengo es decir que tenía dos modelos y que los estaba comparando usando la prueba de probabilidad de registro. La hipótesis nula sería el primer modelo y la hipótesis alternativa sería el segundo modelo. Después de obtener el estadístico de prueba de probabilidad de registro, ¿lo verificaría contra el cdf de chi cuadrado para determinar el valor p? ¿Tengo razón en que si es menor que el nivel alfa rechazaría el nulo y si es mayor, no podría rechazar el nulo?
fuente
Respuestas:
El término estadístico desviación se arroja demasiado. La mayoría de las veces, los programas devuelven la desviación donde es su parámetro (s) estimado (s) a partir del ajuste del modelo es una ocurrencia potencialmente observada / observable de la cantidad aleatoria en cuestión.D ( y) = - 2 log{ p ( yEl |θ^) } , θ^ y
La desviación más común a la que se refiere trataría la desviación anterior en función de dos variables, tanto los datos como los parámetros ajustados: y, por lo tanto, si tuviera un valor pero dos valores de parámetros ajustados, y , entonces obtendría la desviación que mencionó de Puede leer sobre la función de Matlab que mencionó , vinculada aquí . Aquí se vincula una discusión más fructífera, aunque más corta, sobre la desviación .D ( y,θ^) = - 2 log{ p ( yEl |θ^) } y θ^1 θ^2 −2(log{p(y|θ^1)}−log{p(y|θ^2)}).
glmfit()
La estadística de desviación implícitamente supone dos modelos: el primero es su modelo ajustado, devuelto porθ^1 θ^s
glmfit()
, llame a este parámetro vector . El segundo es el "modelo completo" (también llamado "modelo saturado"), que es un modelo en el que hay una variable libre para cada punto de datos, llame a este parámetro vector . Obviamente, tener tantas variables libres es algo estúpido, pero le permite ajustarse exactamente a esos datos.Entonces, las estadísticas de desviación se calculan como la diferencia entre la probabilidad de registro calculada en el modelo ajustado y el modelo saturado. Sea la colección de los N puntos de datos. Entonces:Y={y1,y2,⋯,yN}
Consulte el Capítulo 6 del Análisis de datos bayesianos para una buena discusión sobre la desviación.
En cuanto a su segundo punto sobre la estadística de prueba de probabilidad, sí, parece que básicamente sabe lo que hay que hacer. Pero en muchos casos, considerará que la hipótesis nula es algo que el conocimiento externo experto le permite adivinar con anticipación (como si algún coeficiente fuera igual a cero). No es necesariamente algo que surge como resultado del ajuste del modelo.
fuente