Interpretación de probabilidad de registro

9

Tengo dificultades para interpretar algunos resultados. Estoy haciendo una regresión jerárquica relacionada con ecoreg. Si ingreso el código, recibo resultados con odds ratios, relaciones de confianza y una probabilidad de registro maximizada 2x.

Sin embargo, no entiendo completamente cómo interpretar la probabilidad de registro maximizada 2x. Hasta donde yo sé, la probabilidad logarítmica se usa como una forma conveniente de calcular una probabilidad y calcula el valor de los parámetros en función de los resultados. Pero no entiendo si un valor más alto o más bajo es mejor. Miré varias fuentes en línea, por ejemplo , /programming/2343093/what-is-log-likelihood , pero todavía estoy atascado.

Debajo del resultado que recibo:

Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke + 
    soclass, data = dfAggPlus, cross = cross)

Aggregate-level odds ratios: 
                   OR        l95        u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome  1.0689951 0.95574925 1.19565924

Individual-level odds ratios:
                OR       l95      u95
fracSmoke 3.124053 2.0761956 4.700765
soclass   1.001050 0.9930815 1.009083

-2 x log-likelihood:  237.4882 

Entonces, ¿cómo debo interpretar un valor de 237.4882 en comparación con un resultado de 206 o 1083? ¡La ayuda es muy apreciada!

Keizer
fuente
¿Qué es exactamente lo que no está claro para ti?
Tim
Bueno, quiero entender si una mayor probabilidad de registro significa que el resultado es más confiable o, por ejemplo, menos confiable. Además, quiero saber cómo debo interpretar las diferencias entre varios resultados (por ejemplo, 206 237 o 1083)
Keizer,
Posible duplicado de la Estimación
Tim
Marqué su pregunta como un duplicado de otra pregunta más general que pregunta cuál es la estimación de máxima verosimilitud: compruébelo.
Tim
Parece que se usa como una desviación. Ver < en.wikipedia.org/wiki/Deviance_information_criterion >
pglpm

Respuestas:

0

Para obtener al menos algo de significado de la probabilidad L, puede recordar que para el conteo de muestras fijo N, la probabilidad de registro máxima para un determinado modelo de distribución depende principalmente de la escala. Para una varianza dada, la distribución normal tiene el valor más alto. Para obtener una idea, dividiría logL por N, y luego tal vez también haría una corrección por escala. Si sus datos se ajustan mejor a una distribución uniforme, sería mejor utilizar la probabilidad uniforme como función de entropía máxima para un rango dado como un tipo de referencia. Otro valor de referencia general podría ser para el caso continuo de usar un ajuste KDE y calcular la L para esto. Sin embargo, cualquier cosa que haga L es más difícil de interpretar que, por ejemplo, el valor KS o el error rms.
Si toma otro modelo y obtiene una L más alta, entonces no significa que el modelo sea mejor, porque tal vez se encuentre en una situación de sobreajuste. Para incluir esto, use el valor AIC. Aquí más bajo es mejor, y nuevamente puede usar una distribución normal como "referencia".

usuario32038
fuente