¿He calculado correctamente estas razones de probabilidad?

Soy el autor del paquete ez para R, y estoy trabajando en una actualización para incluir el cálculo automático de las razones de probabilidad (LR) en la salida de ANOVA. La idea es proporcionar un LR para cada efecto que sea análogo a la prueba de ese efecto que logra el ANOVA. Por ejemplo, el LR para el efecto principal representa la comparación de un modelo nulo con un modelo que incluye el efecto principal, el LR para una interacción representa la comparación de un modelo que incluye los dos efectos principales del componente versus un modelo que incluye ambos efectos principales y su interacción, etc.

Ahora, mi comprensión del cálculo LR proviene de Glover & Dixon ( PDF ), que cubre los cálculos básicos, así como las correcciones de complejidad, y el apéndice de Bortolussi & Dixon ( apéndice PDF ), que cubre los cálculos que involucran variables de medidas repetidas. Para probar mi comprensión, desarrollé esta hoja de cálculo , que toma los dfs y SS de un ANOVA de ejemplo (generado a partir de un diseño 2 * 2 * 3 * 4 usando datos falsos) y los pasos a través del cálculo del LR para cada efecto.

Realmente agradecería que alguien con un poco más de confianza con tal cálculo pudiera echar un vistazo y asegurarse de que hice todo correctamente. Para aquellos que prefieren el código abstracto, aquí está el código R que implementa la actualización de ezANOVA () (ver especialmente las líneas 15-95).

r anova likelihood-ratio Mike Lawrence
fuente

Respuestas:

Aunque el razonamiento sobre el cálculo de la LR a partir de los valores de SS es bastante justo, un método de mínimos cuadrados es equivalente pero no es lo mismo que una estimación de probabilidad. (La diferencia puede ilustrarse, por ejemplo, en el cálculo de la se, que se divide por (n-1) en un enfoque de mínimos cuadrados y se divide por n en una probabilidad máxima. La estimación de probabilidad máxima es, por lo tanto, consistente, pero ligeramente sesgada )

$\frac{1}{s}$

He mirado la hoja de cálculo, pero los valores para el "LR no corregido dentro" (tampoco estoy siguiendo completamente lo que exactamente estás tratando de calcular allí) me parecen muy poco probables.

En una nota al margen, el poder de las pruebas de LR es que solo puede contrastar los modelos que desea, no tiene que hacer eso para todos ellos (lo que reduce el error de multitarea). Si hace esto para cada término, su LR es completamente equivalente a una prueba F, y en el caso de mínimos cuadrados, hasta donde yo sé, incluso numéricamente, es casi lo mismo.

Su milla puede variar, pero nunca he confiado en mezclar conceptos de dos marcos diferentes (es decir, mínimos cuadrados versus máxima probabilidad). Personalmente, informaría las estadísticas F e implementaría el LR en una función que permita comparar modelos (por ejemplo, la función anova para modelos lme que hace exactamente eso).

Mis 2 centavos

PD: Miré tu código, pero realmente no pude entender todas las variables. Si anotaras tu código usando comentarios, eso haría la vida un poco más fácil nuevamente. La hoja EXCEL tampoco es la más fácil de entender. Comprobaré nuevamente más tarde para ver si puedo hacer algo con eso.

Joris Meys
fuente