Interpretación de los valores p producidos por la prueba de Levene o Bartlett para la homogeneidad de varianzas

11

He realizado la prueba de Levene y Bartlett en grupos de datos de uno de mis experimentos para validar que no estoy violando la suposición de homogeneidad de las variaciones de ANOVA. Me gustaría comprobar con ustedes que no estoy haciendo suposiciones equivocadas, si no les importa: D

El valor p devuelto por ambas pruebas es la probabilidad de que mis datos, si se generaran nuevamente utilizando variaciones iguales, fueran los mismos. Por lo tanto, al usar esas pruebas, para poder decir que no viole el supuesto de homogeneidad de las variaciones de ANOVA, ¿solo necesitaría un valor p que sea más alto que un nivel alfa elegido (digamos 0.05)?

Por ejemplo, con los datos que estoy usando actualmente, la prueba de Bartlett devuelve p = 0.57, mientras que la prueba de Levene (bueno, la llaman prueba de tipo Brown-Forsythe Levene) da una p = 0.95. Eso significa que, no importa qué prueba use, puedo decir que los datos que cumplo con el supuesto. ¿Estoy cometiendo algún error?

Gracias.

levesco
fuente

Respuestas:

8

El valor p de su prueba de significación se puede interpretar como la probabilidad de observar el valor de la estadística relevante como o más extremo que el valor que usted realmente observó, dado que la hipótesis nula es verdadera. (tenga en cuenta que el valor p no hace referencia a qué valores de la estadística son probables bajo la hipótesis alternativa )

EDITAR: en terminología matemática, esto se puede escribir como: donde es alguna función de los datos (el "estadístico") y es el valor real de observado; denota las condiciones implícitas en la hipótesis nula en la distribución de muestreo de .T T o b s T H 0 T

pvalue=Pr(T>Tobs|H0)
T Tobs T H0 T

Puede no estar seguro de que usted está suposiciones son válidas, solamente si o no los datos que ha observado es coherente con sus supuestos . Un valor p da una medida aproximada de esta consistencia.

Un valor p no da la probabilidad de que se observen los mismos datos, solo la probabilidad de que el valor de la estadística sea tan o más extremo al valor observado, dada la hipótesis nula.

probabilidadislogica
fuente
Solo una nota sobre los valores p (en relación con mi comentario entre corchetes), bien podría ser que en el caso de que tenga datos "inusuales" (digamos un valor p de 0.0001). PERO también puede ser el caso de que es aún más inusual bajo la hipótesis alternativa (digamos un valor p de cuando se cambia la hipótesis nula y alternativa). Creo que esto puede suceder cuando la estadística no es una estadística suficiente para la prueba de hipótesis. T1030T
chanceislogic
... continuando ... También puede darse el caso de que tenga datos muy "buenos" (digamos un valor p de 0.5). PERO la hipótesis alternativa puede ser mejor (o más consistente) con estos datos (digamos un valor p de 0.99999 cuando las hipótesis nula y alternativa se cambian).
chanceislogic
5

Estás en "el lado derecho del valor p". Solo ajustaría un poco su afirmación para decir que, SI los grupos tuvieran variaciones iguales en sus poblaciones, este resultado de p = 0.95 indica que el muestreo aleatorio usando estos n tamaños produciría variaciones tan distantes o más lejanas el 95% del tiempo . En otras palabras, estrictamente hablando, es correcto expresar el resultado en términos de lo que dice sobre la hipotermia nula, pero no en términos de lo que dice sobre el futuro.

rolando2
fuente
Recuerdo la interpretación del valor p como (en este caso): al suponer que las hipótesis nulas (es decir, la homogeneidad de las variaciones) son correctas, entonces la probabilidad de obtener este o un resultado más extremo (es decir, contrario a la nula ) es 57% o 95%. Pero en absoluto, la conclusión es la misma y correcta.
Henrik
3

Si bien los comentarios anteriores son 100% correctos, las gráficas producidas para los objetos modelo en R proporcionan un resumen gráfico de esta pregunta. Personalmente, siempre encuentro los gráficos mucho más útiles que el valor p, ya que uno puede transformar los datos después y detectar los cambios inmediatamente en el gráfico.

richiemorrisroe
fuente
2
Bien dicho, otra cosa es que un valor p no le dice nada acerca de qué hacer si la hipótesis nula es "rechazada", pero una gráfica de los datos le da una pista sobre el problema
probabilidadisógica