¿El chi cuadrado siempre es una prueba unilateral?

48

Un artículo publicado ( pdf ) contiene estas 2 oraciones:

Además, los informes erróneos pueden ser causados ​​por la aplicación de reglas incorrectas o por la falta de conocimiento de la prueba estadística. Por ejemplo, el df total en un ANOVA puede tomarse como el error df en el informe de una prueba , o el investigador puede dividir el valor p informado de una o entre dos, para obtener un valor unilateral , mientras que el valor de una o ya es una prueba unilateral.χ 2 F p p χ 2 FFχ2Fppχ2F

¿Por qué podrían haber dicho eso? La prueba de chi cuadrado es una prueba de dos lados. (Le pregunté a uno de los autores, pero no obtuve respuesta).

¿Estoy pasando por alto algo?

Joel W.
fuente
Mire el ejercicio 4.14 de la edición de 2004 de Davidson & Mackinnon 'Econometric Theory and Methods' para ver un ejemplo (excepcional) de cuando el Chi-cuadrado se usa para una prueba de dos colas. Editar: gran explicación aquí: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Max

Respuestas:

50

La prueba de chi-cuadrado es esencialmente siempre una prueba unilateral . Aquí hay una manera floja de pensarlo: la prueba de chi-cuadrado es básicamente una prueba de 'bondad de ajuste'. A veces se lo conoce explícitamente como tal, pero incluso cuando no lo es, a menudo sigue siendo en esencia una bondad de ajuste. Por ejemplo, la prueba de independencia chi-cuadrado en una tabla de frecuencia de 2 x 2 es (una especie de) una prueba de bondad de ajuste de la primera fila (columna) a la distribución especificada por la segunda fila (columna), y viceversa , simultaneamente. Por lo tanto, cuando el valor de chi-cuadrado realizado se encuentra en la cola derecha de su distribución, indica un ajuste deficiente, y si está lo suficientemente lejos, en relación con algún umbral predeterminado, podríamos concluir que es tan pobre que No creemos que los datos sean de esa distribución de referencia.

Si tuviéramos que usar la prueba de chi-cuadrado como una prueba de dos lados, también estaríamos preocupados si la estadística estuviera demasiado lejos en el lado izquierdo de la distribución de chi-cuadrado. Esto significaría que nos preocupa que el ajuste sea demasiado bueno . Esto simplemente no es algo que normalmente nos preocupa. (Como nota al margen histórica, esto está relacionado con la controversia de si Mendel falsificó sus datos. La idea era que sus datos eran demasiado buenos para ser verdad. Consulte aquí para obtener más información si tiene curiosidad).

gung - Restablece a Monica
fuente
99
+1 por mencionar el uso a dos caras con los experimentos de guisantes de Mendel: es memorable y llega al meollo de la pregunta.
whuber
2
+1 por una buena pregunta y una excelente respuesta. @ Joel W: Puedo recomendar encarecidamente vídeo Khan Academys en la pruebasχ2
Max Gordon
99
Mi resumen de esto es que el es una prueba de dos lados para la que generalmente estamos interesados ​​en solo una de las colas de la distribución, lo que indica más desacuerdo, en lugar de menos desacuerdo de lo que uno espera por casualidad. χ2
Frank Harrell
55
Apoyando la vista de 2 colas: "La probabilidad de dos colas más allá de +/- z para la distribución normal estándar es igual a la probabilidad de la cola derecha por encima de z-cuadrado para la distribución de chi-cuadrado con df = 1. Por ejemplo, las dos La probabilidad normal estándar de cola de .05 que cae por debajo de -1.96 y por encima de 1.96 es igual a la probabilidad de chi-cuadrado de la cola derecha por encima de (1.96) al cuadrado = 3.84 cuando df = 1 ". Agresti, 2007 (2ª ed.) Página 11
Joel W.
55
Eso es correcto. La cuadratura de una puntuación z produce una variante de chi cuadrado. Por ejemplo, az de 2 (o -2!) Cuando al cuadrado es igual a 4, el valor de chi-cuadrado correspondiente. El valor p de dos colas asociado con una puntuación z de 2 es .04550026; y el valor p de una cola asociado con un valor de chi cuadrado de 4 (df = 1) es .04550026. Una prueba z de dos colas corresponde a una prueba de ji cuadrado de una cola. Mirar la cola izquierda de la distribución de chi-cuadrado correspondería a buscar puntajes z más cercanos a z = 0 de lo que cabría esperar por casualidad.
gung - Restablece a Monica
12

¿El chi cuadrado siempre es una prueba unilateral?

Eso realmente depende de dos cosas:

  1. (OE)2E

  2. π1π2|T||T|

Es decir, tenemos que tener mucho cuidado con lo que pretendemos cubrir mediante el uso de la 'prueba de chi-cuadrado' y precisar lo que queremos decir cuando decimos 'una cola' versus 'dos ​​colas'.

En algunas circunstancias (dos que mencioné; puede haber más), puede tener mucho sentido llamarlo de dos colas, o puede ser razonable llamarlo de dos colas si acepta cierta flexibilidad en el uso de la terminología.

Puede ser una afirmación razonable decir que solo tiene una cola si restringe la discusión a tipos particulares de pruebas de chi-cuadrado.

Glen_b
fuente
¿Qué hay de este? stats.stackexchange.com/questions/223560/…
Un anciano en el mar.
Muchas gracias por mencionar la prueba de varianza. Ese es en realidad un uso bastante interesante de la prueba, y también la razón por la que terminé en esta página ^^
Tobbey
5

(n1)s2/σ2σ2(mμ)n/sμ

Ray Koopman
fuente
1

χ2

χ2

Esta lectura sería para confundir cómo se generó el estadístico de prueba con qué colas del estadístico de prueba se están mirando.

conjeturas
fuente
¿Podría explicar en qué consistiría un "lado de una distribución original"? Ni siquiera es evidente a qué se refiere esa "distribución original" ni cómo se relaciona con la estadística de chi cuadrado según se calcula a partir de los datos.
whuber
nχ2χ2
OK, pero todavía no puedo entender con qué estás contrastando eso. ¿Podría proporcionar un ejemplo de una estadística de prueba que no sea de dos lados que podría usarse en ANOVA y mostrar cómo está conectada con las colas de alguna distribución?
whuber
χ2χ2χ2
Solo pido un contraste para ayudar a comprender lo que está tratando de describir. Todavía no he podido determinar qué es eso.
whuber
0

También he tenido algunos problemas para resolver esta pregunta, pero después de algunos experimentos, parecía que mi problema era simplemente cómo se nombran las pruebas.

En SPSS como ejemplo, una tabla de 2x2 puede tener una adición de una prueba de chisquare. Hay dos columnas para los valores p, una para el "Pearson Chi-Sqare", "Corrección de continuidad", etc., y otro par de columnas para la prueba exacta de Fisher, donde hay una columna para una prueba de 2 lados y otra para una Prueba de 1 cara.

Primero pensé que los lados 1 y 2 denotaban una versión de 1 o 2 lados de la prueba chisquare, lo que parecía extraño. Sin embargo, resultó que esto denota la formulación subyacente de la hipótesis alternativa en la prueba de una diferencia entre proporciones, es decir, la prueba z. Por lo tanto, la prueba de proporciones de 2 lados, a menudo razonable, se logra en SPSS con la prueba de chisquare, donde la medida de chisquare se compara con un valor en la cola superior (de 1 lado) de la distribución. Supongo que esto es lo que otras respuestas a la pregunta original ya han señalado, pero me tomó un tiempo darme cuenta de eso.

Por cierto, el mismo tipo de formulación se usa en openepi.com y posiblemente también en otros sistemas.

Robert L
fuente
0

χ2 (n1)s2σ2σs>σs<σsσ

shahuss
fuente
1
Bienvenido a CV! Creo que la respuesta de Ray Koopman ya cubre este punto.
Silverfish
-1

χ2χ2χ2

SSwdfw

χ2

Distribuciones Chi-cuadrado y F

Daniel
fuente
1
Una estadística de prueba no necesita tomar valores negativos para que podamos considerar ambas colas. Considere una prueba F para la relación de dos variaciones, por ejemplo.
Glen_b
La prueba F es una prueba unilateral Glen_b.
Daniel
3
La prueba F para la igualdad de varianzas, que tiene una estadística que es la razón de las dos estimaciones de varianza NO es unilateral; hay una aproximación que coloca la mayor de las dos variaciones de muestra en el numerador, pero solo es correcto si el df es el mismo. Pero si no te gusta, hay muchos otros ejemplos. La estadística para la prueba de suma de rango no puede ser negativa, pero la prueba tiene dos colas. Puedo proporcionar otros ejemplos si es necesario.
Glen_b
σ12σ22σ12>σ22