Prueba de hipótesis para la igualdad de proporciones con 3 muestras

9

Tengo un conjunto de datos de información de clientes de teléfonos celulares con dos columnas. La primera columna contiene la determinada categoría en la que se encuentra una cuenta (A, B o C) y la segunda columna contiene un valor binario para determinar si esa cuenta se ha cancelado. p.ej

A | cancelled
C | active
B | active
A | cancelled

lo que quiero hacer es proponer algún tipo de prueba de hipótesis para probar si la relación de cuentas de tipo A, B y C es diferente para cuentas activas frente a cuentas canceladas, la hipótesis nula es que son las mismas. Entonces, es como una prueba de hipótesis para proporciones, excepto que no sé cómo hacer esto para 3 valores

usuario1893354
fuente
66
Puede usar una prueba de para probar la igualdad de proporciones entre los tres grupos. χ2
También estoy pensando en lo que podía hacer tres hipótesis de prueba A frente a B, B vs C, y A vs C, para ver si son diferentes
user1893354
55
Podría, pero tenga en cuenta que luego tendría que corregir los problemas de comparaciones múltiples.
Gracias por su respuesta. Tengo curiosidad por saber qué quieres decir con problemas de comparaciones múltiples. O, más específicamente, por qué el método de prueba de tres hipótesis es desventajoso. ¡Gracias!
user1893354
3
χ2

Respuestas:

13

χ2H0

H0:p1=p2=...=pk

es decir, todas las proporciones son iguales entre sí. Ahora en su caso su hipótesis nula es la siguiente:

H0:p1=p2=p3
HA: at leat one pi is different for i=1,2,3

Ahora para realizar la necesitamos calcular el siguiente estadístico de prueba: El valor del estadístico de prueba esχ2

χ2=i=1n(OiEi)2Ei

dónde

  • χ2 = prueba estadística acumulada de Pearson, que asintóticamente se acerca a un distribuciónχ2
  • Oi = la frecuencia observada
  • Ei = una frecuencia esperada (teórica), afirmada por la hipótesis nula
  • n = el número de celdas en la tabla

En su caso, ya que podemos considerar este problema como la siguiente tabla: n=6ingrese la descripción de la imagen aquí

Ahora, una vez que tenemos la estadística de prueba, tenemos dos opciones de cómo proceder para completar nuestra prueba de hipótesis.

Opción 1) Podemos comparar nuestra prueba static con el valor crítico apropiado bajo la hipótesis nula. Es decir, si es verdadero, entonces una estadística de una tabla de contingencia con filas y columnas debería tener una con grados de libertad. Después de calcular nuestro valor crítico si tenemos que , rechazaremos la hipótesis nula. Obviamente si entonces no podemos rechazar la hipótesis nula. H 0 χ 2 R C χ 2 ( R - 1 ) × ( C - 1 ) χ χ 2 > χ χ 2χ χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

Gráficamente (todos los números están formados) esto es lo siguiente: ingrese la descripción de la imagen aquí

En el gráfico, si nuestro estadístico de prueba corresponde al estadístico de prueba azul, no podríamos rechazar la hipótesis nula ya que este estadístico de prueba no cae dentro de la región crítica (es decir, ) Alternativamente, el estadístico de prueba verde cae dentro de la región crítica, por lo que rechazaríamos la hipótesis nula si hubiéramos calculado el estadístico de prueba verde.χ 2 < χ χ2χ2<χ

df=(R1)×(C1)=(21)×(31)=1×2=2

ααχ(R1)×(C1)2

Gráficamente tenemos eso ingrese la descripción de la imagen aquí

donde el valor p se calcula como el área que es mayor que nuestra estadística de prueba (el área sombreada en azul en el ejemplo).

α>p-valueH0

αp-valueH0


fuente