He leído que la prueba de chi cuadrado es útil para ver si una muestra es significativamente diferente de un conjunto de valores esperados.
Por ejemplo, aquí hay una tabla de resultados de una encuesta sobre los colores favoritos de las personas (n = 15 + 13 + 10 + 17 = 55 encuestados totales):
red,blue,green,yellow
15,13,10,17
Una prueba de chi cuadrado me puede decir si esta muestra es significativamente diferente de la hipótesis nula de igual probabilidad de que a las personas les guste cada color.
Pregunta: ¿Se puede realizar la prueba en las proporciones del total de encuestados a quienes les gusta un determinado color? Como abajo:
red,blue,green,yellow
0.273,0.236,0.182,0.309
Donde, por supuesto, 0.273 + 0.236 + 0.182 + 0.309 = 1.
Si la prueba de chi cuadrado no es adecuada en este caso, ¿qué prueba sería? ¡Gracias!
Editar: Intenté la respuesta de @Roman Luštrik a continuación, y obtuve el siguiente resultado, ¿por qué no obtengo un valor p y por qué R dice "La aproximación de Chi-cuadrado puede ser incorrecta"?
> chisq.test(c(0,0,0,8,6,2,0,0),p = c(0.406197174,0.088746395,0.025193306,0.42041479,0.03192905,0.018328576,0.009190708,0))
Chi-squared test for given probabilities
data: c(0, 0, 0, 8, 6, 2, 0, 0)
X-squared = NaN, df = 7, p-value = NA
Warning message:
In chisq.test(c(0, 0, 0, 8, 6, 2, 0, 0), p = c(0.406197174, 0.088746395, :
Chi-squared approximation may be incorrect
Respuestas:
Corrígeme si me equivoco, pero creo que esto se puede hacer en R usando este comando
Esto supone proporciones de 1/4 cada una. Puede modificar los valores esperados a través del argumento
p
. Por ejemplo, cree que las personas pueden preferir (por cualquier razón) un color sobre el otro (s).fuente
Usando la información adicional que proporcionó (dado que algunos de los valores son 0), es bastante obvio por qué su solución no devuelve nada. Por un lado, tienes una probabilidad de que sea 0, entonces:
Lo que hace que las divisiones sean imposibles. Ahora decir que significa que es imposible tener ese resultado. Si es así, también podría borrarlo de los datos (ver comentario de @cardinal). Si quiere decir altamente improbable, una primera 'solución' podría ser aumentar esa probabilidad 0 con un número muy pequeño.p=0
Dado:
Podrías hacerlo :
Pero este no es un resultado correcto. En cualquier caso, se debe evitar el uso de la prueba de chi-cuadrado en estos casos límite. Un mejor enfoque es utilizar un método de arranque, calcular un estadístico de prueba adaptado y comparar el de la muestra con la distribución obtenida por el arranque.
En el código R esto podría ser (paso a paso):
Esto proporciona un valor p de 0, que está mucho más en línea con la diferencia entre lo observado y lo esperado. Eso sí, este método supone que sus datos se extraen de una distribución multinomial. Si esta suposición no se cumple, el valor p tampoco se cumple.
fuente
fuente
Sí, puede probar la hipótesis nula: "H0: prop (rojo) = prop (azul) = prop (verde) = prop (amarillo) = 1/4" utilizando una prueba de chi cuadrado que compara las proporciones de la encuesta (0.273 , ...) a las proporciones esperadas (1/4, 1/4, 1/4, 1/4)
fuente
El estadístico de prueba para la prueba de chi-cuadrado de Pearson es
so a test of the significance of the observed proportions depends on the sample size, much as one would expect.
fuente