Estoy enseñando un curso de estadística básica y hoy cubriré la prueba de independencia chi-cuadrado para dos categorías y la prueba de homogeneidad. Estos dos escenarios son conceptualmente diferentes, pero pueden usar la misma estadística y distribución de prueba. En una prueba de homogeneidad, se supone que los totales marginales para una de las categorías son parte del diseño en sí mismo: representan el número de sujetos seleccionados para cada grupo experimental. Pero dado que la prueba de chi cuadrado gira en torno al condicionamiento de todos los totales marginales, no hay consecuencias matemáticas para distinguir entre las pruebas de homogeneidad y las pruebas de independencia con datos categóricos, al menos ninguna cuando se usa esta prueba.
Mi pregunta es la siguiente: ¿hay alguna escuela de pensamiento estadístico o enfoque estadístico que arroje diferentes análisis, dependiendo de si estamos probando la independencia (donde todos los marginales son variables aleatorias) o una prueba de homogeneidad (donde hay un conjunto de marginales establecido por el diseño)?
En el caso continuo, diga dónde observamos sobre el mismo tema y probamos independencia, u observamos en diferentes poblaciones y probamos si provienen de la misma distribución, el método es diferente (correlación análisis vs prueba t). ¿Qué pasa si los datos categóricos provienen de variables continuas discretizadas? ¿Deberían las pruebas de independencia y homogeneidad ser indistinguibles?( X 1 , X 2 )
Respuestas:
Simplemente tiene que preguntarse: "¿Cómo escribo la hipótesis nula?". Considere una tabla de contingencia de frecuencias de algún comportamiento (y / n) entre varios grupos . Tratando al primer grupo como referente, tiene odds ratios ( ) que describen la asociación entre frecuencia y grupo.k k - 1 θ i , i = 1 , 2 , … , k - 12×k k k−1 θi,i=1,2,…,k−1
Bajo independencia como con homogeneidad, usted asume que todas las odds ratio son 1. Es decir, la probabilidad de responder "sí" a la condición es igualmente probable independientemente de la asignación del grupo. Si esas suposiciones fallan, al menos un grupo es diferente.
Y esta prueba se puede realizar con la prueba de Chi-cuadrado de Pearson utilizando frecuencias observadas / esperadas, que es la prueba de puntaje para el modelo de regresión logística que se ajusta a las variables indicadoras para la pertenencia al grupo. Estructuralmente, podemos decir que estas pruebas son las mismas.k−1
Sin embargo, surgen diferencias cuando consideramos la naturaleza del factor de agrupación. En este sentido, la aplicación contextual de la prueba, o más bien su nombre, es importante. Un grupo puede ser directamente causal de un resultado, como la presencia o ausencia de un gen o patrones de alelos de un rasgo en cuyo caso, cuando rechazamos el valor nulo, concluimos que el resultado depende del factor de agrupación en cuestión.
Por otro lado, cuando probamos la homogeneidad, nos exoneramos de hacer suposiciones causales. Por lo tanto, cuando el "grupo" es una construcción sofisticada como la raza (que causa y es causada por determinantes genéticos, conductuales y socioeconómicos) podemos sacar conclusiones como "las minorías raciales-étnicas experimentan disparidades de vivienda como lo demuestra la heterogeneidad en el índice de privación del vecindario" . Si alguien contrarrestara tal argumento diciendo: "bueno, eso es porque las minorías logran una educación más baja, obtienen ingresos más bajos y obtienen menos empleo", podría decir: "No afirmé que su raza causó estas cosas, simplemente eso si se mira en la raza de uno, puedes hacer predicciones sobre sus condiciones de vida ".
De ese modo, las pruebas de dependencia son un caso especial de pruebas de homogeneidad donde el posible efecto de los factores de acecho es de interés y debe manejarse en un análisis estratificado. El uso del ajuste multivariado en el modelo de regresión logística análogo logra tal cosa, y aún podemos decir que estamos realizando una prueba de dependencia, pero no necesariamente de homogeneidad.
fuente
Hay una clara diferencia entre los dos problemas si los modela a la manera bayesiana. En algunos documentos, el primer caso (homogeneidad) se denomina muestreo con "un margen fijo" y el segundo caso (independencia) como "tabla total fija". Eche un vistazo, por ejemplo, a Casella et al. (JASA 2009) .
Estoy trabajando en este tema, pero mi trabajo, que también describe esta distinción, aún no está publicado :)
fuente