He intentado leer sobre diferentes fuentes, pero todavía no tengo claro qué prueba sería la adecuada en mi caso. Hay tres preguntas diferentes que hago sobre mi conjunto de datos:
Los sujetos son evaluados para detectar infecciones de X en diferentes momentos. Quiero saber si las proporciones de positivo para X después están relacionadas con la proporción de positivo para X antes:
After |no |yes| Before|No |1157|35 | |Yes |220 |13 | results of chi-squared test: Chi^2 = 4.183 d.f. = 1 p = 0.04082 results of McNemar's test: Chi^2 = 134.2 d.f. = 1 p = 4.901e-31
Según tengo entendido, como los datos son medidas repetidas, debo usar la prueba de McNemar, que prueba si la proporción de positivo para X ha cambiado.
Pero mis preguntas parecen necesitar la prueba de ji cuadrado: probar si la proporción de positivo para X después está relacionada con la proporción de positivo para X antes.
Ni siquiera estoy seguro si entiendo la diferencia entre la prueba de McNemar y el chi-cuadrado correctamente. ¿Cuál sería la prueba correcta si mi pregunta fuera: "¿La proporción de sujetos infectados con X después es diferente de antes?"
Un caso similar, pero donde en lugar de antes y después, mido dos infecciones diferentes en un momento dado:
Y |no |yes| X|No |1157|35 | |Yes |220 |13 |
¿Qué prueba sería correcta aquí si la pregunta es "¿Las proporciones más altas de una infección se relacionan con proporciones más altas de Y"?
Si mi pregunta fuera: "¿La infección Y en el momento t2 está relacionada con la infección X en el tiempo t1?", ¿Qué prueba sería apropiada?
Y at t2 |no |yes| X at t1|No |1157|35 | |Yes |220 |13 |
Estaba usando la prueba de McNemar en todos estos casos, pero tengo mis dudas sobre si esa es la prueba correcta para responder mis preguntas. Estoy usando R. ¿Podría usar un binomio en su glm
lugar? ¿Sería eso análogo a la prueba de chi-cuadrado?
fuente
Respuestas:
Es muy lamentable que la prueba de McNemar sea tan difícil de entender para la gente. Incluso noto que en la parte superior de su página de Wikipedia dice que la explicación en la página es difícil de entender para la gente. La explicación breve típica de la prueba de McNemar es que es: 'una prueba de chi-cuadrado dentro de los sujetos' o que es 'una prueba de la homogeneidad marginal de una tabla de contingencia'. No encuentro que ninguno de estos sea muy útil. Primero, no está claro qué se entiende por 'chi-cuadrado dentro de los sujetos', porque siempre estás midiendo tus sujetos dos veces (una vez en cada variable) y tratando de determinar la relación entre esas variables. Además, 'homogeneidad marginal' (Trágicamente, incluso esta respuesta puede ser confusa. Si lo es, puede ser útil leer mi segundo intento a continuación).
Veamos si podemos trabajar a través de un proceso de razonamiento sobre su ejemplo principal para ver si podemos entender si (y si es así, por qué) la prueba de McNemar es apropiada. Usted ha puesto:
Esta es una tabla de contingencia, por lo que connota un análisis de chi-cuadrado. Además, desea comprender la relación entre y A f t e r , y la prueba de chi-cuadrado verifica la relación entre las variables, por lo que a primera vista parece que la prueba de chi-cuadrado debe ser El análisis que responde a su pregunta.B e fo r e UNA ft e r
Sin embargo, vale la pena señalar que también podemos presentar estos datos así:
Cuando observa los datos de esta manera, puede pensar que podría hacer una prueba antigua normal . Pero una prueba t no está del todo bien. Hay dos problemas: Primero, debido a que cada fila enumera los datos medidos del mismo sujeto, no queremos hacer una prueba t entre sujetos , nos gustaría hacer una prueba t dentro de los sujetos . En segundo lugar, dado que estos datos se distribuyen como un binomio , la varianza es una función de la media. Esto significa que no hay una incertidumbre adicional de la que preocuparse una vez que se ha estimado la media de la muestra (es decir, no tiene que estimar posteriormente la varianza), por lo que no tiene que referirse a la distribución t , puede usar el zt t t t t z distribución. (Para más información sobre esto, puede ayudar a leer mi respuesta aquí: El -test frente a la χ 2 pruebasz χ2 .) Por lo tanto, se necesita un intra-sujetos -test. Es decir, necesitamos una prueba de igualdad de proporciones dentro de los sujetos. z
Hemos visto que hay dos formas diferentes de pensar y analizar estos datos (impulsados por dos formas diferentes de ver los datos). Por lo tanto, debemos decidir de qué manera debemos usar. La prueba de chi cuadrado evalúa si y A f t e r son independientes. Es decir, las personas que estuvieron enfermas de antemano tienen más probabilidades de enfermarse después que las personas que nunca han estado enfermas. Es extremadamente difícil ver cómo ese no sería el caso dado que estas mediciones se evalúan en los mismos sujetos. Si obtuviera un resultado no significativo (como casi lo hace) eso sería simplemente un error de tipo II. En lugar de si B e fB e fo r e A ft e r y A f t e r son independientes, es casi seguro que desea saber si el tratamiento funciona (una pregunta chi-cuadrado no responde). Esto es muy similar a cualquier número de estudios de tratamiento versus control en los que desea ver si las medias son iguales, excepto que en este caso sus mediciones son sí / no y son dentro de los sujetos. Considere una t más típicaB e fo r e A ft e r t -test situación con presión arterial medida antes y después de algún tratamiento. Aquellos cuyo punto de referencia estaba por encima de su promedio de muestra de antemano, casi seguramente tenderán a estar entre los puntos de referencia más altos después, pero no desea saber sobre la consistencia de las clasificaciones, desea saber si el tratamiento condujo a un cambio en el punto de referencia medio . Su situación aquí es directamente análoga. Específicamente, desea ejecutar una prueba de igualdad de proporciones dentro de los sujetos . Esa es la prueba de McNemar.z
R
Hay otra discusión sobre la prueba de McNemar, con extensiones a las tablas de contingencia mayores de 2x2, aquí .
Aquí hay una
R
demostración con sus datos:Si no tomáramos en cuenta la naturaleza de los datos dentro de los sujetos, tendríamos una prueba un poco menos poderosa de la igualdad de proporciones:
X-squared = 133.6627
chi-squared = 134.2157
Aquí están las respuestas a sus preguntas concretas:
Esta versión es más complicada, y la redacción "hace que proporciones más altas de una infección se relacionen con proporciones más altas de Y" es ambigua. Hay dos posibles preguntas:
Dado que esta es una vez más la misma infección, por supuesto, estarán relacionados. Entiendo que esta versión no es antes y después de un tratamiento, sino solo en algún momento posterior. Por lo tanto, se pregunta si las tasas de infección de fondo están cambiando orgánicamente, lo que nuevamente es una pregunta perfectamente razonable. En cualquier caso, el análisis correcto es la prueba de McNemar.Editar: Parece que interpreté mal su tercera pregunta, tal vez debido a un error tipográfico. Ahora lo interpreto como dos infecciones diferentes en dos puntos de tiempo separados. Según esta interpretación, la prueba de ji cuadrado sería apropiada.
fuente
Bueno, parece que hice un hash de esto. Permítanme intentar explicar esto nuevamente, de una manera diferente y veremos si puede ayudar a aclarar las cosas.
La forma tradicional de explicar la prueba de McNemar frente a la prueba de chi-cuadrado es preguntar si los datos están "emparejados" y recomendar la prueba de McNemar si los datos están emparejados y la prueba de chi-cuadrado si los datos están "no emparejados". He descubierto que esto genera mucha confusión (¡este hilo es un ejemplo!). En lugar de esto, he descubierto que es más útil enfocarse en la pregunta que está tratando de hacer y usar la prueba que coincida con su pregunta. Para hacer esto más concreto, veamos un escenario inventado:
Aquí están los datos:
En este punto, es importante determinar qué pregunta queremos hacer con nuestros datos. Hay tres preguntas diferentes que podríamos hacer aquí:
BP
yNationality
están asociados o independientes;Finalmente, podríamos preguntarnos si la proporción de estadísticos con presión arterial alta es igual a la proporción de estadísticos estadounidenses con los que hablamos. Esto se refiere a las proporciones marginales de la tabla. Estos no se imprimen por defecto en R, pero podemos obtenerlos de esta manera (tenga en cuenta que, en este caso, son exactamente iguales):
Como dije, el enfoque tradicional, discutido en muchos libros de texto, es determinar qué prueba usar en función de si los datos están "emparejados" o no. Pero esto es muy confuso, ¿esta tabla de contingencia está "emparejada"? Si comparamos la proporción con presión arterial alta entre los estadísticos de EE. UU. Y el Reino Unido, está comparando dos proporciones (aunque de la misma variable) medidas en diferentes grupos de personas. Por otro lado, si desea comparar la proporción con presión arterial alta con la proporción US, está comparando dos proporciones (aunque de diferentes variables) medidas en el mismo grupo de personas. Estos datos son ambos"emparejado" y "no emparejado" al mismo tiempo (aunque con respecto a diferentes aspectos de los datos). Esto lleva a la confusión. Para tratar de evitar esta confusión, argumento que debes pensar en términos de qué pregunta estás haciendo. Específicamente, si quieres saber:
Alguien podría estar en desacuerdo conmigo aquí, argumentando que debido a que la tabla de contingencia no está "emparejada", la prueba de McNemar no puede usarse para probar la igualdad de las proporciones marginales y que la prueba de chi-cuadrado debería usarse en su lugar. Dado que este es el punto de discusión, intentemos ambos para ver si los resultados tienen sentido:
Probemos con otro ejemplo:
Esta vez, la prueba de ji cuadrado da un valor p de 1, lo que significa que las proporciones marginales son tan iguales como pueden ser. Pero vimos que las proporciones marginales obviamente no son iguales, por lo que este resultado no tiene ningún sentido a la luz de nuestros datos. Por otro lado, la prueba de McNemar arroja un valor p de aproximadamente 0. En otras palabras, es extremadamente improbable obtener datos con proporciones marginales tan lejos de la igualdad como estos, si realmente son iguales en la población. Dado que nuestras proporciones marginales observadas están lejos de ser iguales, este resultado tiene sentido.
El hecho de que la prueba de ji al cuadrado arroje resultados que no tienen sentido dados nuestros datos sugiere que hay algo malo en usar la prueba de ji al cuadrado aquí. Por supuesto, el hecho de que la prueba de McNemar proporcionó resultados razonables no prueba que sea válida, puede que haya sido una coincidencia, pero la prueba de ji cuadrado es claramente incorrecta.
Veamos si podemos analizar el argumento de por qué la prueba de McNemar podría ser la correcta. Usaré un tercer conjunto de datos:
(Para usar
prop.test()
para probar las proporciones marginales, tuve que ingresar los números de 'éxitos' y el número total de 'pruebas' manualmente, pero puedes ver desde la última línea de la salida que las proporciones son correctas). Esto sugiere que es poco probable que obtenga proporciones marginales tan lejos de la igualdad si fueran realmente iguales, dada la cantidad de datos que tenemos.¿Es válida esta prueba? Aquí hay dos problemas: la prueba cree que tenemos 800 datos, cuando en realidad solo tenemos 400. Esta prueba tampoco tiene en cuenta que estas dos proporciones no son independientes, en el sentido de que se midieron en las mismas personas.
En esta versión, solo se utilizan las observaciones informativas y no se cuentan dos veces. El valor p aquí es mucho más pequeño, 0.0000001588, que a menudo es el caso cuando se tiene en cuenta la dependencia en los datos. Es decir, esta prueba es más poderosa que la prueba z de diferencia de proporciones. Podemos ver además que la versión anterior es esencialmente la misma que la prueba de McNemar:
Si la no identidad es confusa, la prueba de McNemar típicamente, y en R, cuadra el resultado y lo compara con la distribución de chi-cuadrado, que no es una prueba exacta como el binomio anterior:
Por lo tanto, cuando desea verificar que las proporciones marginales de una tabla de contingencia sean iguales, la prueba de McNemar (o la prueba binomial exacta calculada manualmente) es correcta. Utiliza solo la información relevante sin usar ilegalmente ningún dato dos veces. No solo 'sucede' para producir resultados que tengan sentido de los datos.
Sigo creyendo que intentar averiguar si una tabla de contingencia está "emparejada" no es útil. Sugiero usar la prueba que coincida con la pregunta que está haciendo de los datos.
fuente
Por ejemplo, puede tener una muestra de 20 estadísticos de los EE. UU., Y una muestra independiente separada de 37 estadísticos del Reino Unido, y medir si estos estadísticos son hipertensos o normotensos. Su hipótesis nula es que tanto los estadísticos del Reino Unido como los de los Estados Unidos tienen la misma probabilidad subyacente de ser hipertensos (es decir, saber si uno es de los EE. UU. O del Reino Unido no dice nada sobre la probabilidad de hipertensión). Por supuesto, es posible que pueda tener el mismo tamaño de muestra en cada grupo, pero eso no cambia el hecho de que las muestras sean independientes (es decir, sin emparejar ).
Por ejemplo, es posible que tenga datos de estudios de casos y controles emparejados individualmente de una conferencia internacional de estadísticos, donde 30 estadísticos con hipertensión (casos) y 30 estadísticos sin hipertensión (controles; que son individualmente emparejados por edad, sexo, IMC y tabaquismo en casos particulares), son evaluados retrospectivamente para residencia profesional en el Reino Unido versus residencia en otro lugar. Lo nulo es que la probabilidad de residir en el Reino Unido entre los casos es la misma que la probabilidad de residir en el Reino Unido como controles (es decir, saber sobre el estado hipertensivo de uno no dice nada sobre el historial de residencia del Reino Unido).
Además, en su ejemplo, sus datos están emparejados (la misma variable se mide dos veces en el mismo sujeto) y, por lo tanto, la prueba de McNemar es la opción adecuada de prueba para la asociación.
[Gung y yo no estuvimos de acuerdo por un tiempo sobre una respuesta anterior.]
Referencias citadas
"Suponiendo que todavía estamos interesados en comparar proporciones, ¿qué podemos hacer si nuestros datos están emparejados, en lugar de ser independientes? ... En esta situación, usamos la prueba de McNemar". - Pagano y Gauvreau, Principios de bioestadística , 2da. edición, página 349. [ Énfasis agregado ]
"La expresión es mejor conocida como la estadística de prueba de pares emparejados de McNemar (McNemar, 1949), y ha sido un pilar del análisis de pares emparejados ". - Rothman, Groenlandia y Lash. Epidemiología moderna , página 286. [ Énfasis agregado ]
"La prueba t pareada y las medidas repetidas de análisis de varianza se pueden usar para analizar experimentos en los que la variable que se está estudiando se puede medir en una escala de intervalo (y satisface otras suposiciones requeridas de los métodos paramétricos). ¿Qué pasa con los experimentos, análogos a los en el Capítulo 5, ¿dónde se mide el resultado en una escala nominal ? Este problema a menudo surge cuando se pregunta si un individuo respondió o no a un tratamiento o al comparar los resultados de dos pruebas de diagnóstico diferentes que se clasifican como positivas o negativas en los mismos individuos. Desarrollaremos un procedimiento para analizar tales experimentos, la prueba de Mcnemar para los cambios , en el contexto de uno de esos estudios ". - Glanz, Primer of Biostatisticsχ2
"Para los datos de control de casos coincidentes con un control por caso , el análisis resultante es simple, y la prueba estadística adecuada es la prueba de chi-cuadrado de McNemar ... tenga en cuenta que para el cálculo de la razón de probabilidades y la estadística, los únicos contribuyentes son los pares que tienen una exposición diferente , es decir, los pares donde el caso estuvo expuesto pero el control no, y aquellos donde el control estuvo expuesto pero el caso no. "- Elwood. Valoración crítica de estudios epidemiológicos y ensayos clínicos , primera edición, páginas 189-190. [ Énfasis agregado ]
fuente
Mi comprensión de la prueba de McNemar es la siguiente: se utiliza para ver si una intervención ha marcado una diferencia significativa en un resultado binario. En su ejemplo, se verifica la infección en un grupo de sujetos y la respuesta se registra como sí o no. Todos los sujetos reciben alguna intervención, por ejemplo, un antibiótico. Luego se verifican nuevamente para detectar infección y la respuesta se registra como sí / no nuevamente. Los (pares de) respuestas se pueden poner en la tabla de contingencia:
Y la prueba de McNemar sería apropiada para esto.
De la tabla se desprende que muchos más se han convertido de 'sí' a 'no' (220 / (220 + 13) o 94.4%) que de 'no' a 'sí' (35 / (1157 + 35) o 2.9 %). Considerando estas proporciones, el valor P de McNemar (4.901e-31) parece más correcto que el valor P de chi-cuadrado (0.04082).
Si la tabla de contingencia representa 2 infecciones diferentes (pregunta 2), entonces Chi-cuadrado sería más apropiado.
Tu tercera pregunta es ambigua: primero declaras relacionar Y en t2 con Y en t1 pero en la tabla escribes 'X' en t1 vs Y en t2. Y en t2 vs Y en t1 es lo mismo que su primera pregunta y, por lo tanto, se necesita la prueba de McNemar, mientras que X en t1 e Y en t2 indican que se están comparando diferentes eventos y, por lo tanto, Chi-cuadrado será más apropiado.
Editar: Como lo menciona Alexis en el comentario, los datos de control de casos coincidentes también se analizan mediante la prueba de McNemar. Por ejemplo, 1425 pacientes con cáncer son reclutados para un estudio y para cada paciente también se recluta un control compatible. Todos estos (1425 * 2) se verifican en busca de infección. Los resultados de cada par se pueden mostrar en una tabla similar:
Mas claro:
Muestra que es mucho más frecuente que un paciente con cáncer tuviera una infección y el control no, en lugar de lo contrario. Su importancia puede ser probada por la prueba de McNemar.
Si estos pacientes y controles no coincidían e eran independientes, solo se puede hacer la siguiente tabla y hacer una prueba de chisquare:
Mas claro:
Tenga en cuenta que estos números son los mismos que los márgenes de la primera tabla:
Esa debe ser la razón para el uso de términos como "frecuencias marginales" y "homogeneidad marginal" en la prueba de McNemar.
Curiosamente, la función addmargins también puede ayudar a decidir qué prueba usar. Si el total general es la mitad del número de sujetos observados (lo que indica que se ha realizado el emparejamiento), entonces se aplica la prueba de McNemar; de lo contrario, es apropiada la prueba cuadriculada:
Los códigos R para las tablas anteriores son de las respuestas anteriores:
El siguiente pseudocódigo también puede ayudar a conocer la diferencia:
Editar:
mid-p
La variación de la prueba de McNemar ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3716987/ ) es interesante. Se comparab
yc
de la tabla de contingencia, es decir, el número que cambió de sí a no versus el número que cambió de no a sí (ignorando el número de aquellos que permanecieron sí o no durante el estudio). Se puede realizar usando la prueba binomial en python, como se muestra en https://gist.github.com/kylebgorman/c8b3fb31c1552ecbaafbPodría ser equivalente a,
binom.test(b, b+c, 0.5)
ya que en un cambio aleatorio, uno esperaríab
ser igual ac
.fuente