Si alguien hace una declaración como la siguiente:
"En general, los no fumadores expuestos al humo ambiental tenían un riesgo relativo de enfermedad coronaria de 1,25 (intervalo de confianza del 95 por ciento, 1,17 a 1,32) en comparación con los no fumadores no expuestos al humo".
¿Cuál es el riesgo relativo para la población en general? ¿Cuántas cosas están relacionadas con la enfermedad coronaria? De la gran cantidad de cosas que se pueden probar, muy pocas están realmente relacionadas con la enfermedad coronaria, por lo que la posibilidad de que cualquier cosa particular elegida al azar esté conectada es muy pequeña. Por lo tanto, podemos decir que el riesgo relativo para la población es 1. Pero el intervalo citado no contiene el valor 1. Entonces, en realidad, existe una conexión entre las dos cosas, cuya probabilidad es muy pequeña, o esta es una de El 5% de los intervalos que no contienen el parámetro. Como lo último es mucho más probable que lo primero, es lo que deberíamos asumir. Por lo tanto, la conclusión apropiada es que el conjunto de datos era casi ciertamente atípico de la población,
Por supuesto, si hay alguna base para suponer que más del 5% de las cosas están relacionadas con la enfermedad coronaria, entonces podría haber alguna evidencia en la estadística que respalde la sugerencia de que el humo ambiental es una de ellas. El sentido común sugiere que esto es poco probable.
¿Cuál es el error en su razonamiento (ya que todas las organizaciones de salud están de acuerdo en que existe una literatura importante sobre los efectos dañinos del tabaquismo)? ¿Se debe a su premisa de que "de la gran cantidad de cosas que se pueden probar, muy pocas están realmente relacionadas con la enfermedad coronaria"? Esta oración puede ser cierta para cualquier factor elegido al azar (es decir, cuántos perros posee una persona con riesgo de enfermedad coronaria), pero la probabilidad a priori es mucho mayor para el tabaquismo y la enfermedad coronaria que simplemente 'cualquier factor aleatorio' .
¿Es este el razonamiento correcto? O hay algo más?
Respuestas:
Hay muchas cosas mal aquí. Como explica @ Néstor, él asume implícitamente probabilidades previas en (sin enlace) y (enlace).H 1H0 H1
Coloca un peso muy alto (muy cerca de 1) en y un peso muy pequeño en . Esta es la primera cosa dudosa que hace, ya que existe un vínculo mecanicista entre el humo y la enfermedad cardíaca (considere los fumadores activos), la pregunta realmente es si la exposición es suficiente. Esto ni siquiera considera los estudios previos realizados. Por lo tanto, en realidad no es una de una "gran cantidad de cosas" que se probará, como por ejemplo usar calcetines rojos. Esto significa que ya comienza con un previo muy parcial y no realmente justificable.H 1H0 H1
Luego actualiza su previo al afirmar que la probabilidad de obtener un intervalo de confianza del 95% de no contener el valor verdadero tiene una probabilidad del 5%. Si bien esto es cierto, esta no es la oportunidad de obtener ese intervalo particular bajo el supuesto de la hipótesis nula . Tenga en cuenta que habría tratado un intervalo de confianza de [1.17, 1.32] exactamente igual que un intervalo de confianza de [100, 200] que es claramente problemático.
Esto es realmente importante para el enfoque bayesiano: si bien tiene una probabilidad total de 5% de no obtener un intervalo que contenga el 1 bajo el supuesto de que 1 es cero, la densidad de probabilidad de obtener ese intervalo en particular es diferente (y menor).
El tercer error es que nunca especificó su anterior ni declara cuán probable tiene que ser frente a para que obtenga ese resultado. Es simplemente "muy pequeño".H 1H0 H1
El cuarto error es decir que la acción apropiada a tomar sería descartar los datos. Tenga en cuenta que su resultado ni siquiera depende de los datos, su argumento implica exactamente la misma acción que se habría realizado para cualquier dato. Si encuentra un enlace interesante pero sospecha que podría ser una casualidad, ¡lo más apropiado es intentar replicar su resultado!
fuente
Este es un tema filosófico bastante interesante relacionado con la prueba de hipótesis (y, por lo tanto, en el contexto frecuentista también los intervalos de confianza, como explico aquí ).
Por supuesto, hay muchas hipótesis que podrían investigarse: el tabaquismo pasivo causa enfermedad coronaria, el consumo de alcohol provoca enfermedad cardíaca crónica, la posesión de perros causa enfermedad cardíaca crónica, ser un Capricornio causa enfermedad cardíaca crónica ...
Si elegimos una de todas estas hipótesis al azar, la probabilidad de que elijamos una hipótesis que sea verdadera es prácticamente cero. Este parece ser el argumento en el texto citado: que es muy poco probable que probamos una hipótesis verdadera.
Pero la hipótesis no fue elegida al azar. Fue motivado por el conocimiento epidemiológico y médico previo sobre la enfermedad coronaria. Existen mecanismos teóricos que explican cómo fumar podría causar enfermedad coronaria, por lo que no parece descabellado pensar que también funcionarían para fumar pasivamente.
La crítica en la cita puede ser válida para estudios exploratorios donde se extrae un conjunto de datos para hipótesis. Esa es la razón por la que no aceptamos tales "descubrimientos" como hechos, sino que exigimos que los resultados se puedan replicar en nuevos estudios. De cualquier manera, el artículo citado en la cita es un metaestudio y, por lo tanto, no se ve afectado por este problema.
Hemos visto empíricamente en los últimos siglos que probar hipótesis motivadas por la teoría al comparar los resultados pronosticados con los resultados observados funciona. El hecho de que creamos en este procedimiento es la razón por la que hemos progresado tanto en medicina, ingeniería y ciencia. Es la razón por la que puedo escribir esto en mi computadora y que puedes leerlo en la tuya. Argumentar que este procedimiento es incorrecto es argumentar que el método científico es fundamentalmente defectuoso, y tenemos muchas pruebas que dicen lo contrario.
Dudo que haya algo que una persona que no esté dispuesta a aceptar este tipo de evidencia realmente acepte ...
fuente
Realmente no entiendo por qué el autor dice que la probabilidad de que el riesgo relativo de enfermedad coronaria sea 1 podría ser muy pequeña basando su análisis únicamente en un intervalo de confianza; Esto es completamente incorrecto. Para mí, parece que está usando una configuración frecuentista, pero está razonando bayesianamente (lo cual es bastante común).
Lo único relacionado con un IC son las pruebas de significación clásicas, pero, como todos sabemos, si { No existe un vínculo entre el tabaquismo de segunda mano y la enfermedad coronaria }, le dan (donde denota " datos al menos tan extremos como los que observamos "), no (donde son los datos), que es lo que él afirma y qué está vinculado exactamente a lo que usted señala; ¡tienes que incorporar conocimiento previo sobre ese enlace en particular! Esto viene del hecho de que: según el Teorema de Bayes, donde es la probabilidad previa en .p ( D e | H 0 ) D e p ( H 0 | D ) D p ( H 0 | D ) ∝ p ( D | H 0 ) p ( H 0 ) , p ( H 0 ) H 0H0: p(De|H0) De p(H0|D) D
fuente
Si bien hay algo en esta línea de razonamiento bayesiano (¡deconstruido muy a fondo por Erik!), Y de hecho esta línea de pensamiento explicaría por qué muchos hallazgos médicos no pueden reproducirse, este argumento en particular aplica ese pensamiento como un mazo.
El autor presupone dos cosas sin proporcionar evidencia: que la exposición al humo se eligió al azar y que casi nada en el mundo causa enfermedades cardíacas. Bajo estos laxos estándares de razonamiento, el autor podría rechazar CUALQUIER conclusión de que algo causa una enfermedad cardíaca. Todo lo que necesita hacer es afirmar:
Ambas afirmaciones son discutibles (y, según mi conocimiento general, muy probablemente sean falsas). Pero, con estos supuestos en su lugar, incluso observando que el 100% de las personas expuestas al humo de segunda mano cayeron muertos de un ataque cardíaco dentro de un año, podría afirmar que la conexión es simplemente una correlación coincidente con la causa oculta, singular y "verdadera" .
fuente
No veo nada obviamente malo en el párrafo entre comillas, pero no he visto los datos y no puedo verificar sus números. Sin embargo, los dos párrafos que siguen son muy poco claros.
Supongamos que dijo: "En general, los no fumadores que eran obesos mórbidos tenían un riesgo relativo de enfermedad coronaria de 1,25 (intervalo de confianza del 95 por ciento, 1,17 a 1,32) en comparación con los no fumadores que tenían un peso corporal normal". ¿Alguien tendría motivos para dudar de él?
fuente