Encontré una siguiente explicación en un blog y me gustaría obtener más información sobre la no transitividad de la correlación:
Tenemos los siguientes hechos indiscutibles:
- En promedio, hay una diferencia en el volumen cerebral entre hombres y mujeres.
- Existe una correlación entre el coeficiente intelectual y el tamaño del cerebro; la correlación es 0.33 y por lo tanto corresponde al 10% de la variabilidad de IQ
De estas premisas 1 y 2, parece deducirse lógicamente de eso: las mujeres en promedio tienen un coeficiente intelectual más bajo que los hombres. ¡Pero es una falacia! En estadística, las correlaciones no son transitivas. La prueba es que solo necesita mirar los resultados de las pruebas de coeficiente intelectual, y muestran que el coeficiente intelectual de hombres y mujeres no difiere en promedio.
Me gustaría entender esta no transitividad de correlación un poco más profundo.
Si la correlación entre el coeficiente intelectual y el tamaño del cerebro fuera de 0.9 (que sé que no es (1)), ¿sería una falacia deducir que, en promedio, las mujeres tienen un coeficiente intelectual más bajo que los hombres?
Por favor, no estoy aquí para hablar sobre el coeficiente intelectual (y los límites de la prueba), el sexismo, el estereotipo de la mujer, la arrogancia, etc. (2). Solo quiero entender el razonamiento lógico detrás de la falacia.
(1) que sé que no lo es: los neandertales tenían cerebros más grandes que el homo sapiens, pero no eran más inteligentes;
(2) Soy una mujer y, en general, no me considero a mí misma ni a las otras mujeres menos inteligentes que los hombres, no me importa la prueba de coeficiente intelectual, porque lo que cuenta es el valor de las personas y no se basa en el habilidades intelectuales.
La fuente original en francés:
En les faits indiscutables suivantes:
- Il ya une différence of volume cérébral en moyenne entre hommes et femmes
- il ya une correlación entre QI et volume cérébral; la correlación es 0.33 y corresponde donc à 10% de la variabilidad
De ces prémisses 1 y 2, selle découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.
Mais c'est une erreur de raisonnement! En estadística, las correlaciones no son pasivas transitorias. La preuve, c'est que pour en avoir le cœur net, es suficiente para observar los resultados de las pruebas de QI, y el ceux-ci montrent que les QI des hommes et des femmes ne diffèrent pas en moyenne.
Respuestas:
Sí, aún sería una falacia.
Aquí hay una figura muy simple que muestra cuatro situaciones diferentes. En cada caso, los puntos rojos representan mujeres, los puntos azules representan hombres, el eje horizontal representa el tamaño del cerebro y el eje vertical representa el coeficiente intelectual. Generé los cuatro conjuntos de datos de manera que:
siempre existe la misma diferencia en el tamaño medio del cerebro entre hombres ( ) y mujeres ( unidades son arbitrarias). Estas son medias de población, pero esta diferencia es lo suficientemente grande como para ser estadísticamente significativa con cualquier tamaño de muestra razonable;2822 28
siempre hay una diferencia cero en el coeficiente intelectual medio entre hombres y mujeres (ambos ), y también una correlación cero entre el género y el coeficiente intelectual;100
La fuerza de la correlación entre el tamaño del cerebro y el coeficiente intelectual varía como se muestra en la figura.
En la subtrama superior izquierda, la correlación dentro del género (calculada por separado sobre los hombres y por separado sobre las mujeres, luego promediada) es , como en su cita. En la subtrama superior derecha, la correlación general (sobre hombres y mujeres juntos) es . Tenga en cuenta que su presupuesto no especifica a qué se refiere el número de . En la subtrama inferior izquierda, la correlación dentro del género es , como en su ejemplo hipotético; en la subtrama inferior derecha, la correlación general es .0.3 0.33 0.9 0.90.3 0.3 0.33 0.9 0.9
Por lo tanto, puede tener cualquier valor de correlación, y no importa si se calcula en general o dentro del grupo. Cualquiera sea el coeficiente de correlación, es muy posible que haya una correlación cero entre el género y el coeficiente intelectual y una diferencia de género cero en el coeficiente intelectual medio.
Explorando la no transitividad
Exploremos el espacio completo de posibilidades, siguiendo el enfoque sugerido por @kjetil. Suponga que tiene tres variables y (sin pérdida de generalidad) suponga que la correlación entre y es y la correlación entre y es . La pregunta es: ¿cuál es el valor positivo mínimo posible de la correlación entre y ? ¿A veces tiene que ser positivo o siempre puede ser cero?x 1 x 2 a > 0 x 2 x 3 b > 0 λ x 1 x 3x1,x2,x3 x1 x2 a>0 x2 x3 b>0 λ x1 x3
La matriz de correlación es y debe tener un determinante no negativo, es decir, lo que significa que tiene que estar entreSi ambas raíces son positivas, entonces el valor mínimo posible de es igual a la raíz más pequeña (¡y tiene que ser positivo!). Si cero está entre estas dos raíces, entonces puede ser cero.detR=-λ2+2abλ-(a2+b2-1)≥0,λab±√
Podemos resolver este numérica y gráficamente la posible valor positivo mínima de para diferentes y :a bλ a b
De manera informal, podríamos decir que las correlaciones serían transitiva si teniendo en cuenta que y , se podría concluir que . Vemos que para la mayoría de los valores y , puede ser cero, lo que significa que las correlaciones no son transitivos. Sin embargo, para algunos valores suficientemente altos de y , la correlación tiene que ser positiva , lo que significa que hay "cierto grado de transitividad" después de todo, pero restringido a correlaciones muy altas solamente. Tenga en cuenta que ambas correlaciones y tienen que ser altas.b > 0 λ > 0 a b λ a b λ a ba>0 b>0 λ>0 a b λ a b λ a b
Podemos establecer una condición precisa para esta "transitividad": como se mencionó anteriormente, la raíz más pequeña debe ser positiva, es decir, , que es equivalente a . Esta es una ecuación de un círculo! Y, de hecho, si observa la figura anterior, notará que la región azul forma un cuarto de círculo.a2+b2>1ab−(1−a2)(1−b2)−−−−−−−−−−−−−√>0 a2+b2>1
En su ejemplo específico, la correlación entre el género y el tamaño del cerebro es bastante moderada (quizás ) y la correlación entre el tamaño del cerebro y el coeficiente intelectual es , que está firmemente dentro de la región azul ( ) lo que significa que puede ser positivo, negativo o cero.b = 0.33 a 2 + b 2 < 1 λa=0.5 b=0.33 a2+b2<1 λ
Figura relevante del estudio original
Querías evitar discutir el género y el cerebro, pero no puedo evitar señalar que al ver la figura completa del artículo original ( Gur et al. 1999 ), se puede ver que, si bien no hay una diferencia de género en el puntaje del coeficiente intelectual verbal, hay ¡Una diferencia obvia y significativa en la puntuación espacial del coeficiente intelectual! Compare las subtramas D y F.
fuente
Actualizar:
En respuesta a los comentarios, he actualizado un poco la respuesta anterior. Ahora, ¿qué podemos hacer con esto? Según los cálculos anteriores, una correlación de 0.9 entre el coeficiente intelectual y el volumen cerebral (mucho más grande que el empírico). Entonces, la correlación entre género e IQ debe ser de al menos 0.62. Qué significa eso? En los comentarios, algunos dicen que esto no implica nada sobre las diferencias medias entre los géneros. ¡Pero eso no puede ser cierto! Sí, para las variables normalmente distribuidas podemos asignar correlación y medias sin relaciones. Pero el género es una variable cero-uno, para dicha variable no es una relación entre la correlación y diferencias de medias. Concretamente, el coeficiente intelectual está (digamos) normalmente distribuido, mientras que el género es discreto, cero uno. Supongamos que su mediaμ 1 = E ( x 1 | x 2 = 1p=0.5 (de modo realista). Entonces, una correlación positiva (por ejemplo) significa que el género tiende a ser "más alto" (es decir, uno) si el coeficiente intelectual es más alto. ¡Eso no puede suceder sin que haya una diferencia media! Hagamos el álgebra: Primero, para simplificar el álgebra, centremos el coeficiente intelectual en cero en lugar de los 100 habituales. Eso no cambiará ninguna correlación o diferencia de medias. Deje y . Con esto significa ya que . Tenemos y es Bernoulli con .μ1=E(x1|x2=1) μ0=E(x1|x2=0) μ=E(x1) μ=0=μ1+μ0 μ0=−μ1 x1∼N(μ=0,σ2) x2 p=1/2
Pero, de acuerdo con el OP, el verdadero valor de . Entonces la desigualdad se convierte en que , entonces es un valor posible. Entonces, en el caso verdadero, no se pueden sacar conclusiones sobre las diferencias medias en el coeficiente intelectual de la correlación entre el coeficiente intelectual y el volumen cerebral.λ ≥ - 0.7822 λ =ρ=0.33 λ≥−0.7822 λ=0
fuente
Esta es una situación en la que me gusta usar diagramas de ruta para ilustrar los efectos directos y los efectos indirectos , y cómo esos dos impactan las correlaciones generales.
Según la descripción original, tenemos una matriz de correlación a continuación. El tamaño del cerebro tiene una correlación de 0.3 con el coeficiente intelectual, la hembra y el coeficiente intelectual tienen una correlación de 0 entre sí. Completo la correlación negativa entre el tamaño femenino y el cerebro para que sea -0.3 (si tuviera que adivinar que es mucho más pequeño que eso, pero esto servirá para fines ilustrativos).
Si ajustamos un modelo de regresión donde el coeficiente intelectual es una función del tamaño del cerebro y ser mujer, podemos ilustrar esto en términos de un diagrama de ruta. He completado los coeficientes de regresión parcial en las flechas, y el nodo B representa el tamaño del cerebro y el nodo F representa la hembra.
Ahora, qué loco es eso: al controlar el tamaño del cerebro, dadas estas correlaciones, las mujeres tienen una relación positiva con el coeficiente intelectual. ¿Por qué es esto, cuando la correlación marginal es cero? Según las reglas con diagramas de trayectoria lineal ( Wright, 1934 ), podemos descomponer la correlación marginal en función del efecto directo al controlar el tamaño del cerebro y el efecto indirecto:
En esta notación . Entonces, según la definición original, sabemos que este efecto total es cero. Así que ahora solo tenemos que descubrir el efecto directo y el efecto indirecto. El efecto indirecto en este diagrama es simplemente seguir la otra flecha de las mujeres al coeficiente intelectual a través del tamaño del cerebro, que es la correlación de las mujeres y el tamaño del cerebro multiplicada por la correlación parcial del tamaño del cerebro y el coeficiente intelectual.TotalF,IQ=Cor(F,IQ)
Debido a que el efecto total es cero, sabemos que el efecto directo debe ser simplemente el signo opuesto exacto y el tamaño del efecto indirecto , por lo tanto, el efecto directo es igual a 0.099 en este ejemplo. Ahora, aquí tenemos una situación al evaluar el coeficiente intelectual esperado de las mujeres, obtenemos dos respuestas diferentes, aunque probablemente no sea lo que inicialmente esperaba al especificar la pregunta. Al evaluar simplemente el coeficiente intelectual marginal esperado de las mujeres frente a los hombres, la diferencia es cero como la definió (al tener una correlación cero). Al evaluar la diferencia esperada condicional al tamaño del cerebro, las mujeres tienen un coeficiente intelectual más grande que los hombres.
Puede insertar en este ejemplo correlaciones más grandes entre el tamaño del cerebro y el coeficiente intelectual (o correlaciones más pequeñas entre el tamaño femenino y el del cerebro), dados los límites que kjetil muestra en su respuesta. Aumentar el primero hace que la disparidad entre el cociente intelectual condicional de mujeres y hombres sea aún mayor a favor de las mujeres, y disminuir el segundo reduce las diferencias.
fuente
Para proporcionar la respuesta matemática puramente abstracta, denote el volumen del cerebro el índice IQ. Use para indexar hombres y para indexar mujeres. Supongamos que los siguientes son hechos:v q 1 2
Tenga en cuenta que, si bien el texto citado habla sobre la "correlación entre el volumen cerebral y el coeficiente intelectual" en general, la imagen suministrada hace una distinción con las dos líneas de tendencia (es decir, muestra la correlación para los dos subgrupos por separado). Entonces los consideramos por separado (que es la forma correcta de hacerlo).
Luego
y
¿Las desigualdades obtenidas anteriormente requieren ??E(q1)>E(q2)
Para verificar esto, suponga, por el contrario, queE(q1)=E(q2)=q¯(4)
Entonces debe ser el caso que
y eso
Bueno, ciertamente puede ser el caso, que las desigualdades y mantienen al mismo tiempo, por lo que "IQ igual en promedio" es perfectamente compatible con los supuestos iniciales que tomamos como hechos. De hecho, bien podría suceder que pudiéramos tener un coeficiente intelectual promedio más alto de las mujeres que de los hombres, por el mismo conjunto de hechos en .( 6 ) ( 1 )(5) (6)
(1)
En otras palabras, los supuestos / hechos de correlación en no imponen ninguna restricción sobre la relación entre los coeficientes intelectuales promedio. Todas las posibles relaciones entre y pueden mantenerse y ser compatibles con los supuestos en .E ( q 1 ) E ( q 2 ) ( 1 )(1) E(q1) E(q2) (1)
fuente