¿Correlación = 0.2 significa que hay una asociación "en solo 1 de cada 5 personas"?

48

En The Idiot Brain: A Neuroscientist Explica qué está haciendo realmente tu cabeza , escribió Dean Burnett

La correlación entre altura e inteligencia generalmente se cita como aproximadamente , lo que significa que la altura y la inteligencia parecen estar asociadas en solo de cada personas.1 50.215

Para mí, esto suena mal: entiendo la correlación más como el (falta de) error que obtenemos cuando intentamos predecir una medida (aquí inteligencia) si lo único que sabemos sobre esa persona es la otra medida (aquí la altura). Si la correlación es o , entonces no cometemos ningún error en nuestra predicción, si la correlación es , entonces hay más error. Por lo tanto, la correlación se aplicaría a cualquiera, no solo a de cada personas.- 1 0.8 1 5110.815

He examinado esta pregunta pero no soy lo suficientemente bueno en matemáticas como para entender la respuesta. Esta respuesta que habla sobre la fuerza de la relación lineal parece estar en línea con mi comprensión, pero no estoy seguro.

Sitak
fuente
66
@JamesPhillips, a lo que te refieres es , no sí. Si entonces entonces 4%. r r = 0.2 r 2 = 0.04r2rr=0.2r2=0.04
Richard Hardy
44
4 por ciento tiene mucho más sentido que 20 por ciento, gracias amablemente por la corrección, estoy de acuerdo con usted.
James Phillips
29
Esta muestra de 0.01% del libro me hace preguntarme qué tonterías se encuentran en el resto ...
Nick Cox
11
He favorecido esta publicación porque es precisamente el tipo de pregunta extremadamente simple que, cuando se le pregunta a un estudiante de estadísticas 001 (o cualquier otro neófito, o un solicitante de empleo), determinará al instante e inequívocamente si entienden lo que significa la correlación.
whuber
44
Dejaría de leer ese libro, ahora mismo
PhD

Respuestas:

69

El pasaje citado es de hecho incorrecto. Un coeficiente de correlación cuantifica el grado de asociación en toda una población (o muestra, en el caso del coeficiente de correlación de la muestra). No divide a la población en partes, una parte muestra una asociación y la otra parte no. Se podría ser el caso de que la población consta en realidad de dos subpoblaciones con diferentes grados de asociación, pero un coeficiente de correlación por sí solo no implicar esto.

Kodiologist
fuente
19
Además, incluso en una población donde el 20% de las personas mostró una correlación perfecta entre la altura y la inteligencia y el 80% mostró una correlación cero, la correlación de toda la población no es necesariamente 0.2. ¡La afirmación es incorrecta de varias maneras!
Nuclear Wang
Suceden cosas raras con hilos que entran en la lista de Hot Network. Esta respuesta es obviamente correcta y está bien ... ¡¿pero 57 votos a favor ?! :-)
ameba dice Reinstate Monica
2
@amoeba Si crees que es salvaje, mira mi respuesta de mayor puntaje .
Kodiólogo
Jaja, eres el maestro!
ameba dice Reinstate Monica
¿Cuenta como trolling a +1 algo solo para promover la extrañeza que es SE?
Nat
18

No, 0.2 no significa que 1 de cada 5 personas muestre correlación. No sé cómo podría escribir estas tonterías.

Aquí está la fuente del número 0.2: "Sobre las fuentes de la correlación altura-inteligencia: nuevas ideas de un modelo ACE bivariado con apareamiento surtido", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ Aparentemente, la correlación es robusta.

Ya lo sabía: mi coeficiente intelectual aumentó considerablemente con mi altura a medida que crecía. Ahora sé por qué ya no soy más inteligente: mi altura es estable.

Esto era una broma, por supuesto, pero señala el problema con el argumento del autor del libro "Idiota": nadie mide dentro de la correlación de altura e coeficiente intelectual del sujeto, al menos hasta donde yo sé. No estoy seguro de cómo lo harías limpiamente, habría tanta confusión.

Habiendo dicho que los investigadores están utilizando trucos como mirar dentro de gemelos y dentro de las correlaciones familiares de altura y coeficiente intelectual, esto les ayuda a abordar problemas de confusión. Presumiblemente, los gemelos están creciendo en un entorno similar y tienen el mismo ADN, por lo que en los estudios de observación ayuda a abordar la endogeneidad y otros problemas. Sin embargo, si pone todo esto a un lado, la conclusión es que la "correlación 0.2" no da base para decir tonterías, como en algunas personas hay correlación y en otras no. Es solo una interpretación ridícula de los resultados del estudio de correlación.

Aksakal
fuente
8
-1: si bien entiendo el espíritu del último párrafo de esta respuesta, creo que aumenta la confusión ya que introduce innecesariamente el concepto de causalidad (el whyaquí no es relevante).
Jorge Leitao
1
Debe ser uno de cada cinco para quienes existe una correlación.
Carsten S
@ JorgeLeitão Por supuesto que no, no hay ninguna causalidad implícita, crecieron juntos, ¡es correlacional! :)
Firebug
@ JorgeLeitão, si algo la investigación de NN muestra que el tamaño importa. Tanto un cerebro más grande como una muestra más grande. Entonces, cuando crecemos, nuestros cerebros aumentan y corremos más cosas a través de ellos, por lo tanto, deberíamos ser más inteligentes. Además, los hombres son más altos que las mujeres en promedio, por lo que también deben ser más inteligentes, en promedio.
Aksakal
Ja, qué carga de tonterías.
Lightness compite con Monica
8

La ironía en la declaración es casi demasiado gruesa para analizarla. Dado el título del texto, supongo que se pretendía algo irónico. Sin embargo, su "instinto" diciendo que esto está mal probablemente esté en el camino correcto, si la intuición cuenta para algo. Desafortunadamente, muchos informes científicos eluden la intuición cuando se trata de conceptos que no hemos encontrado.

Es posible que, al medir una asociación entre e , la correlación entre e sea ​​1.0 en el 20% de la población y 0 en el 80% restante. El efecto neto es que, en general, la correlación de e es 0.2. Esto lo vemos todo el tiempo en farmacoepidemiología: un fármaco experimental se considera "efectivo" si en promedio hay un beneficio positivo; Muchos medicamentos en circulación común, algunos de los cuales podría estar tomando, pueden dañarlo debido a las interacciones con su comportamiento o genética, pero en realidad nadie lo sabe.Y X Y X YXYXYXY

Lo anterior no es más que una posible interpretación de una correlación de 0.2; es extremadamente exagerado porque muy pocas cosas en la vida tienen una correlación de 1 o 0, y pocas cosas aún tienen la modificación del efecto lo suficientemente fuerte como para producir tales correlaciones discrepantes.

AdamO
fuente
1
"Es posible que, al medir una asociación entre X e Y, la correlación entre X e Y sea 1.0 en el 20% de la población y 0 en el 80% restante". - En el estudio que publiqué, observaron las correlaciones entre familiares y gemelos, son diferentes a la población general. Sin embargo, estoy seguro de que no es lo que quiso decir el autor del libro, es cómo interpreta qué correlación es el problema
Aksakal
@Aksakal curiosamente, estos métodos de componentes de varianza están destinados a estimar la misma correlación de nivel de población que se mediría en una población, solo afirman que usan la heredabilidad para "afeitar" la varianza fenotípica atribuible a la influencia ambiental actual (el componente E de la ACE modelo): una fuente importante de confusión en la hipótesis considerada.
AdamO
10
Si la correlación es 1 en 20% de la población y 0 en 80%, no se deduce que en general sea 0.2. Depende de la varianza relativa en cada subpoblación.
ameba dice Reinstate Monica
1
@amoeba sí, buen punto, subraya aún más que un escenario idiopático justificaría tal afirmación.
AdamO
44
"Supongo que se pretendía algo irónico". Eres más caritativo de lo que yo sería. Simplemente está mal. No veo ninguna razón para pensar que el autor se haya equivocado intencionalmente de una manera que se suponía que era inteligente. La interpretación más caritativa es que el autor quería subrayar la naturaleza probabilística de una correlación y, sin pensarlo, eligió una mala forma de ilustrarla, una forma en la que el propio autor probablemente estaría de acuerdo no tiene realmente sentido si se le señalara.
John Coleman
2

Sería difícil llegar a una interpretación de esto que sea significativa, y mucho menos correcta. La asociación no es propiedad de puntos de datos individuales. Si solo tuviera la altura y la inteligencia de una persona, ¿cómo podría decir si la altura y la inteligencia están asociadas? Supongo que si tuviéramos la media de altura e inteligencia, podríamos decir que todos los que están por encima de la media en ambos, o por debajo de la media en ambos, muestran una "asociación". Pero si tuviera datos completamente al azar (sin correlación), debe esperar que la mitad de las personas muestren "asociación" en este sentido. Generé un conjunto de datos aleatorios con correlación alrededor de .2 (en realidad .22), y descubrí que 55 mostraba "asociación" en este sentido.

Es posible que Y sea una función creciente de X, y la correlación entre ellos sea solo .5; Sería tonto decir que solo la mitad de las personas muestran una asociación si cada persona tiene una inteligencia más alta que cada persona más baja y una inteligencia más baja que todas las personas más altas. Además, es teóricamente posible tener un valor atípico que cree toda la correlación, y la correlación del conjunto sin ese punto sea cero. Incluso es posible que el 20% de la población tenga una correlación negativa, y el otro 80% también tenga una correlación negativa, y la correlación total sea .2.

Acumulacion
fuente