¿Cuáles son las razones estadísticas detrás de definir el índice de IMC como peso / estatura ?

Tal vez esta pregunta tenga respuesta en medicina, pero ¿hay alguna razón estadística por la cual el índice de IMC se calcule como ? ¿Por qué no, por ejemplo, solo ? Mi primera idea es que tiene algo que ver con la regresión cuadrática. $\text{weight}/\text{height}^2$ $\text{weight}/\text{height}$

Muestra de datos reales (200 individuos con peso, altura, edad y género):

structure(list(Age = c(18L, 21L, 17L, 20L, 19L, 53L, 27L, 22L, 
19L, 27L, 19L, 20L, 19L, 20L, 42L, 17L, 23L, 20L, 20L, 19L, 20L, 
19L, 19L, 18L, 19L, 15L, 19L, 15L, 19L, 21L, 60L, 19L, 17L, 23L, 
60L, 33L, 24L, 19L, 19L, 22L, 20L, 21L, 19L, 19L, 20L, 18L, 19L, 
20L, 22L, 20L, 20L, 27L, 19L, 22L, 19L, 20L, 20L, 21L, 16L, 19L, 
41L, 54L, 18L, 23L, 19L, 19L, 22L, 18L, 20L, 19L, 25L, 18L, 20L, 
15L, 61L, 19L, 34L, 15L, 19L, 16L, 19L, 18L, 15L, 20L, 20L, 20L, 
20L, 19L, 16L, 37L, 37L, 18L, 20L, 16L, 20L, 36L, 18L, 19L, 19L, 
20L, 18L, 17L, 22L, 17L, 22L, 16L, 24L, 17L, 33L, 17L, 17L, 15L, 
18L, 18L, 16L, 20L, 29L, 24L, 18L, 17L, 18L, 36L, 16L, 17L, 20L, 
16L, 43L, 19L, 18L, 20L, 19L, 18L, 21L, 19L, 20L, 23L, 19L, 19L, 
20L, 24L, 19L, 20L, 38L, 18L, 17L, 19L, 19L, 20L, 20L, 21L, 20L, 
20L, 42L, 17L, 20L, 25L, 20L, 21L, 21L, 22L, 19L, 25L, 19L, 40L, 
25L, 52L, 25L, 21L, 20L, 41L, 34L, 24L, 30L, 21L, 27L, 47L, 21L, 
16L, 31L, 21L, 37L, 20L, 22L, 19L, 20L, 25L, 23L, 20L, 20L, 21L, 
36L, 19L, 21L, 16L, 20L, 18L, 21L, 21L, 18L, 19L), Height = c(180L, 
175L, 178L, 160L, 172L, 172L, 180L, 165L, 160L, 187L, 165L, 176L, 
164L, 155L, 166L, 167L, 171L, 158L, 170L, 182L, 182L, 175L, 197L, 
170L, 165L, 176L, 167L, 170L, 168L, 163L, 155L, 152L, 158L, 165L, 
180L, 187L, 177L, 170L, 178L, 170L, 170L, NA, 188L, 180L, 161L, 
178L, 178L, 165L, 187L, 178L, 168L, 168L, 180L, 192L, 188L, 173L, 
193L, 184L, 167L, 177L, 177L, 160L, 167L, 190L, 187L, 163L, 173L, 
165L, 190L, 178L, 167L, 160L, 169L, 174L, 165L, 176L, 183L, 166L, 
178L, 158L, 180L, 167L, 170L, 170L, 180L, 184L, 170L, 180L, 169L, 
165L, 156L, 166L, 178L, 162L, 178L, 181L, 168L, 185L, 175L, 167L, 
193L, 160L, 171L, 182L, 165L, 174L, 169L, 185L, 173L, 170L, 182L, 
165L, 160L, 158L, 186L, 173L, 168L, 172L, 164L, 185L, 175L, 162L, 
182L, 170L, 187L, 169L, 178L, 189L, 166L, 161L, 180L, 185L, 179L, 
170L, 184L, 180L, 166L, 167L, 178L, 175L, 190L, 178L, 157L, 179L, 
180L, 168L, 164L, 187L, 174L, 176L, 170L, 170L, 168L, 158L, 175L, 
174L, 170L, 173L, 158L, 185L, 170L, 178L, 166L, 176L, 167L, 168L, 
169L, 168L, 178L, 183L, 166L, 165L, 160L, 176L, 186L, 162L, 172L, 
164L, 171L, 175L, 164L, 165L, 160L, 180L, 170L, 180L, 175L, 167L, 
165L, 168L, 176L, 166L, 164L, 165L, 180L, 173L, 168L, 177L, 167L, 
173L), Weight = c(60L, 63L, 70L, 46L, 60L, 68L, 80L, 68L, 55L, 
89L, 55L, 63L, 60L, 44L, 62L, 57L, 59L, 50L, 60L, 65L, 63L, 72L, 
96L, 50L, 55L, 53L, 54L, 49L, 72L, 49L, 75L, 47L, 57L, 70L, 105L, 
85L, 80L, 55L, 67L, 60L, 70L, NA, 76L, 85L, 53L, 69L, 74L, 50L, 
91L, 68L, 55L, 55L, 57L, 80L, 98L, 58L, 85L, 120L, 62L, 63L, 
88L, 80L, 57L, 90L, 83L, 51L, 52L, 65L, 92L, 58L, 76L, 53L, 64L, 
63L, 72L, 68L, 110L, 52L, 68L, 50L, 78L, 57L, 75L, 55L, 75L, 
68L, 60L, 65L, 48L, 56L, 65L, 65L, 88L, 55L, 68L, 74L, 65L, 62L, 
58L, 55L, 84L, 60L, 52L, 92L, 60L, 65L, 50L, 73L, 51L, 60L, 76L, 
48L, 50L, 53L, 63L, 68L, 56L, 68L, 60L, 70L, 65L, 52L, 75L, 65L, 
68L, 63L, 54L, 76L, 60L, 59L, 80L, 74L, 96L, 68L, 72L, 62L, 58L, 
50L, 75L, 70L, 85L, 67L, 65L, 55L, 78L, 58L, 53L, 56L, 72L, 62L, 
60L, 56L, 82L, 70L, 53L, 67L, 58L, 58L, 49L, 90L, 58L, 77L, 55L, 
70L, 64L, 98L, 60L, 60L, 65L, 74L, 99L, 49L, 47L, 75L, 77L, 74L, 
68L, 50L, 66L, 75L, 54L, 60L, 65L, 80L, 90L, 95L, 79L, 57L, 70L, 
60L, 85L, 44L, 58L, 50L, 88L, 60L, 54L, 68L, 56L, 69L), Gender = c(1L, 
1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 1L, 2L, 
2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 
1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 
1L, 2L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 
2L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 
1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 
1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 
2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 
1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 2L, 2L, 1L)), .Names = c("Age", "Height", "Weight", 
"Gender"), row.names = 304:503, class = "data.frame")

biostatistics Miroslav Sabo
fuente

Hoy en día, fórmulas como esta caerían de una regresión lineal de log (peso) frente a log (altura), lo que (por razones biológicas y estadísticas) es una forma más natural de analizar estas cantidades.

whuber

Tenía la esperanza de ilustrar esto con datos reales. El primer éxito de Google encontrado en "datos de altura de peso" es un gran conjunto de datos alojado en UCLA . Claramente es falso! Las distribuciones marginales están perfectamente distribuidas normalmente (las pruebas de SW con submuestras de 5000 casi siempre tienen valores p cercanos a 1/2): sin valores atípicos, sin curtosis baja (de una mezcla de géneros), sin asimetría (de una mezcla de edades). Estos datos supuestamente fueron "utilizados para desarrollar ... tablas de crecimiento de Hong Kong para ... el índice de masa corporal (IMC)". Eso es extremadamente sospechoso.

whuber

Gracias, pero esos datos pueden ser demasiado limitados para dar una buena idea de cómo la altura y el peso pueden variar. Como mínimo, deben clasificarse por género y edad. Sin embargo, está claro que los logaritmos de altura y peso son mejores para analizar: reducen la heterocedasticidad a la que se refiere @ttnphns y también ayudan a hacer que las distribuciones de los residuos sean más simétricas. Es interesante que una regresión del peso del registro contra la altura del registro dé una pendiente de . Eso se compara casi exactamente con la estimación de Quetelet de 5/2 citada por AdamO.

2.55 \pm 0.28

$2.55\pm 0.28$

5 / 2 = 2.5

$5/2=2.5$

whuber

Compárelo library(MASS); rlm(log(Weight) ~ log(Height) + cut(Age, 3) + as.factor(Gender), data=y)con rlm(Weight ~ Height + cut(Age, 3) + as.factor(Gender), data=y)(y diagnostique los gráficos para ambos ajustes) para ver el efecto saludable del uso de logaritmos: de hecho, estabilizan y simetrizan los residuos. En cualquiera de los modelos, el género es significativo y también lo es la edad; La relación con la edad no es lineal. Es muy interesante que el coeficiente de registro (altura) en el primer modelo ahora sea alrededor de lugar de . ( son sus datos con los valores faltantes eliminados). No veo ninguna interacción.

1.6

$1.6$

2.5

$2.5$ y

whuber

@whuber, probé su código con un tamaño de muestra completo (n = 1336) y el coeficiente de registro (altura) es de alrededor de 1.77.

Miroslav Sabo

Respuestas:

Esta revisión, de Eknoyan (2007), tiene mucho más de lo que probablemente quería saber sobre Quetelet y su invención del índice de masa corporal.

La versión corta es que el IMC se ve aproximadamente distribuido normalmente, mientras que el peso solo, o el peso / estatura no, y Quetelet estaba interesada en describir a un hombre "normal" a través de distribuciones normales. También hay algunos argumentos de los primeros principios, basados en cómo las personas crecen, y algunos trabajos más recientes han intentado relacionar esa reducción a alguna biomecánica.

Vale la pena señalar que el valor del IMC se debate bastante acaloradamente. Se correlaciona bastante bien con la gordura, pero los límites para el bajo peso / sobrepeso / obesidad no coinciden con los resultados de atención médica.

Matt Krause
fuente

Más importante aún, consideró weight/height^3cuál sería interpretado como una densidad (intuitivamente tiene sentido), pero optó por el IMC clásico debido a su distribución normal como usted dijo.

AdamO

@AdamO Sin embargo, los adultos generalmente solo crecen en 2 de las 3 dimensiones ...

James

Del "Tratado sobre el hombre y el desarrollo de sus facultades" de Adolphe Quetelet:

Si el hombre aumentara por igual en todas las dimensiones, su peso a diferentes edades sería como el cubo de su altura. Ahora, esto no es lo que realmente observamos. El aumento de peso es más lento, excepto durante el primer año después del nacimiento; entonces la proporción que acabamos de señalar se observa con bastante regularidad. Pero después de este período, y hasta cerca de la edad de la pubertad, el peso aumenta casi como el cuadrado de la altura. El desarrollo del peso nuevamente se vuelve muy rápido en la pubertad y casi se detiene después del vigésimo quinto año. En general, no cometemos muchos errores cuando suponemos que durante el desarrollo los cuadrados del peso a diferentes edades son como las quintas potencias de la altura; lo que naturalmente lleva a esta conclusión, al apoyar la constante de gravedad específica, de que el crecimiento transversal del hombre es menor que el vertical.

Ver aquí .

No estaba interesado en caracterizar la obesidad, sino en la relación entre peso y altura, ya que estaba muy interesado en la biometría y las curvas de campana. Los hallazgos de Quetelet indicaron que el IMC tenía una distribución aproximadamente normal en la población. Esto significaba para él que había encontrado la relación "correcta". (Curiosamente, solo una o dos décadas después, Francis Galton abordaría el tema de la "distribución de la altura" en las poblaciones y acuñaría el término "Regresión a la media").

Vale la pena señalar que el IMC ha sido un flagelo de la biometría en los días modernos debido a la amplia utilización del IMC del estudio de Framingham como una forma de identificar la obesidad. Todavía falta un buen predictor de obesidad (y resultados relacionados con la salud). La relación de medición de cintura a cadera es un candidato prometedor. Con suerte, a medida que los ultrasonidos se vuelvan más baratos y mejores, los médicos los usarán para identificar no solo la obesidad, sino también los depósitos grasos y la calcificación en los órganos y hacer recomendaciones de atención en función de ellos.

AdamO
fuente

2.5

$2.5$

Quetelet está inferiendo sobre el desarrollo del individuo a partir de la observación de una muestra basada en la población. Creo que, además, comenta que, en promedio, se puede hacer bien con un peso y estatura relacionados con un exponente de 2.5 (sobre todos o la mayoría de los rangos de edad), pero específicamente en adultos la relación es cuadrática.

AdamO

Yo creo que la relación entre cintura y cadera se considera realmente por Quetelet o sus contemporáneos, pero también fue rechazado porque no se distribuyen normalmente tampoco. Qué tan lejos hemos llegado ...

Matt Krause

El IMC se usa principalmente hoy en día debido a su capacidad de aproximar el volumen de grasa visceral abdominal, útil para estudiar el riesgo cardiovascular. Para un estudio de caso que analiza la idoneidad del IMC en la detección de diabetes, consulte el Capítulo 15 de http://biostat.mc.vanderbilt.edu/CourseBios330 en Folletos . Varias evaluaciones están ahí. Verá que un mejor poder de altura está más cerca de 2.5, pero puede hacerlo mejor que usar altura y peso.

Frank Harrell
fuente

Este es un gran comentario, pero no parece responder a la pregunta de "razones estadísticas" subyacentes a la fórmula estándar de IMC.

whuber

Eso está en la cita de Quetelet arriba.

Frank Harrell