¿Por qué los problemas de regresión se denominan problemas de "regresión"?

Respuestas:

34

El término "regresión" fue utilizado por Francis Galton en su artículo de 1886 "Regresión hacia la mediocridad en estatura hereditaria". Que yo sepa, él solo usó el término en el contexto de regresión hacia la media . El término fue adoptado por otros para obtener más o menos el significado que tiene hoy como método estadístico general.

NRH
fuente
15
Galton obtuvo una aproximación lineal para estimar la altura de un hijo a partir de la altura del padre en ese documento. Su ecuación se ajustó para que un padre de estatura promedio tuviera un hijo de estatura promedio, pero un padre más alto que el promedio tendría un hijo que es más alto que el promedio en 2/3 de la cantidad que es su padre. Lo mismo con más corto que el promedio. Se podría argumentar que se trata de una simple regresión lineal (significado de hoy). Y, por supuesto, la regresión de hoy tiene un significado aún más amplio: es cualquier modelo que haga predicciones continuas. Es interesante cuánto ha cambiado su uso original de esa palabra.
rm999
3
La respuesta de NRH es correcta. El siguiente enlace ofrece muchos más detalles sobre el artículo de Francis Galton "Regresión hacia la mediocridad en la estatura hereditaria" blog.minitab.com/blog/statistics-and-quality-data-analysis/…
Gaurav Singhal
¿Es hora de que la comunidad estadística reemplace la palabra 'regresión' por un término más directo y claro, tal vez 'predictor formulaico'?
Aviad Rozenhek
4

A diferencia de progresar, estamos volviendo a la media, es decir, retrocediendo. De ahí el término regresión! Creo que es algo que fue recogido y atascado.

thethakuri
fuente
2

@Mark White ya mencionó el enlace, pero para aquellos de ustedes que no tienen mucho tiempo para revisar el enlace, aquí está la respuesta exacta y correctamente referenciada:

Origen de la 'regresión'

El término "regresión" fue acuñado por Francis Galton en el siglo XIX para describir un fenómeno biológico. El fenómeno fue que las alturas de los descendientes de antepasados ​​altos tienden a retroceder hacia un promedio normal (un fenómeno también conocido como regresión hacia la media) (Galton, reimpreso en 1989). Para Galton, la regresión solo tenía este significado biológico (Galton, 1887) , pero su trabajo fue extendido posteriormente por Udny Yule y Karl Pearson a un contexto estadístico más general (Pearson, 1903).

Referencias

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Leyes típicas de la herencia. III. Nature, 15 (389), 512-514.

Galton, F. (reimpreso en 1989). Parentesco y correlación. Ciencia estadística, 4 (2), 80–86.

Pearson, K. (1903). La ley de la herencia ancestral. Biometrika, 2 (2), 211-228.

PsychometStats
fuente
La regresión de Galton como en 'regresión a la media' tiene sentido. sin embargo, no entiendo el uso de la palabra 'regresión' para significar 'aprender una fórmula de variables independientes a una variable de resultado'
Aviad Rozenhek
1
En general, significa que, pero el aprendizaje automático usa regresión, pero la regresión no es una técnica de aprendizaje automático, a pesar de la opinión popular e incorrecta. El aprendizaje estadístico es independiente del aprendizaje automático, pero en general, los proponentes de LD toman métodos estadísticos y los etiquetan incorrectamente como ML, por lo que aparecen las incongruencias aparentes. La regresión de Galton es regresión; tiene que ver con modelar / predecir una tendencia.
LSC
0

La "regresión" proviene de la "regresión", que a su vez proviene del latín "regressus", para volver (a algo).

En ese sentido, la regresión es la técnica que permite "regresar" de datos desordenados y difíciles de interpretar a un modelo más claro y significativo. Como físico, me gusta la idea, ya que los físicos ven los fenómenos naturales como los múltiples resultados posibles de una ley natural relativamente simple.

En otras palabras, la palabra regresión parece sugerir que los datos son solo el efecto visible y tangible de un "modelo estadístico". En otras palabras, el modelo es lo primero, y su deseo es utilizar los datos "para volver" a lo que los originó.

famargar
fuente
0

Como sé, la palabra regressionen significado estadístico es la medición de la relación entre el valor medio de una variable y los valores correspondientes de otras variables.

aan
fuente