Tengo entendido que incluso la regresión no da causalidad. Solo puede dar asociación entre la variable y y las variables x y posiblemente una dirección. ¿Estoy en lo correcto? A menudo he encontrado frases similares a "x predice y" incluso en la mayoría de los libros de texto del curso y en varias páginas del curso en línea. Y a menudo llama a los regresores como predictores y al y como respuesta.
- ¿Qué tan justo es usarlo para la regresión lineal?
- ¿Qué tal la regresión logística? (si tengo un umbral t con el que puedo comparar la probabilidad?)
Respuestas:
No hay ningún problema con el uso de la palabra "predecir".
Es importante reconocer que las predicciones no están relacionadas con la causalidad. Considere un caso en el que la mayoría de las personas que mueren en la sala de emergencias de un hospital mueren de un ataque cardíaco. Si escucha que un paciente murió, pero no sabía la causa, podría predecir que probablemente fue un ataque cardíaco, porque sabe que los ataques cardíacos son responsables de> 50%. Estás haciendo una predicción, pero estás prediciendo una causa desconocida a partir de un efecto conocido. Además, la predicción en este ejemplo es categórica, por lo que es análoga a la regresión logística. (La analogía es probablemente más fuerte que la regresión logística multinomial, pero eso no importa aquí).
Por lo que vale, las predicciones no tienen que estar relacionadas con ninguna conexión causal directa. Puede hacer una predicción basada en una correlación espuria, siempre que la relación sea confiable. Considere predecir la altura desconocida de un gemelo idéntico basado en el hermano gemelo. En este caso, ambas alturas son efectos de un conjunto de causas comunes (genética y entorno compartidos). La altura de ninguno de los gemelos es una causa o un efecto del otro. No obstante, puede hacer muy buenas predicciones en esta situación.
fuente