Minimizando el sesgo en el modelado explicativo, ¿por qué? ("Explicar o predecir" de Galit Shmueli)

Esta pregunta hace referencia al artículo de Galit Shmueli "Explicar o predecir" .

Específicamente, en la sección 1.5, "Explicación y predicción son diferentes", el profesor Shmueli escribe:

En el modelado explicativo, el objetivo es minimizar el sesgo para obtener la representación más precisa de la teoría subyacente.

Esto me ha intrigado cada vez que leo el periódico. ¿En qué sentido minimizar el sesgo en las estimaciones da la representación más precisa de la teoría subyacente?

También vi la charla del profesor Shmueli aquí , pronunciada en JMP Discovery Summit 2017, y ella dice:

... cosas que son como modelos de contracción, conjuntos, nunca los verás. Debido a que esos modelos, por diseño, introducen sesgo para reducir el sesgo / varianza general. Es por eso que no estarán allí, no tiene ningún sentido teórico hacer eso. ¿Por qué harías tu modelo sesgado a propósito?

Esto realmente no arroja luz sobre mi pregunta, simplemente reiterando la afirmación que no entiendo.

Si la teoría tiene muchos parámetros, y tenemos datos escasos para estimarlos, el error de estimación estará dominado por la varianza. ¿Por qué sería inapropiado usar un procedimiento de estimación sesgado como la regresión de cresta (que resulta en estimaciones sesgadas de menor varianza) en esta situación?

predictive-models inference bias unbiased-estimator explanatory-models Matthew Drury
fuente

¡Buena pregunta! +1 Hice una pregunta relacionada en stats.stackexchange.com/questions/204386/…

Adrian

@Adrian Esa es una gran pregunta, bien hecha. ¡También me encantaría ver una respuesta completa a esa!

Matthew Drury

Respuestas:

De hecho, esta es una gran pregunta, que requiere un recorrido por el mundo del uso de modelos estadísticos en la investigación econométrica y de las ciencias sociales (por lo que he visto, los estadísticos aplicados y los mineros de datos que realizan trabajos descriptivos o predictivos generalmente no abordan sesgo de esta forma). El término "sesgo" que utilicé en el artículo es lo que los economistas y los científicos sociales tratan como un grave peligro para inferir la causalidad de los estudios empíricos. Se refiere al artículo de Wikipedia sobre especificaciones para una breve descripción. Una cuestión importante especificación errónea es bajo-especificación diferencia entre su modelo estadístico y el modelo teórico causal que lo subyace . Un término relacionado es "especificación del modelo", un tema que se enseña mucho en econometría debido a la importancia de "especificar correctamente su modelo de regresión" (con respecto a la teoría) cuando su objetivo es la explicación causal. Ver, llamado "Sesgo de variable omitida" (OVB), donde omite una variable explicativa de la regresión que debería haber estado allí (según la teoría): esta es una variable que se correlaciona con la variable dependiente y con al menos una de las variables explicativas . Ver esta descripción ordenada ) que explica cuáles son las implicaciones de este tipo de sesgo. Desde un punto de vista teórico, OVB perjudica su capacidad de inferir causalidad del modelo.

En el apéndice de mi artículo ¿ Explicar o predecir? Hay un ejemplo que muestra cómo un modelo subespecificado ("incorrecto") a veces puede tener un mayor poder predictivo. Pero ahora es de esperar que pueda ver por qué eso contradice el objetivo de un "buen modelo explicativo causal".

Galit Shmueli
fuente

Creo que todavía hay mucha confusión sobre los modelos predictivos frente a los explicativos. Me entrevisté con un científico de datos en una importante compañía de seguros y le pregunté si construían modelos predictivos o explicativos en su equipo. Dijo "realmente no importa". No creo que él supiera la diferencia.

RobertF