La pregunta es sobre los efectos marginales (de X sobre Y), creo, no tanto sobre la interpretación de los coeficientes individuales. Como la gente ha notado útilmente, estos a veces son identificables con un tamaño de efecto, por ejemplo, cuando hay relaciones lineales y aditivas.
Si ese es el enfoque, la forma más simple (conceptualmente, si no prácticamente) de pensar sobre el problema parece ser esta:
Para obtener el efecto marginal de X sobre Y en un modelo de regresión lineal normal sin interacciones, simplemente puede observar el coeficiente de X. Pero eso no es suficiente, ya que se estima que no se conoce. En cualquier caso, lo que uno realmente quiere para los efectos marginales es algún tipo de gráfico o resumen que proporcione una predicción sobre Y para un rango de valores de X y una medida de incertidumbre. Por lo general, uno podría desear la media pronosticada Y y un intervalo de confianza, pero también podría desear predicciones para la distribución condicional completa de Y para una X. Esa distribución es más amplia que la estimación sigma del modelo ajustado porque tiene en cuenta la incertidumbre sobre los coeficientes del modelo. .
Existen varias soluciones de forma cerrada para modelos simples como este. Para los propósitos actuales, podemos ignorarlos y pensar de manera más general acerca de cómo obtener ese gráfico de efectos marginales por simulación, de una manera que trate con modelos arbitrariamente complejos.
Suponga que desea los efectos de variar X en la media de Y, y está feliz de fijar todas las demás variables en algunos valores significativos. Para cada nuevo valor de X, tome una muestra de tamaño B de la distribución de coeficientes del modelo. Una manera fácil de hacerlo en R es suponer que es Normal con coef(model)
matriz de media y covarianza vcov(model)
. Calcule una nueva Y esperada para cada conjunto de coeficientes y resuma el lote con un intervalo. Luego pase al siguiente valor de X.
Me parece que este método no debería verse afectado por ninguna transformación elegante aplicada a cualquiera de las variables, siempre que también las aplique (o sus inversas) en cada paso de muestreo. Entonces, si el modelo ajustado tiene log (X) como predictor, entonces registre su nueva X antes de multiplicarla por el coeficiente muestreado. Si el modelo ajustado tiene sqrt (Y) como variable dependiente, entonces cuadre cada media pronosticada en la muestra antes de resumirlas como un intervalo.
En resumen, más programación pero menos cálculo de probabilidad, y como resultado efectos marginales clínicamente comprensibles. Este "método" a veces se refiere a CLARIFICAR en la literatura de ciencias políticas, pero es bastante general.