Acabo de realizar una regresión lineal (muy) simple en Genstat y me gustaría incluir un resumen sucinto y significativo de la salida en mi informe. No estoy seguro exactamente qué o qué cantidad de información debo incluir.
Los bits principales de mi salida de Genstat se ven así:
Summary of analysis
Source d.f. s.s. m.s. v.r. F pr.
Regression 1 8128935. 8128935. 814.41 <.001
Residual 53 529015. 9981.
Total 54 8657950. 160332.
Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.
Estimates of parameters
Parameter estimate s.e. t(53) t pr.
Constant 41.5 30.7 1.35 0.182
UKHR_Ref 0.8659 0.0303 28.54 <.001
Tenía la intención de informar esto simplemente como:
Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).
pero un colega me sugirió que también debería incluir al menos el root mean squared error
(que creo que en este caso es igual al error estándar de las observaciones, es decir, 99.9?).
¿Incluir el RMSE proporciona información útil adicional, o la bondad de ajuste ya se explica adecuadamente por el valor ajustado de R2?
¿Existen reglas estrictas para cuánta información reportar, o es bastante subjetiva?
¡Muchas gracias!
fuente
Respuestas:
Para una regresión lineal simple, siempre produciría un gráfico de la variable x contra la variable y, con la línea de regresión superpuesta en el gráfico (¡siempre dibuje sus datos siempre que sea posible!). Esto le dirá muy fácilmente qué tan bien se ajusta su modelo, y es fácil de leer para una regresión variable. Agregar eso a lo que ya tiene probablemente sería suficiente, aunque es posible que desee incluir algunas parcelas de diagnóstico (apalancamiento, distancia de cocción, residuos, etc.). Depende de qué tan buena sea esa trama xy, y de su audiencia prevista, y de los protocolos que su audiencia espere.
fuente
Solía informar el coeficiente β más el IC del 95%, el valor p y Rsquared ajustado. Ex:
Si se informa una regresión múltiple o una regresión con variables de factores, informo el coeficiente, el IC del 95%, los valores p y luego por separado las estadísticas F (degres de libertad), el R2 ajustado y el valor p del modelo.
fuente