Informe de resultados de una regresión logística.

13

Tengo el siguiente resultado de regresión logística:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

¿Es apropiado informar esto de la siguiente manera:

Coeficiente beta, cociente de probabilidades, valor Z, valor P. En caso afirmativo, ¿cómo puedo obtener el Odds ratio?

por encima de
fuente
Pregunta relacionada: Regresión logística en R (Odds Ratio) .
landroni

Respuestas:

9

Su informe sugerido para una tabla parece razonable, aunque los valores z y p son redundantes. Muchas revistas con las que estoy familiarizado no informan el valor z / valor p en absoluto y solo usan asteriscos para informar la significación estadística. También he visto tablas logísticas solo con las proporciones de impares informadas, aunque personalmente prefiero las probabilidades de registro y las proporciones de probabilidades informadas si el espacio lo permite en una tabla.

Pero diferentes lugares pueden tener diferentes guías en cuanto a los procedimientos de presentación de informes, por lo que lo que se espera puede variar. Si estoy enviando un artículo a una revista, con frecuencia solo veré cómo otros documentos recientes han hecho sus tablas y simplemente los imitaré. Si es su propio documento personal, preguntarle a quien sea que lo esté revisando sería una solicitud razonable. Como mencioné anteriormente, las limitaciones de espacio en algunos lugares pueden evitar que informe información redundante (como las probabilidades de registro y las razones de probabilidades). ¡Algunos lugares pueden obligarlo a informar los resultados completamente en texto!

R2R2

miβ^miβ^exp(coefficient)

También como nota, aunque esta es la respuesta aceptada actual, lejohn y Frank Harrell dan consejos muy útiles. Si bien normalmente siempre quisiera que las estadísticas de la pregunta se informaran en alguna parte, los otros consejos de respuestas sobre otras medidas son formas útiles de evaluar los tamaños de los efectos en relación con otros efectos estimados en el modelo. Los procedimientos gráficos también son útiles para examinar los tamaños de efectos relativos, y ver estos dos documentos sobre cómo convertir tablas en gráficos como ejemplos ( Kastellec y Leoni, 2007 ; Gelman et al., 2002 )

Andy W
fuente
El enlace de Kastellec y Leoni, 2007 está roto, pero aquí hay un ejemplo del mismo documento con código.
ACNB
11

La respuesta a esta pregunta puede depender de sus antecedentes disciplinarios.

Aquí hay algunas consideraciones generales.

Las versiones beta en regresión logística son bastante difíciles de interpretar directamente. Por lo tanto, informarlos explícitamente solo tiene un uso muy limitado. Debe atenerse a los odds ratios o incluso a los efectos marginales. El efecto marginal de la variable x es la derivada de la probabilidad de que sus variables dependientes sean iguales a 1, con respecto a x. Esta forma de presentar resultados es muy popular entre los economistas. Personalmente, creo que los efectos marginales son más fáciles de entender por los laicos (pero no solo por ellos ...) que las razones de probabilidades.

Otra posibilidad interesante es utilizar pantallas gráficas. Un lugar donde encontrará algunas ilustraciones de este enfoque es el libro de Gelman y Hill . Esto me parece incluso mejor que informar efectos marginales.

En cuanto a la pregunta sobre cómo obtener las razones de probabilidades, así es cómo puede hacerlo en R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))
Scortchi - Restablece a Monica
fuente
¿Tiene algún ejemplo de convertir las estimaciones de efecto marginal en tablas (o referencias de páginas específicas en Gelman y Hill?)
Andy W
1
Gelman y Hill realmente no usan los efectos marginales, sino gráficos, que se basan en probabilidades predichas. Eche un vistazo al capítulo cinco, comenzando en la página 79.
10

Es solo en casos especiales donde los coeficientes y sus anti-logs (odds ratios) son buenos resúmenes. Esto es cuando las relaciones son lineales y hay un coeficiente asociado con un predictor, y cuando un cambio de una unidad es una buena base para calcular la razón de posibilidades (más aceptable para la edad, no tanto para el recuento de glóbulos blancos que tiene un rango de 500-100,000). En general, cosas como las razones de probabilidades de rango intercuartil son útiles. Tengo más detalles sobre esto en http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf y el rmspaquete R hace todo esto automáticamente (maneja términos e interacciones no lineales, calcula cuartiles de X, etc.)

Frank Harrell
fuente
5

Probablemente depende de tu audiencia y disciplina. La respuesta a continuación es lo que normalmente se hace para las revistas de Epidemiología y, en menor medida, las revistas médicas.

Para ser franco, no nos importan los valores p. En serio, no lo hacemos. La epidemiología ni siquiera le permitirá informarlos a menos que tenga una necesidad realmente apremiante, y el campo esencialmente ha seguido su ejemplo.

Es posible que ni siquiera nos interesen las estimaciones beta, según la pregunta. Si su informe es sobre algo más metodológico u orientado a la simulación, probablemente informaría la estimación beta y el error estándar. Si está tratando de informar un efecto estimado en la población, me quedaría con el Odds Ratio y el 95% del intervalo de confianza. Esa es la esencia de su estimación, y lo que los lectores en ese campo estarán buscando.

Las respuestas se han publicado anteriormente sobre cómo obtener la razón de probabilidades, pero para el OR y el IC del 95%:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)
Fomite
fuente
¡gracias por la respuesta! ¿Puedo preguntar qué significa 1.96 en el cálculo?
upabove
1
No hay problema :) El intervalo de confianza del 95% es el lapso que debería abarcar aproximadamente desde el percentil 2.5 hasta el percentil 97.5 de la distribución normal de su estimación beta. Cada uno de esos puntos es aproximadamente 1.96 desviaciones estándar de la media (en este caso, beta).
Fomite
sí, pero ¿debería hacer esto para cada coeficiente beta? ¿También cambia el 1.96? Además, estos son datos binomiales ¿todavía se basan en la distribución normal?
Upabove
2
Sí, para cada coeficiente beta, puede obtener un odds ratio y un límite de confianza del 95%. El 1.96 no cambiará a menos que desee calcular un percentil diferente para el intervalo de confianza (90%, 99%, etc.), pero como el 95% es estándar, no hay necesidad de hacerlo. Y mientras trabaje en la escala logarítmica, los parámetros de un modelo de regresión logística normalmente se distribuyen. Una vez que los exponga, esto deja de ser cierto.
Fomite