Tengo el siguiente resultado de regresión logística:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.5716 0.1734 3.297 0.000978 ***
R1 -0.4662 0.2183 -2.136 0.032697 *
R2 -0.5270 0.2590 -2.035 0.041898 *
¿Es apropiado informar esto de la siguiente manera:
Coeficiente beta, cociente de probabilidades, valor Z, valor P. En caso afirmativo, ¿cómo puedo obtener el Odds ratio?
Respuestas:
Su informe sugerido para una tabla parece razonable, aunque los valores z y p son redundantes. Muchas revistas con las que estoy familiarizado no informan el valor z / valor p en absoluto y solo usan asteriscos para informar la significación estadística. También he visto tablas logísticas solo con las proporciones de impares informadas, aunque personalmente prefiero las probabilidades de registro y las proporciones de probabilidades informadas si el espacio lo permite en una tabla.
Pero diferentes lugares pueden tener diferentes guías en cuanto a los procedimientos de presentación de informes, por lo que lo que se espera puede variar. Si estoy enviando un artículo a una revista, con frecuencia solo veré cómo otros documentos recientes han hecho sus tablas y simplemente los imitaré. Si es su propio documento personal, preguntarle a quien sea que lo esté revisando sería una solicitud razonable. Como mencioné anteriormente, las limitaciones de espacio en algunos lugares pueden evitar que informe información redundante (como las probabilidades de registro y las razones de probabilidades). ¡Algunos lugares pueden obligarlo a informar los resultados completamente en texto!
exp(coefficient)
También como nota, aunque esta es la respuesta aceptada actual, lejohn y Frank Harrell dan consejos muy útiles. Si bien normalmente siempre quisiera que las estadísticas de la pregunta se informaran en alguna parte, los otros consejos de respuestas sobre otras medidas son formas útiles de evaluar los tamaños de los efectos en relación con otros efectos estimados en el modelo. Los procedimientos gráficos también son útiles para examinar los tamaños de efectos relativos, y ver estos dos documentos sobre cómo convertir tablas en gráficos como ejemplos ( Kastellec y Leoni, 2007 ; Gelman et al., 2002 )
fuente
La respuesta a esta pregunta puede depender de sus antecedentes disciplinarios.
Aquí hay algunas consideraciones generales.
Las versiones beta en regresión logística son bastante difíciles de interpretar directamente. Por lo tanto, informarlos explícitamente solo tiene un uso muy limitado. Debe atenerse a los odds ratios o incluso a los efectos marginales. El efecto marginal de la variable x es la derivada de la probabilidad de que sus variables dependientes sean iguales a 1, con respecto a x. Esta forma de presentar resultados es muy popular entre los economistas. Personalmente, creo que los efectos marginales son más fáciles de entender por los laicos (pero no solo por ellos ...) que las razones de probabilidades.
Otra posibilidad interesante es utilizar pantallas gráficas. Un lugar donde encontrará algunas ilustraciones de este enfoque es el libro de Gelman y Hill . Esto me parece incluso mejor que informar efectos marginales.
En cuanto a la pregunta sobre cómo obtener las razones de probabilidades, así es cómo puede hacerlo en R:
fuente
Es solo en casos especiales donde los coeficientes y sus anti-logs (odds ratios) son buenos resúmenes. Esto es cuando las relaciones son lineales y hay un coeficiente asociado con un predictor, y cuando un cambio de una unidad es una buena base para calcular la razón de posibilidades (más aceptable para la edad, no tanto para el recuento de glóbulos blancos que tiene un rango de 500-100,000). En general, cosas como las razones de probabilidades de rango intercuartil son útiles. Tengo más detalles sobre esto en http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf y el
rms
paquete R hace todo esto automáticamente (maneja términos e interacciones no lineales, calcula cuartiles de X, etc.)fuente
Probablemente depende de tu audiencia y disciplina. La respuesta a continuación es lo que normalmente se hace para las revistas de Epidemiología y, en menor medida, las revistas médicas.
Para ser franco, no nos importan los valores p. En serio, no lo hacemos. La epidemiología ni siquiera le permitirá informarlos a menos que tenga una necesidad realmente apremiante, y el campo esencialmente ha seguido su ejemplo.
Es posible que ni siquiera nos interesen las estimaciones beta, según la pregunta. Si su informe es sobre algo más metodológico u orientado a la simulación, probablemente informaría la estimación beta y el error estándar. Si está tratando de informar un efecto estimado en la población, me quedaría con el Odds Ratio y el 95% del intervalo de confianza. Esa es la esencia de su estimación, y lo que los lectores en ese campo estarán buscando.
Las respuestas se han publicado anteriormente sobre cómo obtener la razón de probabilidades, pero para el OR y el IC del 95%:
fuente