Regresión logística: interpretación de variables continuas

11

Tenía un par de preguntas sobre la interpretación de las razones de probabilidades para las variables continuas en la regresión logística. Siento que estas son preguntas básicas sobre la regresión logística (y probablemente sobre la regresión en general), y aunque me da un poco de vergüenza no saber las respuestas, me tragaré mi orgullo y las preguntaré para saberlas en ¡el futuro!

Aquí está mi situación ... Estoy viendo una muestra de jóvenes adjudicados que, como parte de su libertad condicional, se inscribieron en un programa de capacitación laboral / habilidades para la vida. Quería ver hasta qué punto la edad a la que fueron liberados del programa predijo el empleo seis meses después del lanzamiento del programa.

(Además, tenga en cuenta que hay otros predictores en el modelo, pero los he excluido porque no son estadísticamente significativos y quiero mantener esto lo más claro posible).

Predictor: Edad de liberación del programa de entrenamiento (Edad media = 17.4, SD = 1.2, Rango 14.3-20.5)

Resultado: Empleado o no (Empleado = 1, No empleado = 0)

Resultado: Odds ratio 3.01 (p <.005) (he excluido las estadísticas de bondad de ajuste, etc. porque solo estoy buscando respuestas sobre la interpretación de la odds ratio; me siento cómodo con la evaluación del ajuste del modelo, IC) , etc.)

Dicho en palabras: a medida que la edad aumenta en un año, las probabilidades de estar empleado seis meses después del alta aumentan en tres unidades.

Preguntas:

1) Cuando digo: "A medida que la edad aumenta en un año ...", ¿cuál es el punto de partida para la edad?

¿La edad comienza en cero? Por ejemplo, "A medida que la edad aumenta de 0 [es decir, la edad más baja si tuviera que colocar este modelo en un gráfico] ..."

¿La edad comienza en la edad más baja entre el rango de edades de la muestra? Por ejemplo, "A medida que la edad aumenta de 14.3 ..."

O

¿La edad comienza en la edad media de la muestra? Por ejemplo, "A medida que la edad aumenta de 17.4 ...",

2) ¿El centrado me ayudaría a interpretar este resultado O es solo efectivo para interpretar el y-int? Si eso ayudara, estaba pensando en centrar o restar la edad más baja en el rango de todas las otras edades en la muestra. ¿Alguna sugerencia?

3) Finalmente, ¿es apropiado decir que en comparación con un joven de 14 años, un joven de 17 años tiene nueve veces más probabilidades de ser empleado? Pregunto porque sé que la regresión logística supone una relación sigmoidal, y tengo curiosidad por saber si este aumento de 3 unidades en las probabilidades se mantiene constante en cualquier punto a lo largo de la línea de regresión.

¡Muchas gracias!

Aaron

usuario44992
fuente
1
Quizás te interese esto .
tchakravarty 05 de
44
La eliminación de variables "insignificantes" es muy problemática.
Frank Harrell
@FrankHarrell, ¿podría explicar por qué eliminar variables insignificantes es muy problemático en este caso?
Mark White
Esto se ha discutido extensamente en este sitio. Brevemente arruina los errores estándar, los valores de P, la cobertura de intervalo de confianza, etc.
Frank Harrell

Respuestas:

6

1) Dado que es un odds ratio , no importa dónde empieces. Las probabilidades para un joven de 18 años son 3 veces mayores que para un joven de 17 años. O las probabilidades para un joven de 17 años son 1/3 de las de un joven de 18 años. La misma cosa. Si desea obtener la probabilidad de que una persona de una edad particular sea empleada, puede usar la fórmula con las estimaciones de los parámetros (no las OR). O puede obtener el programa que está utilizando para hacerlo por usted.

2) Si centrar ayuda es una cuestión de opinión. No encuentro modelos centrados más claros, pero algunas personas sí.

3) Las probabilidades no son exactamente las mismas que "probable" (aunque muchas personas hablan como si lo fueran) y las probabilidades para un joven de 17 años serían 27 veces mayores que las de un niño de 14 años.

Finalmente, sería cauteloso con este modelo. El modelo supone que el OR es el mismo entre 14 y 15, 15 y 16 y así sucesivamente. Me parece poco probable, según lo que sé sobre el tema.

Peter Flom - Restablece a Monica
fuente
0

Las probabilidades promedio de inscribirse en el problema de capacitación para un individuo son # veces las probabilidades para otro individuo que es un año menor / mayor, después de mantener constantes todas las demás variables.

Esa es mi opinión.

Yiwan Ye
fuente
1
¿Puedes ampliar cómo se agrega esto a la respuesta anterior?
mdewey