Estaba tratando de crear algunos datos de prueba para la regresión logística y encontré esta publicación ¿Cómo simular datos artificiales para la regresión logística?
Es una buena respuesta, pero solo crea variables continuas. ¿Qué pasa con una variable categórica x3 con 5 niveles (ABCDE) asociada con y para el mismo ejemplo que en el enlace?
r
logistic
simulation
usuario1301295
fuente
fuente
Respuestas:
El modelo
Sea si uno tiene la categoría "B", y x B = 0 en caso contrario. Definir x C , x D , y x E similary. Si x B = x C = x D = x E = 0 , entonces tenemos la categoría "A" (es decir, "A" es el nivel de referencia). Su modelo se puede escribir comoXsi= 1 Xsi= 0 XC Xre Xmi Xsi= xC= xre= xmi= 0
con β 0 una intersección.
Generación de datos en R
(una)
El
x
vector tienen
componentes (uno para cada individuo). Cada componente es "A", "B", "C", "D" o "E". Cada uno de "A", "B", "C", "D" y "E" es igualmente probable.(si)
dummy(x)
n
(C)
Las probabilidades de éxito se desprenden del modelo logístico:
(re)
pi[i]
Algunas simulaciones rápidas para verificar esto están bien
fuente