La mayoría de las situaciones, solo tratamos con una variable de resultado / respuesta como . Sin embargo, en algunos escenarios, especialmente en los datos clínicos, las variables de resultado pueden ser de alta dimensión / multivariadas. Tal como Y = β x + ϵ , donde Y contiene variables Y 1 , Y 2 e Y 3 y todos estos resultados están correlacionados. Si x representa recibir tratamiento (sí / no), ¿cómo puedo simular este tipo de datos en R?
Un ejemplo de la vida real, cada paciente recibe uno de los 2 tipos de cirugías de derivación y los investigadores miden a cada paciente con dolor, hinchazón, fatiga ... etc. después de la cirugía de derivación (cada síntoma califica de 0 a 10). Supongo que los resultados (gravedad de los síntomas) son multivariados normales. Espero que este ejemplo real pueda aclarar mi pregunta. Muchas gracias de antemano.
fuente
Respuestas:
Simule valores normales multivariados con
mvtnorm::rmvnorm
. No parece funcionar como los generadores de números aleatorios univariados, que le permiten especificar vectores de parámetros, pero esta limitación es fácil de solucionar.Por ejemplo, considere el modelo
donde tiene una distribución normal multivariada y Var ( y i ) = 1 , Cov ( y 1 , y 2 ) = Cov ( y 2 , y 3 ) = 0.5 y Cov ( y 1 , y 3 ) = 0 . Especifiquemos esta matriz de covarianza en R:y Var(yi)=1 Cov(y1,y2)=Cov(y2,y3)=0.5 Cov(y1,y3)=0
Para experimentar, generemos algunos datos para este modelo dejando que varíe de a , con tres repeticiones cada vez. También tenemos que incluir términos constantes:x 101 10
El modelo determina los medios:
La solución para generar múltiples resultados multivariados es usar
apply
:fuente
Las redes bayesianas (BN) se usan comúnmente en el contexto que usted describe. Como modelo generativo , un BN le permitiría representar las dependencias estadísticas entre sus variables de dominio, que en su caso se pueden agrupar como 1) pretratamiento, 2) tratamiento y 3) variables de postratamiento. Puede entrenar su modelo en los datos de sus pacientes existentes y luego ingresar evidencia (complete los valores observados) de un paciente específico para investigar cómo los valores observados afectan a otras variables (incluidas las que etiquetó como resultado, es decir, después del tratamiento).
Un buen truco es que puedes evaluar el efecto de diferentes tipos de tratamiento en tus variables de resultado. Esto se llama una intervención . Si está interesado, tenemos un documento relevante aquí .
fuente