Soy médico, así que por favor sea amable conmigo y mi comprensión básica de las estadísticas.
Tengo un conjunto de datos que consta de pacientes y sus visitas y he etiquetado la presencia de un tipo específico de lunar en su mano izquierda y / o derecha con valores de {0,1} (0 = no presente y 1 = presente). El conjunto de datos se ve así:
** Lo eliminé ya que se proporcionan las respuestas; Puedo enviarlo a pedido nuevo
Entonces, eso significa que el paciente A1-001 tuvo 6 visitas sin presencia de lunares en su mano derecha durante todas las visitas y presencia de lunares en su mano izquierda en todas las visitas, excepto en la primera.
Estoy interesado en encontrar la probabilidad de que una mano desarrolle un lunar solo entre los pacientes que desarrollaron un lunar en una mano y encontrar la probabilidad de desarrollar un lunar en la otra mano (dado que el paciente ya tenía un lunar en la otra mano) .
Además, quiero saber cuál es la probabilidad de desarrollar un lunar en las visitas entre los pacientes que desarrollaron un lunar en algún momento en ambas manos.
¿Podrías ayudarme a modelar estas simples preguntas?
Respuestas:
Personalmente, creo que esto se presta bien para un análisis de supervivencia.
Tiene personas sin lunares en cierta mano al comienzo del período (su población en riesgo); puede seleccionarlos, y tiene puntos de tiempo para el seguimiento y si fueron censurados o no (desarrollaron un lunar). Esto te da un peligro para cualquier cohorte que hayas seleccionado.
Luego puede calcular una razón de riesgo (por ejemplo, para desarrollar un lunar derecho en personas con lunares izquierdos al inicio del estudio, en comparación con los que no lo tienen). Esto podría expresarse en un gráfico de Kaplan-Meier y vendrá con un intervalo de confianza.
fuente
No hay que modelar aquí, todas sus preguntas son simples probabilidades condicionales.
Muy bien, dado que la gente no apreciaba esa respuesta, debes aclarar un par de cosas.
¿Quieres decir por visita? ¿O que nunca desarrollaron un lunar? De tu ejemplo:
Los pacientes 1 y 3 desarrollaron un lunar por un lado. El paciente 1 nunca desarrolló un lunar, pero sí el paciente 3, por lo que podría argumentar que la respuesta a su pregunta es del 50%. Ahora, también podría argumentar que el paciente 1 tuvo 4 chequeos con 1 lunar y no con el otro y que el paciente 3 tuvo 0 chequeos con 1 lunar y no con el otro, por lo que la probabilidad podría ser 1/5 = 20%. Depende de cómo defina su pregunta.
fuente
Personalmente, creo que puede comenzar estudiando los modelos lineales generalizados de varianza múltiple : https://cran.r-project.org/web/packages/mcglm/index.html
https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html
http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)
Esos modelos son apropiados para cuando tiene más de una variable de respuesta y no son gaussianos, y este es su caso, ya que tiene dos variables binarias (mole o no mole en cada mano). Además, el método le permite lidiar con dependencias intraindividuales, que viene dada por la estructura longitudinal. Aquí, longitudinal significa medidas repetidas para el mismo individuo, a lo largo del tiempo.
Creo que los enlaces anteriores lo ayudarán a tener una buena idea sobre estas técnicas, y también proporcionan la implementación computacional en R.
fuente