Estoy llevando a cabo un estudio clínico donde determino una medida antropométrica de los pacientes. Sé cómo manejar la situación en la que tengo una medida por paciente: hago un modelo, donde tengo una muestra aleatoria de alguna densidad f θ , y hago lo habitual: escribir la probabilidad de la muestra, estimar parámetros, determinar conjuntos de confianza y probar hipótesis, o incluso hacer un análisis bayesiano si el jefe no está mirando. ;-)
Mi problema es que para algunos pacientes tenemos más de una medida, porque creemos que es una buena idea tener más de un investigador manejando el dispositivo de medición, cuando esto es posible (algunas veces solo tenemos un investigador trabajando en la clínica ) Por lo tanto, para algunos pacientes tenemos una medida hecha por un investigador, para otras unidades de muestra tenemos dos medidas hechas por dos investigadores diferentes, y así sucesivamente. La medida en cuestión es el grosor de un pliegue de piel específico.
Mi pregunta: ¿qué tipo de modelo estadístico es adecuado para mi problema?
Respuestas:
Eche un vistazo al artículo de Brennan (1992) sobre la Teoría de la generalización o su libro, también titulado "Teoría de la generalización" (2010, Springer). Brennan escribe sobre GT usando ANOVA, pero los modelos mixtos podrían usarse de la misma manera, y muchos los considerarían como un método más reciente.
x ~ (1|patient) + (1|researcher)
fuente
Voy a echar un vistazo a esto a pesar de que solo puedo proporcionar un modelo matemático, ya que soy un poco nerd matemático, pero no un estadístico.
Kalman Filters puede manejar la estimación de estado con múltiples entradas e información faltante.
Si tuviera que mostrar esto a los ingenieros, me exigirían que hiciera gráficos de variabilidad de medidas entre técnicos de medición para mostrar que no hay variabilidad de operador a operador. Tratarían dos medidas como emparejadas. La gente de estadísticas es buena en esto. Si la variabilidad de operador a operador fuera insignificante, entonces podría formular mis datos con cada uno como una sola línea.
si solo un técnico realizara la medición, solo habría una línea de datos
de lo contrario, me gustaría tener una indicación del operador dentro de los datos
Si puede caracterizar la diferencia que cada operador tiene en la misma medición, puede contabilizarla en su modelo. Si no proporciona un indicador de operador, cuando es una fuente significativa de variabilidad ... eso podría ser un problema.
El modelo de datos informa el modelo matemático. Creo que los GLM han tenido buenos resultados en estas áreas. http://www.uta.edu/faculty/sawasthi/Statistics/stglm.html
fuente
También estoy llegando a esta pregunta desde un campo diferente. De todos modos, me parece que el propósito de que varias personas usen el dispositivo de medición es poder explicar el error de medición. Si estoy en lo correcto en mi comprensión de lo que está tratando de hacer, entonces suena como un caso para el modelado de ecuaciones estructurales (SEM), que le permitiría ejecutar su modelo sin errores de medición. SEM puede tener en cuenta los datos faltantes si usa técnicas de estimación FIML, debe hacer las suposiciones habituales sobre los datos faltantes (es decir, al menos falta al azar). Los modelos SEM se han utilizado cada vez más en entornos RCT, por lo que no creo que sea poco común utilizar esta técnica. La pregunta que tengo es: ¿tiene suficiente información para hacer un modelo SEM correctamente identificable?
fuente