Tengo un modelo de supervivencia con pacientes anidados en hospitales que incluye un efecto aleatorio para los hospitales. El efecto aleatorio está distribuido en gamma, y estoy tratando de informar la 'relevancia' de este término en una escala que se entiende fácilmente.
He encontrado las siguientes referencias que usan la mediana de la razón de riesgo (un poco como la mediana de la razón de probabilidades), y calculé esto.
Bengtsson T, Dribe M: Métodos históricos 43:15, 2010
Sin embargo, ahora deseo informar la incertidumbre asociada con esta estimación utilizando el bootstrap. Los datos son datos de supervivencia y, por lo tanto, hay múltiples observaciones por paciente y múltiples pacientes por hospital. Parece obvio que necesito agrupar las observaciones del paciente al volver a tomar muestras. Pero no sé si también debería agrupar los hospitales (es decir, volver a muestrear hospitales, en lugar de pacientes).
Me pregunto si la respuesta depende del parámetro de interés y, por lo tanto, ¿sería diferente si el objetivo fuera algo relevante a nivel de paciente en lugar de a nivel de hospital?
He enumerado el código stata a continuación en caso de que eso ayude.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr
fuente
La respuesta parece ser que el proceso de remuestreo debe tener en cuenta la estructura de los datos. Aquí hay una buena explicación (junto con un código R para implementar esto).
http://biostat.mc.vanderbilt.edu/wiki/Main/HowToBootstrapCorrelatedData
Gracias al puntero del Grupo de Consultoría Estadística de UCLA .
He escrito una versión más rápida (pero menos flexible) del fragmento de código vinculado anteriormente. Consulte aquí para obtener actualizaciones y detalles.
fuente