Estoy comparando dos dispositivos de control de temperatura, ambos diseñados para mantener la temperatura corporal a exactamente 37 grados en pacientes anestesiados. Los dispositivos se ajustaron a 500 pacientes formando dos grupos. Grupo A (400 pacientes) - Dispositivo 1, Grupo B (100 pacientes) - Dispositivo 2. A cada paciente se le midió la temperatura una vez cada hora durante 36 horas, lo que me dio 18000 puntos de datos en dos grupos. Necesito determinar qué dispositivo controla la temperatura corporal de los pacientes con mayor precisión durante el período de 36 horas. He construido gráficos de líneas que unen los valores medios en cada punto de tiempo con barras de cuartil y visualmente parece haber una diferencia. ¿Cómo debería analizar mis datos para probar una diferencia estadística?
10
Respuestas:
Lo primero en lo que tendrá que pensar es qué significa (cuantitativamente) tener "buena precisión" en dicho dispositivo. Sugeriría que, en un contexto médico, el objetivo es evitar las desviaciones de temperatura que entran en un rango peligroso para el paciente, por lo que "buena precisión" probablemente se traducirá en evitar temperaturas peligrosamente bajas o altas. Esto significa que va a buscar una métrica que penalice en gran medida las grandes desviaciones de su temperatura óptima de 37 C. En vista de esto, la medición basada en fluctuaciones en las temperaturas medias será una mala medida de precisión, mientras que las medidas que resaltan grandes desviaciones serán mejores.o
Cuando está formulando este tipo de métrica, está adoptando implícitamente una "función de penalización" que penaliza las temperaturas que se desvían de la temperatura deseada. Una opción sería medir la "precisión" mediante una varianza menor alrededor de la temperatura deseada (tratando esto como la media fija para el cálculo de la varianza). La varianza penaliza por error al cuadrado, de modo que proporciona una penalización razonable por desviaciones altas. Otra opción sería penalizar más (por ejemplo, error al cubo). Otra opción sería simplemente medir la cantidad de tiempo que cada dispositivo tiene al paciente fuera del rango de temperatura que es médicamente seguro. En cualquier caso, lo que elija debe reflejar los peligros percibidos de desviación de la temperatura deseada.
Una vez que haya determinado qué constituye una métrica de "buena precisión", formulará algún tipo de "prueba de heterocedasticidad", formulada en el sentido más amplio de permitir cualquier medida de precisión que esté utilizando. No estoy seguro de estar de acuerdo con el comentario de Whuber de ajustar la autocorrelación. Realmente depende de su formulación de pérdida: después de todo, permanecer en un rango de temperatura alta durante un período prolongado de tiempo podría ser exactamente lo más peligroso, por lo que si ajusta de nuevo para tener en cuenta la autocorrelación, podría terminar hasta no penalizar suficientemente los resultados altamente peligrosos.
fuente
Esta es una prueba de homocedasticidad. Y debido a que esta es una serie temporal, la elección adecuada es la prueba Breusch-Pagan , no la prueba F. Esta prueba solo responde SOLO a la cuestión de la igualdad de precisión entre los dos dispositivos. El nivel de precisión es otra forma de pensar en la varianza.
[Editar: Cambió la prueba a la correcta, considerando la dependencia del tiempo]
fuente
Si está interesado en qué tan bien los dispositivos mantienen una temperatura de 37 ° C, puede:
Los datos se prestan naturalmente al tratamiento de medidas repetidas. Al tratar los ensayos dentro de la persona como grupos, reducirá la probabilidad de un intervalo de confianza falsamente estimado alrededor del efecto del dispositivo. Además, puede probar el efecto del tiempo entre ambos dispositivos o como una interacción con el dispositivo para determinar si el mantenimiento de la temperatura a lo largo del tiempo fue bueno. Encontrar una manera de visualizar todo esto es de importancia clave y puede sugerir un enfoque sobre otro. Algo en la línea de:
fuente