Estoy investigando la mediana de supervivencia usando Kaplan-Meier en diferentes estados para un tipo de cáncer. Hay diferencias bastante grandes entre los estados. ¿Cómo puedo comparar la supervivencia media entre todos los estados y determinar cuáles son significativamente diferentes de la supervivencia media en todo el país?
12
Respuestas:
Una cosa a tener en cuenta con la curva de supervivencia de Kaplan-Meier es que es básicamente descriptiva y no inferencial . Es solo una función de los datos, con un modelo increíblemente flexible que se encuentra detrás de ellos. Esto es una fortaleza porque significa que prácticamente no hay supuestos que puedan romperse, sino una debilidad porque es difícil generalizarlo y que se ajusta al "ruido" y a la "señal". Si desea hacer una inferencia, entonces básicamente tiene que introducir algo desconocido que desea saber.
Ahora, una forma de comparar los tiempos medios de supervivencia es hacer los siguientes supuestos:
Ahora, la forma "más conservadora" de utilizar estos supuestos es el principio de máxima entropía, por lo que obtienes:
Donde se eligen y λ de modo que el PDF se normalice, y el valor esperado es t i . Ahora tenemos:K λ tyo
=K[-exp(-λ T i )
Y así tiene un conjunto de distribuciones de probabilidad para cada estado.
Que dan una distribución de probabilidad conjunta de:
Ahora parece que quiere probar la hipótesisH0 0: T1= T2= ⋯ = Tnorte= t¯ es la mediana del tiempo medio de supervivencia. La hipótesis alternativa severa para probar es la hipótesis de "cada estado es un copo de nieve único y hermoso"t¯= 1norte∑nortei = 1tyo HUN: T1= t1, ... , Tnorte= tnorte
Dónde
es la media armónica Tenga en cuenta que las probabilidades siempre favorecerán el ajuste perfecto, pero no mucho si los tiempos medios de supervivencia son razonablemente cercanos. Además, esto le brinda una forma directa de establecer la evidencia de esta prueba de hipótesis particular:
Combine esto con una regla de decisión, función de pérdida, función de utilidad, etc., que diga lo ventajoso que es aceptar la hipótesis más simple, ¡y ya tiene su conclusión!
Ahora, una cosa que se ha pasado por alto aquí es la correlación entre estados: esta estructura supone que conocer la tasa de supervivencia media en un estado no le dice nada sobre la tasa de supervivencia media en otro estado. Si bien esto puede parecer "malo", no es difícil mejorarlo, y los cálculos anteriores son buenos resultados iniciales que son fáciles de calcular.
Agregar conexiones entre estados cambiará los modelos de probabilidad, y verá efectivamente una "agrupación" de los tiempos de supervivencia promedio. Una forma de incorporar correlaciones en el análisis es separar los verdaderos tiempos de supervivencia en dos componentes, una "parte común" o "tendencia" y una "parte individual":
Y luego restringir la parte individualUyo σ
fuente
Pensé que solo agregué a este tema que podría estar interesado en la regresión cuantil con la censura. Bottai y Zhang 2010 propusieron una "Regresión de Laplace" que puede hacer exactamente esta tarea, puede encontrar un PDF aquí . Para esto hay un paquete para Stata, aún no se ha traducido a R, aunque el paquete quantreg en R tiene una función para la regresión cuantílica censurada, crq , que podría ser una opción.
Creo que el enfoque es muy interesante y podría ser mucho más intuitivo para los pacientes que las proporciones de riesgos. Saber, por ejemplo, que el 50% del medicamento sobrevive 2 meses más que los que no toman el medicamento y los efectos secundarios que lo obligan a permanecer de 1 a 2 meses en el hospital podrían facilitar la elección del tratamiento.
fuente
Primero, visualizaría los datos: calcularía los intervalos de confianza y los errores estándar para las supervivencias medias en cada estado y mostraría los IC en una parcela forestal, las medianas y sus SE utilizando una gráfica en embudo.
La "supervivencia media media en todo el país" es una cantidad que se estima a partir de los datos y, por lo tanto, tiene incertidumbre, por lo que no puede tomarse como un valor de referencia definido durante las pruebas de significación. Otra dificultad con el enfoque de la media de todo es que cuando compara una mediana de estado con ella, está comparando la mediana con una cantidad que ya incluye esa cantidad como componente. Por lo tanto, es más fácil comparar cada estado con todos los demás estados combinados. Esto se puede hacer realizando una prueba de rango de registro (o sus alternativas) para cada estado.
(Editar después de leer la respuesta de probabilidad lógico: la prueba de rango de registro compara la supervivencia en dos (o más) grupos, pero no es estrictamente la mediana que está comparando. Si está seguro es la mediana que desea comparar, puede confiar en sus ecuaciones o usar el remuestreo aquí también)
Usted etiquetó su pregunta [comparaciones múltiples], por lo que supongo que también desea ajustar (aumentar) sus valores de p de manera que si ve al menos un valor de p ajustado inferior al 5%, podría concluir que "la supervivencia media en todos los estados es no igual ”al nivel de significancia del 5%. Puede utilizar métodos genéricos y demasiado conservadores como Bonferroni, pero el esquema de corrección óptimo tendrá en cuenta las correlaciones de los valores de p. Supongo que no desea construir ningún conocimiento a priori en el esquema de corrección, por lo que analizaré un esquema en el que el ajuste está multiplicando cada valor de p por la misma constante de C.
Como no sé cómo derivar la fórmula para obtener el multiplicador C óptimo, usaría remuestreo . Bajo la hipótesis nula de que las características de supervivencia son las mismas en todos los estados, por lo que puede permutar las etiquetas de estado de los casos de cáncer y recalcular las medianas. Después de obtener muchos vectores muestreados de valores de estado p, encontraría numéricamente el multiplicador C por debajo del cual menos del 95% de los vectores no incluyen valores p significativos y por encima del cual más del 95%. Si bien el rango parece amplio, aumentaría repetidamente el número de muestras en un orden de magnitud.
fuente