Una forma de resumir la comparación de dos curvas de supervivencia es calcular la razón de riesgo (FC). Hay (al menos) dos métodos para calcular este valor.
- Método logrank. Como parte de los cálculos de Kaplan-Meier, calcule el número de eventos observados (muertes, generalmente) en cada grupo ( y O b ), y el número de eventos esperados suponiendo una hipótesis nula de ausencia de diferencias en la supervivencia ( E a y E b ). La razón de riesgo es:
H R = ( O a / E a )
- Método Mantel-Haenszel. Primero calcule V, que es la suma de las variaciones hipergeométricas en cada punto de tiempo. Luego calcule la razón de riesgo como:
Obtuve ambas ecuaciones del capítulo 3 de Machin, Cheung y Parmar,Survival Analysis. Ese libro afirma que los dos métodos generalmente dan métodos muy similares, y de hecho ese es el caso con el ejemplo en el libro.
Alguien me envió un ejemplo donde los dos métodos difieren en un factor de tres. En este ejemplo en particular, es obvio que la estimación logrank es razonable, y la estimación Mantel-Haenszel está muy lejos. Mi pregunta es si alguien tiene algún consejo general sobre cuándo es mejor elegir la estimación logrank de la razón de riesgo, y cuándo es mejor elegir la estimación de Mantel-Haenszel. ¿Tiene que ver con el tamaño de la muestra? Número de lazos? Relación de tamaños de muestra?
Respuestas:
Creo que descubrí la respuesta (a mi propia pregunta). Si la suposición de riesgos proporcionales es verdadera, los dos métodos dan estimaciones similares de la razón de riesgo. Creo que la discrepancia que encontré en un ejemplo en particular se debe al hecho de que esa suposición es dudosa.
Si la suposición de riesgos proporcionales es verdadera, entonces una gráfica de log (tiempo) vs. log (-log (St)) (donde St es la supervivencia proporcional en el tiempo t) debería mostrar dos líneas paralelas. A continuación se muestra el gráfico creado a partir del conjunto de datos del problema. Parece lejos de ser lineal. Si el supuesto de riesgos proporcionales no es válido, entonces el concepto de una razón de riesgo no tiene sentido, por lo que no importa qué método se use para calcular la razón de riesgo.
Me pregunto si la discrepancia entre las estimaciones de logrank y Mantel-Haenszel de la razón de riesgo se puede utilizar como un método para probar la suposición de riesgos proporcionales.
fuente
Si no me equivoco, el estimador de rango logarítmico al que hace referencia también se conoce como estimador de Pike. Creo que generalmente se recomienda para HR <3 porque exhibe menos sesgos en ese rango. El siguiente documento puede ser de interés (tenga en cuenta que el documento se refiere a él como O / E):
fuente
En realidad, existen varios métodos más y la elección a menudo depende de si está más interesado en buscar diferencias tempranas, diferencias posteriores o, en cuanto a la prueba de rango de registro y la prueba de Mantel-Haenszel, otorgar el mismo peso a todos los puntos de tiempo.
A la pregunta en cuestión. La prueba de log-rank es, de hecho, una forma de la prueba de Mantel-Haenszel aplicada a los datos de supervivencia. La prueba de Mantel-Haenszel se usa generalmente para probar la independencia en tablas de contingencia estratificadas.
Si intentamos aplicar la prueba MH a los datos de supervivencia, podemos comenzar asumiendo que los eventos en cada momento de falla son independientes. Luego nos estratificamos por tiempo de falla. Utilizamos los métodos MH para hacer de cada tiempo de falla un estrato. No es sorprendente que a menudo den el mismo resultado.
La excepción ocurre cuando más de un evento ocurre simultáneamente: múltiples muertes exactamente en el mismo punto de tiempo. No recuerdo cómo difiere el tratamiento. Creo que la prueba de log-rank promedia sobre los posibles ordenamientos de los tiempos de falla vinculados.
Entonces, la prueba de rango logarítmico es la prueba MH para datos de supervivencia y puede tratar con lazos. Nunca he usado la prueba MH para datos de supervivencia.
fuente
Pensé que había tropezado con un sitio web y una referencia que trata exactamente con esta pregunta:
http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Comience desde "Los dos métodos comparados".
El sitio hace referencia al documento de Berstein vinculado (arriba):
http://www.jstor.org/stable/2530564?seq=1
El sitio resume los resultados de Berstein et al., Así que lo citaré:
El sitio también se refiere al conjunto de datos en el que "las dos estimaciones de FC eran muy diferentes (por un factor de tres)", y sugieren que la suposición de PH es una consideración clave.
Entonces pensé: "¿Quién creó el sitio?" Después de buscar un poco, descubrí que era Harvey Motulsky. Entonces, Harvey, he logrado hacerte referencia para responder tu propia pregunta. Te has convertido en la autoridad!
¿Es el "conjunto de datos problemático" un conjunto de datos disponible públicamente?
fuente