¿Cómo realizar una prueba de rango con signo de Wilcoxon para datos de supervivencia en R?

9

Digamos que tiene datos de supervivencia como este:

obs <- data.frame(
  time = c(floor(runif(100) * 30), floor((runif(100)^2) * 30)),
  status = c(rbinom(100, 1, 0.2), rbinom(100, 1, 0.7)),
  group = gl(2,100)
  )

Para realizar una prueba de rango de registro estándar, se puede usar

survdiff(Surv(time, status) ~ group, data = obs, rho = 0)

¿derecho?

¿Pero qué hay de otra prueba? ¿Cómo podría realizar una prueba de rango con signo de Wilcoxon, una prueba de Peto o una prueba de Fleming-Harrington?

R ofrece la posibilidad de realizar una prueba de Wilcoxon , sin embargo, no encontré cómo dejar que tenga en cuenta la censura.

Además, el documento establece que la configuración rho = 1haría que la prueba sea una "modificación de Peto y Peto de la prueba de Gehan-Wilcoxon". ¿Pero es esto lo mismo que la prueba de Peto?

Marcel
fuente
No conozco mis datos de supervivencia, pero Google parece: Prueba de Wilcox Y leer los documentos para survdiffconfigurarlo rho=1hace que sea una prueba de Peto ...
Justin
¡si, gracias! Esto es lo más lejos que llegué también. Sin embargo, no encontré una manera de dejar que la wilcox.testcensura tuviera en cuenta. Con rho=1No estoy seguro de si se trata de una prueba de Peto o una prueba de Wilcoxon, ya que el documento establece "Modificación de Peto y Peto de la prueba de Gehan-Wilcoxon". No hay necesidad de votar abajo.
Marcel

Respuestas:

7

(Probablemente debería citar la fuente de sus convenciones de nomenclatura y explicar con más detalle por qué se plantea esta pregunta. Si se trata de tratar de hacer coincidir la documentación para SAS o SPSS, podríamos tener dificultades interculturales).

La respuesta rápida a su pregunta específica sobre cómo obtener una "prueba de Peto" es usar rho = 1, pero será una aproximación. En referencia a las secciones de una muestra y dos muestras del capítulo 7 del "Análisis de supervivencia" de Klein y Moeschberger, leemos que la versión de Peto-Peto y la versión de Gehan eran versiones de dos muestras (censuradas) del Mann-Whitney Wilcoxon prueba de dos muestras, pero utilizó diferentes versiones del estimador de la función de supervivencia. No existe una única 'prueba de Fleming-Harrington' ya que ese término se refiere a una familia de pruebas que se reducen al rango logarítmico y a las pruebas de tipo Wilcoxon a valores específicos de rho. (La función R / S surv.difftiene el parámetro q de la familia Fleming-Harrington fijado en 0 y solo varía el parámetro p que denomina rho).

Una meta pregunta es si debería centrarse en los nombres y no en la sustancia matemática. Elegir p = rho = 0 (con q fijo en 0) en la familia Fleming-Harrington pondera las diferencias (OE) o entre grupos por igual en el rango de tiempos, mientras que las pruebas Gehan-Wilcoxon y Peto-Peto pesan temprano muertes más fuertes. Mi opinión (como médico) es que es razonable tener una ponderación que considere las diferencias tempranas más probatoria para el caso típico, pero puede imaginar instancias específicas donde se pueda defender la otra opción.

DWin
fuente
Gracias por su explicación. Mis convenciones de nombres provienen de "Kleinbaum & Klein - Survival Analysis" (p. 63ff). Definen w (t_j) = 1 para Log Rank, w (t_j) = n_j para Wilcoxon, w (t_j) = n ^ (1/2) para Tarone-Ware, w (t_j) = s (t_j) para Peto, y una expresión bastante difícil para Flemington-Harrington. No sé qué pesos necesitaré en el futuro, pero quiero asegurarme de poder aplicarlos antes de necesitarlos :) Pero creo que su respuesta me ayudará con este problema. ¡Gracias!
Marcel
5

Para responder a su pregunta sobre cómo calcular esto en R, puede usar la comp()función del survMiscpaquete. Ejemplo:

> library(survMisc)
> fit = survfit(Surv(time, status) ~ x, data = aml)
> comp(fit)$tests$lrTests
                              ChiSq df      p
Log-rank                       3.40  1 0.0653
Gehan-Breslow (mod~ Wilcoxon)  2.72  1 0.0989
Tarone-Ware                    2.98  1 0.0842
Peto-Peto                      2.71  1 0.0998
Mod~ Peto-Peto (Andersen)      2.64  1 0.1042
Flem~-Harr~ with p=1, q=1      1.45  1 0.2281

Para elegir los parámetros para la prueba de Fleming-Harrington (que se muestra en la última línea), utilice los argumentos FHpy FHq. Por ejemplo,

> comp(fit, FHp=0, FHq=0)$tests$lrTests
[…]
Flem~-Harr~ with p=0, q=0      3.40  1 0.0653

le proporciona la prueba de log-rank normal (también se muestra en la primera línea en el primer ejemplo).

Karl Ove Hufthammer
fuente
1
En la versión actual de survMisc (0.5.4) debería sercomp(ten(fit))
Marcin Kosiński el