Tengo una pregunta sobre la interpretación de la llamada tsboot en R. Revisé la documentación de Kendall y el paquete de arranque, pero no soy más inteligente que antes.
Cuando ejecuto un bootstrap usando, por ejemplo, el ejemplo en el paquete Kendall, donde la estadística de prueba es la tau de Kendall:
library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)
lo que confirma la tendencia al alza:
tau = 0.265, 2-sided pvalue =0.00029206
El ejemplo continúa usando un bloque de arranque:
#
#Use block bootstrap
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")
Recibo el siguiente resultado:
BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5,
sim = "fixed")
Bootstrap Statistics :
original bias std. error
t1* 0.2645801 -0.2670514 0.09270585
Si entiendo correctamente, el "t1 * original" es el MKtau original, el "sesgo" es la media del MKtau de la serie de tiempo de arranque R = 500, y el "error estándar" es la desviación estándar del MKtaus de Las 500 muestras.
Tengo problemas para entender lo que esto significa: esto básicamente me dice que los 500 MKTaus son más bajos que el original, y que el t1 * original está en el rango de 3 sd del MKtaus bootstrapped. Ergo es significativamente diferente?
¿O diría que el MKtau para el conjunto de datos es 0.26 error estándar más / menos?
Lamento la larga pregunta, pero soy un novato en estadística y estoy aprendiendo a través del autoaprendizaje, sin alguien que pueda resolver este problema probablemente realmente simple de un lado a otro.
bias
es simplemente la diferencia entre la media de las 500 muestras de bootstrap almacenadas y la estimación original. Elstd. error
es la desviación estándar de las 500 muestras de bootstrap y es una estimación del error estándar. El resultado le indica que su estimación original es más alta que la media de las 500 estimaciones de arranque (por lo que no todos los MKtaus de arranque son más bajos). El bootstrap a menudo se usa para calcular errores estándar / intervalos de confianza sin hacer suposiciones sobre la distribución. Use laboot.ci
función para calcular los intervalos de confianza.boot.ci
para calcular los intervalos de confianza, y nuevamente, la estadística originalmente calculada se encuentra fuera de estos intervalos.Respuestas:
Después de haber encontrado la misma pregunta y haberla explorado con un conjunto de datos controlado: modelo y = ax + b con N (0, sig) errores, encuentro que el paquete Kendall puede no funcionar como se anuncia. La x en mi caso era
1:100
, y y = x , con sig = 100 (varianza del término de error).La regresión se ve bien, y también la tau de Kendall. Aquí no hay autocorrelación que no sea la inducida por el modelo lineal. Ejecutar la prueba de Kendall como se anuncia con longitudes de bloque de 1, 3, 5 y 10 produce valores de sesgo muy grandes y
boot.ci
no informa ninguna tendencia.Posteriormente, codifiqué manualmente el arranque de los datos con estas longitudes de bloque, y con mi serie de control, obtengo resultados razonables en cuanto a la media de las muestras de arranque y su propagación. Por lo tanto, es posible que algo haya salido mal con el paquete Kendall con respecto al bloque de arranque.
fuente