Ajuste del valor p para la estadística I de Moran local (LISA)

10

Estoy trabajando con un análisis espacial exploratorio en R usando el paquete spdep.

Encontré una opción para ajustar los valores p de los indicadores locales de asociación espacial (LISA) calculados usando la localmoranfunción. Según los documentos, está dirigido a:

... ajuste del valor de probabilidad para múltiples pruebas.

Además en los documentos de p.adjustSPHe leído que las opciones disponibles son:

Los métodos de ajuste incluyen la corrección de Bonferroni ('"bonferroni"') en la que los valores p se multiplican por el número de comparaciones. Holm (1979) ('"holm"'), Hochberg (1988) ('"hochberg"'), Hommel (1988) ('"hommel"') y Benjamini & Hochberg (1995) también incluyen cuatro correcciones menos conservadoras. ('"fdr"'), respectivamente. También se incluye una opción de paso ('"none"').

Los primeros cuatro métodos están diseñados para dar un fuerte control de la tasa de error familiar. Parece que no hay razón para usar la corrección de Bonferroni no modificada porque está dominada por el método de Holm, que también es válido bajo supuestos arbitrarios.

Los métodos de Hochberg y Hommel son válidos cuando las pruebas de hipótesis son independientes o cuando están asociadas de manera no negativa (Sarkar, 1998; Sarkar y Chang, 1997). El método de Hommel es más poderoso que el de Hochberg, pero la diferencia suele ser pequeña y los valores p de Hochberg son más rápidos de calcular.

El método "BH" (también conocido como "fdr") y "BY" de Benjamini, Hochberg y Yekutieli controlan la tasa de descubrimiento falso, la proporción esperada de descubrimientos falsos entre las hipótesis rechazadas. La tasa de descubrimiento falso es una condición menos estricta que la tasa de error familiar, por lo que estos métodos son más potentes que los demás.

Un par de preguntas que aparecieron:

  1. En palabras simples, ¿cuál es el propósito de este ajuste?
  2. ¿Es necesario usar tales correcciones?
  3. En caso afirmativo, ¿cómo elegir entre las opciones disponibles?
radek
fuente
1
Migré esta pregunta porque muchas como esta se han abordado aquí en CV. Vea lo que puede aprender de una búsqueda , por ejemplo.
whuber
@whuber Buena idea. No pensé en CV, pero de hecho parece ser un mejor hogar para él. Gracias.
radek

Respuestas:

1

brevemente, el problema que enfrenta se llama prueba de hipótesis múltiples . Surge cuando estás probando, como su nombre indica, muchas hipótesis al mismo tiempo.

Digamos que tiene una probabilidad dada de rechazar incorrectamente la hipótesis nula (falso positivo) para una prueba, digamos 5%. A medida que aumenta el número de conjuntos de datos que está probando (en este caso, cada uno de los conjuntos donde aplica la estadística de Moran local), la probabilidad de observar en cualquier conjunto de datos un falso positivo aumentará, independientemente del hecho de que la probabilidad de observar Un falso positivo para un único conjunto de datos es el mismo.

Hay muchas "correcciones" posibles, que son las que encontró, para corregir este problema; Si realmente necesita una estadística local, no puede esquivarla. De lo contrario, puede usar la estadística global como una hipótesis única.

chuse
fuente