Mi situación es la siguiente: quiero, a través de un estudio de Monte-Carlo, comparar los valores de dos pruebas diferentes para la significación estadística de un parámetro estimado (nulo es "sin efecto, el parámetro es cero", y la alternativa implícita es " el parámetro no es cero "). La prueba A es la "prueba t independiente independiente de dos muestras para la igualdad de medias" , con variaciones iguales bajo nulo.
Prueba B Me he construido a mí mismo. Aquí, la distribución nula utilizada es una distribución discreta genérica asimétrica . Pero he encontrado el siguiente comentario en Rohatgi & Saleh (2001, 2a ed., P. 462)
"Si la distribución no es simétrica, el valor no está bien definido en el caso de dos lados, aunque muchos autores recomiendan duplicar el valor de unilateral " .
Los autores no discuten esto más a fondo, ni comentan sobre la "sugerencia de muchos autores" para duplicar el valor unilateral . (Esto crea la pregunta "¿duplicar el valor de qué lado? ¿Y por qué este lado y no el otro?)
No pude encontrar ningún otro comentario, opinión o resultado sobre todo este asunto. Entiendo que con una distribución asimétrica, aunque podemos considerar un intervalo simétrico alrededor de la hipótesis nula con respecto al valor del parámetro, no tendremos la segunda simetría usual, la de la asignación de masa de probabilidad. Pero no entiendo por qué esto hace que el valor "no esté bien definido". Personalmente, al usar un intervalo simétrico alrededor de la hipótesis nula para los valores del estimador, no veo definicionesproblema al decir "la probabilidad de que la distribución nula produzca valores iguales a los límites de, o fuera de este intervalo es XX". El hecho de que la masa de probabilidad en un lado sea diferente a la masa de probabilidad en el otro lado, no parece causar problemas, al menos para mis propósitos. Pero es más probable que Rohatgi y Saleh sepan algo que yo no.
Entonces esta es mi pregunta: ¿en qué sentido el valor está (o puede estar) "no bien definido" en el caso de una prueba de dos lados cuando la distribución nula no es simétrica?
Una nota quizás importante: abordo el asunto más en un espíritu pescador, no estoy tratando de obtener una regla de decisión estricta en el sentido de Neyman-Pearson. Dejo que el usuario de la prueba use la información del valor junto con cualquier otra información para hacer inferencias.
fuente
Respuestas:
Si observamos la prueba exacta de 2x2, y consideramos que ese es nuestro enfoque, lo que es "más extremo" podría medirse directamente por "menor probabilidad". (Agresti [1] menciona varios enfoques de varios autores para calcular dos valores p de cola solo para este caso de la prueba exacta de Fisher 2x2, de los cuales este enfoque es uno de los tres discutidos específicamente como 'más populares').
Para una distribución continua (unimodal), solo encuentra el punto en la otra cola con la misma densidad que su valor de muestra, y todo con igual o menor probabilidad en la otra cola se cuenta en su cálculo del valor p.
Para distribuciones discretas que no aumentan monótonamente en las colas, es casi tan simple. Simplemente cuenta todo con igual o menor probabilidad que su muestra, lo que dado los supuestos que agregué (para que el término "colas" se ajuste a la idea), ofrece una forma de resolverlo.
Si está familiarizado con los intervalos HPD (y nuevamente, estamos tratando con la unimodalidad), es básicamente como sacar todo fuera de un intervalo HPD abierto que está limitado en una cola por su estadística de muestra.
[Para reiterar, esta es una probabilidad bajo la nula que estamos equiparando aquí.]
Entonces, al menos en el caso unimodal, parece bastante simple emular la prueba exacta de Fisher y aún hablar de las dos colas.
Sin embargo, es posible que no haya tenido la intención de invocar el espíritu de la prueba exacta de Fisher de esta manera.
Entonces, pensando fuera de esa idea de lo que hace que algo sea "como o más extremo" por un momento, vamos un poco más hacia el final de las cosas Neyman-Pearson. Puede ayudar (¡antes de la prueba!) Establecer la definición de una región de rechazo para una prueba realizada en algún nivel genérico (no quiero decir que tenga que calcular literalmente una, sino cómo calcularía una). Tan pronto como lo haga, la forma de calcular dos valores p de cola para su caso debería ser obvia.α
Este enfoque puede ser valioso incluso si se está realizando una prueba fuera de la prueba de razón de probabilidad habitual. Para algunas aplicaciones, puede ser complicado descubrir cómo calcular los valores p en las pruebas de permutación asimétrica ... pero a menudo se vuelve mucho más simple si se piensa primero en una regla de rechazo.
Con las pruebas de varianza F, he notado que el "valor p de doble cola" puede dar valores p bastante diferentes a lo que veo como el enfoque correcto. [No debería importar a qué grupo llamas "muestra 1", o si pones la varianza más grande o más pequeña en el numerador.]
[1]: Agresti, A. (1992),
A Survey of Exact Inference for Contingency Tables
Statistical Science , vol. 7 , núm. 1. (febrero), págs. 131-153.
fuente
Aquí se puede encontrar una especie de secuela de esta respuesta, donde se discuten algunos principios de construcción de pruebas en los que se establece explícitamente la hipótesis alternativa .
para los valores p de una cola inferior y superior, el valor p de dos colas viene dado por
fuente