Si lanza una moneda y obtiene 268 caras y 98 colas, puede calcular la probabilidad de que la moneda sea justa de varias maneras. Una observación simple y heurística probablemente concluiría que tal moneda es injusta. He calculado el valor p en R con:
> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19
Este valor es menor que .05, por lo tanto, rechazamos la hipótesis de que es una moneda justa.
Pero, ¿qué sucedería si se dijera que la misma moneda cayó de lado 676 veces durante el juicio? Heurísticamente, probablemente llegarás a la misma conclusión, pero ¿seguirían siendo válidas las típicas pruebas de monedas justas?
Aquí hay un gráfico para ilustrar el problema:
¿Cuáles son los métodos válidos para probar la hipótesis de que existe la misma probabilidad de que ocurra un evento en las áreas sombreadas?
NOTA: hay 629 movimientos positivos (413 negativos) en la ilustración gráfica.
Código R que genera los datos:
require("quantmod")
ticker <- getSymbols("SLV")[,6]
change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)
change <- na.locf(change, na.rm=TRUE)
# some other calculations
dens <- density(change)
plot(dens)
# some formatting stuff
fuente
Respuestas:
Estoy bastante seguro de que la respuesta es sí , la prueba binomial estándar de 'moneda justa' sigue siendo válida: si desea probar si dos de las tres probabilidades de una distribución multinomial son las mismas pero no le interesan las hipótesis sobre En la tercera probabilidad, puede analizar los números de los dos resultados correspondientes como si fueran extraídos de una distribución binomial .
De hecho, esto parece ser un buen ejercicio sobre estadísticas suficientes y probabilidad condicional:
Puede pensar en esto como una distribución multinomial con tres resultados posibles y, por lo tanto, dos parámetros estimables (ya que las tres probabilidades deben sumar 1). Pero no está interesado en la probabilidad del resultado 'medio', por lo que puede tomar esto como el parámetro molesto , y la diferencia entre el número de resultados 'superiores' e 'inferiores' como el parámetro de interés.
Es fácil de mostrar (usando el teorema de factorización de Fisher-Neyman ) que los números de resultados 'superiores' e 'inferiores' juntos forman una estadística suficiente (bidimensional) para el parámetro de interés, es decir, el número de resultados 'intermedios' no No proporcione información adicional sobre el valor del parámetro de interés. El número de resultados 'intermedios' es claramente una estadística suficiente para el parámetro molesto. Si condicionamos este último, creo (no lo he comprobado correctamente) que la probabilidad condicional resultante terminará igual que la probabilidad de la distribución binomial, es decir, el problema del lanzamiento de monedas.
fuente
Si enmarca esto como un problema binomial (p, 1-p), no como un problema multinomial, solo podrá describir el pasado. No podrás decir nada sobre el futuro. ¿Por qué? La eliminación de los "volteos de borde" intermedios está implícita en la reagrupación de los datos.
En otras palabras, su "probabilidad" p "descrita de datos de un resultado positivo y la probabilidad" 1-p "de un resultado negativo no se aplicarán en el próximo" lanzamiento binomial de la moneda ", porque en el futuro realmente tiene probabilidades "x", "y" y "(1-xy)".
Editar (27/03/2011) ===============================
Agregué el siguiente diagrama para ayudar a explicar mis comentarios a continuación.
fuente