¿Se puede aplicar una prueba de moneda justa a una moneda que a menudo cae en su borde?

8

Si lanza una moneda y obtiene 268 caras y 98 colas, puede calcular la probabilidad de que la moneda sea justa de varias maneras. Una observación simple y heurística probablemente concluiría que tal moneda es injusta. He calculado el valor p en R con:

> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19

Este valor es menor que .05, por lo tanto, rechazamos la hipótesis de que es una moneda justa.

Pero, ¿qué sucedería si se dijera que la misma moneda cayó de lado 676 veces durante el juicio? Heurísticamente, probablemente llegarás a la misma conclusión, pero ¿seguirían siendo válidas las típicas pruebas de monedas justas?

Aquí hay un gráfico para ilustrar el problema:

¿Cuáles son los métodos válidos para probar la hipótesis de que existe la misma probabilidad de que ocurra un evento en las áreas sombreadas?

NOTA: hay 629 movimientos positivos (413 negativos) en la ilustración gráfica.

Código R que genera los datos:

require("quantmod")

ticker <- getSymbols("SLV")[,6]

change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)  
change <- na.locf(change, na.rm=TRUE)   

# some other calculations

dens <- density(change)
plot(dens)

# some formatting stuff
Comerciante de leche
fuente
3
Claramente, los datos en los que se basa este gráfico no se derivan del lanzamiento de una moneda y parecen ser continuos, no binarios. ¿Podría decirnos cuál es la pregunta sustantiva que está tratando de responder? Ponerlo en términos de un ejemplo estereotípico no está ayudando aquí.
onestop
El gráfico se deriva del cálculo de cuánto (en términos porcentuales) es el cierre de hoy en comparación con el cierre de hace 24 días. Los modelos de precios de opciones suponen que hay un 50% de probabilidad de que una acción sea un 10% más alta o un 10% más baja en n días. Este gráfico es una distribución de precios reales. ¿Podemos aceptar la hipótesis de que existe la misma probabilidad de que el precio de una acción sea un 10% más alto o un 10% más bajo en n días?
Milktrader
1
@Milktrader, en primer lugar, los modelos de opciones no asumen que existe una probabilidad igual de un retorno al alza del 10% frente a un retorno a la baja del mismo porcentaje. De hecho, los modelos de opciones bajo un marco sin arbitraje ni siquiera funcionan con la distribución real de los retornos. Además, incluso la medida neutral al riesgo generalmente supone que los precios tienen una mayor probabilidad de subir que de caer. Finalmente, su comentario hace dos declaraciones muy diferentes sobre los retornos, aunque parezca que piensa en ellos como lo mismo. Tal vez pueda reformular y aclarar su pregunta.
cardenal
@cardinal En realidad, estoy más interesado en la teoría de la probabilidad que en los modelos de precios de opciones con esta pregunta, aunque el tema de los modelos de precios de opciones es interesante. Es probable que tenga un modelo de precios de opción más robusto, pero el mío muestra que hay un 14.81% de SLV prob que cierra> 40.04 y un 14.52% prob que cierra <32.75 al vencimiento del APR (20 días). También me complace reformular mi pregunta para aclararla, pero no estoy seguro de cómo he hecho dos declaraciones únicas sobre devoluciones.
Milktrader
@ Milktrader, solo estoy tratando de averiguar qué problema estás tratando de resolver. Mi referencia a los modelos de precios de opciones estaba destinada a referirse incluso a los más básicos y "estándar". Actualmente puede parecer que asumen una distribución simétrica, pero eso sería solo porque las tasas de interés están cerca de cero.
cardenal

Respuestas:

5

Estoy bastante seguro de que la respuesta es , la prueba binomial estándar de 'moneda justa' sigue siendo válida: si desea probar si dos de las tres probabilidades de una distribución multinomial son las mismas pero no le interesan las hipótesis sobre En la tercera probabilidad, puede analizar los números de los dos resultados correspondientes como si fueran extraídos de una distribución binomial .

De hecho, esto parece ser un buen ejercicio sobre estadísticas suficientes y probabilidad condicional:

Puede pensar en esto como una distribución multinomial con tres resultados posibles y, por lo tanto, dos parámetros estimables (ya que las tres probabilidades deben sumar 1). Pero no está interesado en la probabilidad del resultado 'medio', por lo que puede tomar esto como el parámetro molesto , y la diferencia entre el número de resultados 'superiores' e 'inferiores' como el parámetro de interés.

Es fácil de mostrar (usando el teorema de factorización de Fisher-Neyman ) que los números de resultados 'superiores' e 'inferiores' juntos forman una estadística suficiente (bidimensional) para el parámetro de interés, es decir, el número de resultados 'intermedios' no No proporcione información adicional sobre el valor del parámetro de interés. El número de resultados 'intermedios' es claramente una estadística suficiente para el parámetro molesto. Si condicionamos este último, creo (no lo he comprobado correctamente) que la probabilidad condicional resultante terminará igual que la probabilidad de la distribución binomial, es decir, el problema del lanzamiento de monedas.

una parada
fuente
1
Esto es muy improbable ya que no he hecho ningún cálculo. Todo lo que has escrito suena bien. La única pregunta que inicialmente se me ocurre es que parece que la estimación de la varianza podría ser diferente de si se "tiraron" las muestras correspondientes al tercer resultado.
cardenal
Sí, esta es la descripción formal de mi problema. ¿Se puede reducir una distribución multinomial a una distribución binomial? Lo que me preocupa es el tamaño del resultado 'medio'.
Milktrader
Estoy aceptando esto como "Sí, puedes, siempre que tu probabilidad condicional sea la misma que la probabilidad de distribución binomial". No estoy seguro de cómo configurar esa prueba, pero eso va más allá del alcance de mi pregunta original.
Milktrader
Aunque la explicación de la respuesta implicaba una probabilidad condicional, tenía la intención de responder a su pregunta "¿seguirían siendo válidas las típicas pruebas de monedas justas?" siendo una ONU condicional !
onestop
3

Si enmarca esto como un problema binomial (p, 1-p), no como un problema multinomial, solo podrá describir el pasado. No podrás decir nada sobre el futuro. ¿Por qué? La eliminación de los "volteos de borde" intermedios está implícita en la reagrupación de los datos.

En otras palabras, su "probabilidad" p "descrita de datos de un resultado positivo y la probabilidad" 1-p "de un resultado negativo no se aplicarán en el próximo" lanzamiento binomial de la moneda ", porque en el futuro realmente tiene probabilidades "x", "y" y "(1-xy)".

Editar (27/03/2011) ===============================

Agregué el siguiente diagrama para ayudar a explicar mis comentarios a continuación.

ingrese la descripción de la imagen aquí

bill_080
fuente
Entonces, ¿no puedo afirmar que P (movimiento positivo | movimiento del 10%)? O, si sé que hay un movimiento del 10%, puedo decir que dicho movimiento tiene una probabilidad (268/366) de ser positivo. Pero creo que siempre puedo reclamar P (movimiento del 10% | movimiento positivo), ¿no? Si el movimiento es positivo, hay una probabilidad (268/629) de que el movimiento superará el 10%. (No imprimí los positivos totales en el gráfico porque no pensaba tan lejos).
Milktrader
@Milktrader: su proceso y números originales se basan en un cierre diario constante. Cuando obtenga un Cierre en el futuro, también se basará en un Cierre diario. Ninguno de los dos se basa en un "cierre preferido" (que requiere información CONOCIDA después del hecho). Puede representar el proceso como un binomio multinomial o uno y medio (un proceso binomial para seleccionar la ruta "Preferido" versus "No preferido", y luego otro proceso binomial usando sus "Probabilidades preferidas"). Intentalo. ¿Es posible simular el proceso general solo con las "probabilidades preferidas"?
bill_080
Si este stock se mueve 10% en los próximos 24 días, ¿puedo afirmar que la probabilidad de que el movimiento sea al alza es 268/366? No me refiero a mezclar marcos de tiempo. (justo ahora revisando la segunda parte de tu comentario)
Milktrader
@Milktrader: De los datos anteriores, para un delta de 24 días, tiene 268 Ups, 98 Downs y 676 Nulls (1042 eventos totales). Suponiendo que no haya cambios estructurales, cada día de negociación en el FUTURO, antes del día de negociación, enfrenta las probabilidades de 268/1042 Ups, 98/1042 Downs. Los 676/1042 nulos restantes aparecerán con más frecuencia. Todo esto trata con el futuro. Después del cierre, sabrá si es un "día preferido", pero nuevamente esto es después del cierre (no el futuro). Sus "probabilidades preferidas" solo se aplican después del hecho (en el pasado). Agregué un diagrama en mi respuesta anterior para ayudar a explicar.
bill_080