Si el principio de probabilidad choca con la probabilidad frecuentista, ¿descartamos uno de ellos?

19

En un comentario publicado recientemente aquí, un comentarista señaló un blog de Larry Wasserman que señala (sin ninguna fuente) que los choques de inferencia frecuente con el principio de probabilidad.

El principio de probabilidad simplemente dice que los experimentos que producen funciones de probabilidad similares deberían producir una inferencia similar.

Dos partes de esta pregunta:

  1. ¿Qué partes, sabor o escuela de inferencia frecuentista violan específicamente el principio de probabilidad?

  2. Si hay un choque, ¿tenemos que descartar uno u otro? Si es así, ¿cuál? En aras de la discusión, sugeriré que si tenemos que descartar algo, debemos descartar las partes de la inferencia frecuenta que chocan, porque Hacking y Royall me han convencido de que el principio de probabilidad es axiomático.

Michael Lew
fuente
2
Nunca he entendido por qué el principio de probabilidad debería ser un axioma.
Stéphane Laurent
66
Hola Stéphane El problema es que Birnbaum demostró que la probabilidad es equivalente a otros dos principios que son tan naturales que necesariamente deberían ser válidos. Escribimos una breve reseña sobre este resultado. Aquí: ime.usp.br/~pmarques/papers/redux.pdf
Zen
@ Zen Gracias. A primera vista, el punto con el que no estoy de acuerdo es esta oración escrita debajo del principio de condicionalidad: "Lo que importa es lo que realmente sucedió". En cambio, debería decir "Lo que importa es lo que realmente sucedió entre los problemas que podrían haber ocurrido" (perdón si mi inglés no es correcto). Eso es lo que reclamé en mi discusión con gui11aume: en cierto sentido, el principio de probabilidad afirma que el diseño del experimento no importa, y no puedo estar de acuerdo con este punto.
Stéphane Laurent
1
@Zen Ahora he leído más detenidamente tu periódico. Es cierto que es difícil estar en desacuerdo con el principio de condicionalidad y el principio de invariancia.
Stéphane Laurent
1
LP no es tan popular hoy en día por razones prácticas. Al adoptarlo religiosamente, evitas el uso de modelos previos dependientes del modelo, como el anterior de Jeffrey, los anteriores conjugados y las pruebas de hipótesis que pueden ser útiles en muchos contextos. Creo que las estadísticas, igual que la física , no pueden ser axiomatised de una manera significativa (aunque esta discusión puede sonar como este ). Pero es importante identificar las ventajas y desventajas de los diferentes paradigmas.

Respuestas:

12

La parte del enfoque frecuente que choca con el principio de probabilidad es la teoría de la prueba estadística (y el cálculo del valor p). Por lo general, se destaca en el siguiente ejemplo.

Supongamos que dos frequentistas quieren estudiar una moneda sesgada, que llama "cabezas" con propagabilidad desconocida . Se sospecha que está sesgada hacia 'cola', por lo que postulan la misma hipótesis nula p = 1 / 2 y la misma hipótesis alternativa p < 1 / 2 .pagpag=1/ /2pag<1/ /2

El primer estadístico lanza la moneda hasta que aparezca "cara", que es 6 veces. El segundo decide lanzar la moneda 6 veces y obtiene solo una 'cara' en el último lanzamiento.

Según el modelo del primer estadístico, el valor p se calcula de la siguiente manera:

pag(1-pag)5 5+pag(1-pag)6 6+...=pag(1-pag)5 511-pag=pag(1-pag)4 4.

Según el modelo del segundo estadístico, el valor p se calcula de la siguiente manera:

(6 61)pag(1-pag)5 5+(6 60 0)(1-pag)6 6=(5 5pag+1)(1-pag)5 5.

Sustitución de por 1 / 2 , los primeros hallazgos un p-valor igual a 1 / 2 5 = 0,03125 , las segunda encuentra un valor de p igual a 7 / 2 × 1 / 2 5 = 0,109375 .pag1/ /21/ /25 5=0,031257 7/ /2×1/ /25 5=0.109375

Entonces, obtienen resultados diferentes porque hicieron cosas diferentes, ¿verdad? Pero de acuerdo con el principio de probabilidad , deberían llegar a la misma conclusión. Brevemente, el principio de probabilidad establece que la probabilidad es todo lo que importa para la inferencia. Entonces, el choque aquí proviene del hecho de que ambas observaciones tienen la misma probabilidad, proporcional a (la probabilidad se determina hasta una constante de proporcionalidad).pag(1-pag)5 5

Hasta donde yo sé, la respuesta a su segunda pregunta es más una opinión debatida. Personalmente trato de evitar realizar pruebas y calcular valores p por la razón anterior, y para otros explicados en esta publicación de blog .

EDITAR: Ahora que lo pienso, las estimaciones de por intervalos de confianza también serían diferentes. En realidad, si los modelos son diferentes, los IC difieren según la construcción.pag

gui11aume
fuente
1
Tengo la impresión de que el principio de probabilidad obviamente se viola en las estadísticas frecuentas (pruebas de hipótesis, intervalos de confianza) porque tenemos en cuenta la probabilidad de cada posible resultado, no solo la probabilidad basada en el resultado real. Derecho ?
Stéphane Laurent
@ Stéphane Laurent sí, así es como lo entiendo. James Berger tiene una buena cita en Teoría de decisión estadística y análisis bayesiano , que dice que el frequentista a veces rechaza la hipótesis debido a datos que nunca se observaron (suena mejor, pero no puedo recordarlo).
gui11aume
Gracias, gui11aume. ¿Tengo razón al interpretar eso como un ejemplo en el que el "significado" de los valores P varía con la intención del experimentador? Supongo que ese es el caso cuando los valores P se interpretan como una especie de tasa de error falso positivo umbral porque tendrían que distribuirse uniformemente bajo la hipótesis nula. ¿Es eso necesario con el enfoque de Fisher donde los valores P se presentan como índices de la fuerza de la evidencia?
Michael Lew el
44
(+1) Este tipo de discrepancias generalmente aparecen cuando una regla de detención está involucrada en uno de los modelos.
1
@Scortchi En realidad, me equivoqué al pensar que uno de los valores P apunta a la función de probabilidad correcta y el otro no: ambos apuntan a la misma función de probabilidad que presenta la evidencia relevante para la probabilidad de cabezas. Deberías ignorar las dos últimas oraciones de mi comentario anterior. (No puedo editarlo, ¿verdad?)
Michael Lew
4

pag

TTTTTH,
pag7 764pag=7 7/ /640,109

3pag=3/ /640,047

α=0,05


Parte especulativa

Ahora, filosóficamente, diría que la elección frecuente del estadístico de prueba es, en cierto sentido, vaga, similar a la elección bayesiana de antes. Elegimos una u otra estadística de prueba porque creemos que la moneda injusta se comportaría de esta o de esa manera en particular (y queremos tener poder para detectar este comportamiento). ¿No es similar a priorizar los tipos de monedas?

pagpagpag

Estaría muy interesado en escuchar algunas opiniones sobre esta parte especulativa, aquí o en el chat.


Actualice la siguiente discusión con @MichaelLew

pagpagpag

Todavía tengo que pensar qué significa esto para mi parte "especulativa" anterior.

ameba dice Reinstate Monica
fuente
Pensamientos interesantes Sí, estoy de acuerdo en que no es necesario que haya ningún conflicto entre los valores LP y P siempre que los valores P no se interpreten como evidencia de la misma manera que la función de probabilidad. La función de probabilidad contiene la evidencia relevante para el parámetro de interés dado el modelo estadístico . Cuando cambia la estadística de prueba, cambia el modelo, por lo que la función de probabilidad para su modelo alternativo (bueno, puede) diferir de la función de probabilidad para el original.
Michael Lew
pag
Aparte de eso, encontré esta pregunta porque estaba volviendo a leer su documento "To P or not to P" (y busqué en Google el "principio de probabilidad"). Generalmente me gusta el papel, pero la sección 4.4 me confundió por completo. Usted escribe que los valores p no deben "ajustarse" teniendo en cuenta las reglas de detención; pero no veo ningún ajuste en las fórmulas 5-6. ¿Cuáles serían los valores p "no ajustados"? ¿Quiere decir que uno de ellos está ajustado y otro no? Si es así, ¿cuál y por qué no viceversa?
ameba dice Reinstate Monica
El modelo estadístico a menudo se ignora o se supone tácitamente que es invariante. Sin embargo, para las monedas incluye una probabilidad fija desconocida de cara, una selección aleatoria de observaciones y, para el estadístico de prueba de salida de ensayos, la distribución binomial de posibles resultados. No sé cuál es la distribución de los resultados para la estadística de prueba de colas en fila, pero sospecho que es diferente. Incluso si es el mismo, el modelo que tiene su estadística de prueba no es el mismo modelo que el original, por lo que la función de probabilidad puede ser diferente aunque contenga toda la evidencia.
Michael Lew
Estoy a punto de terminar una reelaboración completa de ese documento. Es relevante para esta discusión pero aún no está listo para su presentación. (¿Es este chat?)
Michael Lew