Nota: disculpas de antemano si esto es un duplicado, no encontré una q similar en mi búsqueda
Digamos que tenemos un verdadero parámetro p. Un intervalo de confianza C (X) es un RV que contiene p, digamos el 95% del tiempo. Ahora supongamos que observamos X y calculamos C (X). La respuesta común parece ser que es incorrecto interpretar que esto tiene una "probabilidad del 95% de contener p", ya que "lo hace o no contiene p"
Sin embargo, digamos que elijo una carta de la parte superior de un mazo barajado y la dejo boca abajo. Intuitivamente, pienso en la probabilidad de que esta carta sea el As de Picas como 1/52, aunque en realidad "es o no es el As de Picas". ¿Por qué no puedo aplicar este razonamiento al ejemplo del intervalo de confianza?
O si no tiene sentido hablar de la "probabilidad" de que la carta sea el as de espadas ya que "es o no es", todavía tendría 51: 1 de probabilidades de que no sea el as de espadas. ¿Hay otra palabra para describir esta información? ¿Cómo es este concepto diferente de "probabilidad"?
editar: Tal vez para ser más claro, a partir de una interpretación bayesiana de la probabilidad, si me dicen que una variable aleatoria contiene p 95% del tiempo, dada la realización de esa variable aleatoria (y no hay otra información para condicionar) correcto decir que la variable aleatoria tiene un 95% de probabilidad de contener p?
editar: también, a partir de una interpretación frecuentista de probabilidad, digamos que el frecuentador acepta no decir nada como "hay un 95% de probabilidad de que el intervalo de confianza contenga p". ¿Sigue siendo lógico que un frecuentista tenga una "confianza" de que el intervalo de confianza contiene p?
Sea alfa el nivel de significancia y sea t = 100-alfa. K (t) sea la "confianza" del frecuentista de que el intervalo de confianza contiene p. Tiene sentido que K (t) esté aumentando en t. Cuando t = 100%, el frecuentista debe tener la certeza (por definición) de que el intervalo de confianza contiene p, por lo que podemos normalizar K (1) = 1. De manera similar, K (0) = 0. Presumiblemente, K (0,95) está en algún punto intermedio 0 y 1 y K (0.999999) es mayor. ¿De qué manera el frecuentista consideraría K diferente de P (la distribución de probabilidad)?
fuente
Respuestas:
Creo que muchas cuentas convencionales de este asunto no están claras.
Digamos que toma una muestra de tamaño y obtiene un intervalo de confianza del 95 % para p .100 95% p
Luego, toma otra muestra de , independiente de la primera, y obtiene otro intervalo de confianza del 95 % para p .100 95% p
Lo que cambia es el intervalo de confianza; lo que no cambia es .p Eso significa que en los métodos frecuentistas, uno dice que el intervalo de confianza es "aleatorio" pero es "fijo" o "constante", es decir, no aleatorio. En los métodos frecuentistas, como el método de intervalos de confianza, uno asigna probabilidades solo a cosas que son aleatorias.p
Entonces y ( L , U ) es un intervalo de confianza. ( L = "inferior" y U = "superior".) Tome una nueva muestra y L y U cambian pero p no.Pr(L<p<U)=0.95 (L,U) L= U= L U p
Digamos que en un caso particular tienes y U = 43.61 . En los métodos frecuentistas, uno no asignaría una probabilidad a la declaraciónL=40.53 U=43.61 , aparte de una probabilidad de 0 o 1 , porque nada aquí es aleatorio: 40.53 no es aleatorio, p no es aleatorio (ya que no cambiará si tomamos una nueva muestra), y 43.61 no es aleatorio.40.53<p<43.61 0 1 40.53 p 43.61
En la práctica, las personas se comportan como si estuvieran seguras de que p está entre 40.53 y 43.61 . Y como cuestión práctica, eso a menudo puede tener sentido. Pero a veces no. Uno de esos casos es si se sabe de antemano que números tan grandes como 40 o más son improbables, o si se sabe que son altamente probables. Si se puede asignar alguna distribución de probabilidad previa a p , se usa el teorema de Bayes para obtener un intervalo creíble, que puede diferir del intervalo de confianza debido al conocimiento previo de qué rangos de valores de p95% p 40.53 43.61 40 p p probables o improbables. También puede suceder que los datos en sí mismos, las cosas que cambian si se toma una nueva muestra, puedan decirle que p es poco probable sea o incluso seguro que no sea tan grande como . Eso puede suceder incluso en los casos en que el par ( L , U ) es una estadística suficiente para p . Ese fenómeno puede ser tratado en algunos casos por el método de condicionamiento de Fisher en una estadística auxiliar. Un ejemplo de este último fenómeno es cuando la muestra se compone de sólo dos observaciones independientes que se distribuyen uniformemente en el intervalo theta ± 1 / 240 (L,U) p θ±1/2 . Entonces, el intervalo desde la menor de las dos observaciones hasta la mayor es un intervalo de confianza del . Pero si la distancia entre ellos es 0.001 , sería absurdo estar cerca del 50 % seguro de que θ está entre ellos, y si la distancia es 0.999 , uno estaría razonablemente casi 100 % seguro de que θ está entre ellos. La distancia entre ellos sería la estadística auxiliar sobre la que se condicionaría.50% 0.001 50% θ 0.999 100% θ
fuente
La definición del libro de texto de un intervalo de confianza de % es:100×(1−α)
La probabilidad, para los frecuentistas, proviene de la noción de "rebobinar el tiempo y el espacio" para replicar los hallazgos, como si se creara un número infinito de copias del mundo para evaluar un hallazgo científico una y otra y otra vez. Entonces una probabilidad es una frecuencia exactamente. Para los científicos, esta es una forma muy conveniente de discutir los resultados, ya que el primer principio de la ciencia es que los estudios deben ser replicables.
En el ejemplo de tu carta, la confusión para los bayesianos y los frequentistas es que el frecuentista no asigna una probabilidad al valor nominal de la carta en particular que volteaste del mazo, mientras que un bayesiano lo haría. El frecuentista asignaría la probabilidad a una carta, volteada desde la parte superior del mazo aleatoriamente barajado. A un Bayesiano no le preocupa replicar el estudio, una vez que se voltea la tarjeta, ahora tiene un 100% de confianza sobre lo que es la tarjeta y un 0% de creencia de que podría tomar cualquier otro valor. Para los bayesianos, la probabilidad es una medida de creencia.
Tenga en cuenta que los bayesianos no tienen intervalos de confianza por este motivo, resumen la incertidumbre con intervalos de credibilidad .
fuente