Parece que a través de varias preguntas relacionadas aquí, hay consenso en que la parte "95%" de lo que llamamos un "intervalo de confianza del 95%" se refiere al hecho de que si tuviéramos que replicar exactamente nuestros procedimientos de muestreo y cálculo de CI muchas veces , El 95% de los IC calculados de esta manera contendrían la media de la población. También parece ser el consenso de que esta definición noPermitir a uno concluir, a partir de un único IC del 95%, que existe una probabilidad del 95% de que la media caiga en algún lugar dentro del IC. Sin embargo, no entiendo cómo lo primero no implica lo último en la medida en que, habiendo imaginado muchos IC del 95% de los cuales contienen la media de la población, no debería nuestra incertidumbre (con respecto a si nuestro IC calculado realmente contiene la población media o no) ¿nos obligan a usar la tasa base de los casos imaginados (95%) como nuestra estimación de la probabilidad de que nuestro caso real contenga el IC?
He visto publicaciones que discuten en la línea de "el CI calculado realmente contiene la media de la población o no, por lo que su probabilidad es 1 o 0", pero esto parece implicar una extraña definición de probabilidad que depende en estados desconocidos (es decir, un amigo lanza una moneda justa, oculta el resultado y no se me permite decir que hay un 50% de posibilidades de que sea cara).
Seguramente estoy equivocado, pero no veo dónde mi lógica se ha torcido ...
fuente
Respuestas:
Parte del problema es que la definición frecuentista de una probabilidad no permite que se aplique una probabilidad no trivial al resultado de un experimento en particular, sino solo a una población ficticia de experimentos de los cuales este experimento en particular puede considerarse una muestra. La definición de un IC es confusa, ya que es una declaración sobre esta (generalmente) población ficticia de experimentos, en lugar de sobre los datos particulares recopilados en la instancia en cuestión. Entonces, parte del problema es una de las definiciones de probabilidad: la idea del verdadero valor dentro de un intervalo particular con una probabilidad del 95% es inconsistente con un marco frecuentista.
Otro aspecto del problema es que el cálculo de la confianza frecuentista no utiliza toda la información contenida en la muestra particular relevante para delimitar el verdadero valor de la estadística. Mi pregunta "¿Hay ejemplos en los que los intervalos bayesianos creíbles son obviamente inferiores a los intervalos de confianza frecuentistas"analiza un artículo de Edwin Jaynes que tiene algunos ejemplos realmente buenos que realmente resaltan la diferencia entre los intervalos de confianza y los intervalos creíbles. Uno que es particularmente relevante para esta discusión es el Ejemplo 5, que discute la diferencia entre un intervalo creíble y un intervalo de confianza para estimar el parámetro de una distribución exponencial truncada (para un problema en el control de calidad industrial). En el ejemplo que da, ¡hay suficiente información en la muestra para estar seguro de que el verdadero valor del parámetro no se encuentra en ningún lugar en un intervalo de confianza del 90% correctamente construido!
Esto puede parecer impactante para algunos, pero la razón de este resultado es que los intervalos de confianza y los intervalos creíbles son respuestas a dos preguntas diferentes, a partir de dos interpretaciones diferentes de la probabilidad.
El intervalo de confianza es la respuesta a la solicitud: "Dame un intervalo que ponga entre paréntesis el valor verdadero del parámetro en el % de las instancias de un experimento que se repite una gran cantidad de veces". El intervalo creíble es una respuesta a la solicitud: "Dame un intervalo que ponga entre paréntesis el valor verdadero con la probabilidad dada la muestra particular que realmente he observado " . Para poder responder a la última solicitud, primero debemos adoptar cualquiera ( ) un nuevo concepto del proceso de generación de datos o (b) un concepto diferente de la definición de probabilidad misma. p100p p
La razón principal por la que un intervalo de confianza del 95% en particular no implica una probabilidad del 95% de contener la media es porque el intervalo de confianza es una respuesta a una pregunta diferente, por lo que es solo la respuesta correcta cuando la respuesta a las dos preguntas sucede a tener la misma solución numérica
En resumen, los intervalos creíbles y de confianza responden diferentes preguntas desde diferentes perspectivas; ambos son útiles, pero debe elegir el intervalo correcto para la pregunta que realmente desea hacer. Si desea un intervalo que admita una interpretación de una probabilidad del 95% (posterior) de contener el valor verdadero, elija un intervalo creíble (y, con él, la conceptualización de probabilidad correspondiente), no un intervalo de confianza. Lo que no debe hacer es adoptar una definición de probabilidad diferente en la interpretación que la utilizada en el análisis.
¡Gracias a @cardinal por sus refinamientos!
Aquí hay un ejemplo concreto, del excelente libro de David MaKay "Teoría de la información, inferencia y algoritmos de aprendizaje" (página 464):
Deje que el parámetro de interés sea y los datos , un par de puntos y dibujados independientemente de la siguiente distribución:D x 1 x 2θ D x1 x2
Si es , entonces esperaríamos ver los conjuntos de datos , , y todos con igual probabilidad . Considere el intervalo de confianza39 ( 39 , 39 ) ( 39 , 40 ) ( 40 , 39 ) ( 40 , 40 ) 1 / 4θ 39 (39,39) (39,40) (40,39) (40,40) 1/4
Claramente, este es un intervalo de confianza válido del 75% porque si vuelve a muestrear los datos, , muchas veces el intervalo de confianza construido de esta manera contendría el valor verdadero el 75% del tiempo.D=(x1,x2)
Ahora considere los datos . En este caso, el intervalo de confianza frecuente del 75% sería . Sin embargo, suponiendo que el modelo del proceso de generación es correcto, podría ser 28 o 29 en este caso, y no tenemos ninguna razón para suponer que 29 es más probable que 28, por lo que la probabilidad posterior es . Entonces, en este caso, el intervalo de confianza frecuentista claramente no es un intervalo creíble del 75%, ya que solo hay un 50% de probabilidad de que contenga el verdadero valor de , dado lo que podemos inferir sobre de esta muestra en particular .[ 29 , 29 ] θ p ( θ = 28 | D ) = p ( θ = 29 | D ) = 1 / 2 theta θD=(29,29) [29,29] θ p(θ=28|D)=p(θ=29|D)=1/2 θ θ
Sí, este es un ejemplo artificial, pero si los intervalos de confianza y los intervalos creíbles no fueran diferentes, seguirían siendo idénticos en los ejemplos artificiales.
Tenga en cuenta que la diferencia clave es que el intervalo de confianza es una declaración sobre lo que sucedería si repitiera el experimento muchas veces, el intervalo creíble es una declaración sobre lo que se puede inferir de esta muestra en particular.
fuente
En las estadísticas frecuentistas, las probabilidades se refieren a eventos a largo plazo. Simplemente no se aplican a un solo evento una vez hecho. Y la ejecución de un experimento y el cálculo del IC es solo un evento de este tipo.
Querías compararlo con la probabilidad de que una moneda oculta sea cara pero no puedes. Puedes relacionarlo con algo muy cercano. Si su juego tenía una regla en la que debía declarar después de "voltear" las cabezas, entonces la probabilidad de que sea correcto a largo plazo es del 50% y eso es análogo.
Cuando ejecuta su experimento y recopila sus datos, obtiene algo similar al lanzamiento real de la moneda. El proceso del experimento es como el proceso del lanzamiento de la moneda en el que generaμμ o no solo quiere que la moneda sea cara o no. Una vez que lanza la moneda, lo vea o no, no hay probabilidad de que sea cara, ya sea cara o no. Ahora supongamos que llamas cabezas. Eso es lo que es calcular el CI. Porque nunca puedes revelar la moneda (tu analogía con un experimento se desvanecería). O tienes razón o estás equivocado, eso es todo. ¿Su estado actual tiene alguna relación con la probabilidad de que salga cara en la próxima vuelta, o que podría haber predicho lo que es? No. El proceso por el cual se produce la cabeza tiene una probabilidad de 0.5 de producirlos, pero no significa que una cabeza que ya existe tenga una probabilidad de ser de 0.5. Una vez que calcula su CI, no hay probabilidad de que captureμ , lo hace o no, ya has lanzado la moneda.
De acuerdo, creo que ya he torturado lo suficiente. El punto crítico es realmente que su analogía está equivocada. Nunca puedes revelar la moneda; solo puede llamar cara o cruz basándose en suposiciones sobre monedas (experimentos). Es posible que desee hacer una apuesta después de que sus cabezas o colas sean correctas, pero nunca podrá cobrar por ello. Además, es un componente crítico del procedimiento de CI que indique que el valor de importación está en el intervalo. Si no lo tiene, entonces no tiene un IC (o al menos no uno en el% indicado).
Probablemente lo que confunde a CI es su nombre. Es un rango de valores que contienen o no . Creemos que contienen pero la probabilidad de que eso no sea el mismo que el proceso que se llevó a desarrollarlo. La parte del 95% del nombre del IC del 95% es solo sobre el proceso. Usted puede calcular un rango que cree posteriormente contiene en algún nivel de probabilidad, sino que es un cálculo diferente y no un CI.μ μμ μ μ
Es mejor pensar en el nombre IC del 95% como una designación de un tipo de medición de un rango de valores que crees que contienen y separan el 95% de esa plausibilidad. Podríamos llamarlo Jennifer CI, mientras que el 99% CI es Wendy CI. Eso podría ser realmente mejor. Luego, luego podemos decir que creemos que es probable que esté en el rango de valores y que nadie se quede atascado diciendo que existe una probabilidad de Wendy de que hayamos capturado . Si desea una designación diferente, creo que probablemente también debería sentirse libre de deshacerse de la parte de "confianza" de CI (pero es un intervalo).μ μμ μ μ
fuente
Las ideas formales y explícitas sobre argumentos, inferencia y lógica se originaron, dentro de la tradición occidental, con Aristóteles. Aristóteles escribió sobre estos temas en varios trabajos diferentes (incluido uno llamado Temas ;-)). Sin embargo, el principio único más básico es la Ley de no contradicción , que se puede encontrar en varios lugares, incluida la metafísica.libro IV, capítulos 3 y 4. Una formulación típica es: "... es imposible que algo al mismo tiempo sea y no sea [en el mismo sentido]" (1006 a 1). Su importancia se afirma un poco antes, "... este es naturalmente el punto de partida incluso para todos los demás axiomas" (1005 b 30). Perdóname por depilarme filosóficamente, pero esta pregunta por su naturaleza tiene un contenido filosófico que no se puede dejar de lado simplemente por conveniencia.
Considere este experimento mental: Alex lanza una moneda, la atrapa y la gira sobre su antebrazo con la mano cubriendo el lado hacia arriba. Bob estaba parado en la posición correcta; vio brevemente la moneda en la mano de Alex, y así puede deducir qué lado está mirando hacia arriba ahora. Sin embargo, Carlos no vio la moneda, no estaba en el lugar correcto. En este punto, Alex les pregunta cuál es la probabilidad de que la moneda muestre caras. Carlos sugiere que la probabilidad es .5, ya que esa es la frecuencia a largo plazo de las cabezas. Bob no está de acuerdo, afirma con confianza que la probabilidad no es más que exactamente 0 .
Ahora, ¿quién tiene razón? Es posible, por supuesto, que Bob haya visto mal y sea incorrecto (supongamos que no vio mal). Sin embargo, no puede sostener que ambos son correctos y se apegan a la ley de no contradicción. (Supongo que si no crees en la ley de no contradicción, podrías pensar que ambos tienen razón, o alguna otra formulación similar.) Ahora imagina un caso similar, pero sin Bob presente, ¿podría ser la sugerencia de Carlos? más bien (¿eh?) sin Bob alrededor, ya que nadie vio la moneda? La aplicación de la ley de no contradicción no es tan clara en este caso, pero creo que es obvio que las partes de la situación que parecen ser importantes se mantienen constantes de la primera a la segunda. Ha habido muchos intentos de definir la probabilidad, y en el futuro todavía puede haber muchos más, pero una definición de probabilidad en función de quién está parado y dónde está posicionado tiene poco atractivo. En cualquier caso (adivinando por el uso de la frase "intervalo de confianza "), estamos trabajando dentro del enfoque Frequentista, y si alguien sabe que el verdadero estado de la moneda es irrelevante. No es una variable aleatoria: es un valor realizado y muestra caras o colas .
Es importante para mí señalar en este punto que todo esto es el caso dentro de una concepción frecuente de probabilidad. La perspectiva bayesiana no viola la ley de no contradicción, simplemente parte de diferentes suposiciones metafísicas sobre la naturaleza de la realidad (más específicamente sobre la probabilidad). Otros en CV están mucho mejor versados en la perspectiva bayesiana que yo, y tal vez puedan explicar por qué los supuestos detrás de su pregunta no se aplican dentro del enfoque bayesiano, y que de hecho, puede haber una probabilidad del 95% de la media mentir dentro de un 95% creíbleintervalo, bajo ciertas condiciones que incluyen (entre otras) que el uso previo fue correcto (ver el comentario de @DikranMarsupial a continuación). Sin embargo, creo que todos estarían de acuerdo, que una vez que declare que está trabajando dentro del enfoque Frequentista, no puede ser el caso de que la probabilidad de que la verdadera media se encuentre dentro de un IC del 95% en particular es de .95.
fuente
¿Por qué un IC del 95% no implica una probabilidad del 95% de contener la media?
Hay muchos problemas que deben aclararse en esta pregunta y en la mayoría de las respuestas dadas. Me limitaré solo a dos de ellos.
a. ¿Qué significa una población? ¿Existe una verdadera población media?
El concepto de media poblacional depende del modelo. Como todos los modelos están equivocados, pero algunos son útiles, esta media poblacional es una ficción que se define solo para proporcionar interpretaciones útiles. La ficción comienza con un modelo de probabilidad.
si. ¿Cuál es la definición y el propósito de un intervalo de confianza?
Observación: Los lectores deben notar que no es necesario hacer suposiciones sobre el estado de la realidad, la región de confianza se define para un modelo estadístico bien definido sin hacer referencia a ningún medio "verdadero". Incluso si la medida de probabilidad "verdadera" no existe o no está en , la definición de la región de confianza funcionará, ya que los supuestos se refieren al modelado estadístico más que a los estados de la realidad.M
Por un lado, antes de observar los datos, es un conjunto aleatorio (o intervalo aleatorio) y la probabilidad de que " contenga la media " es, al menos, para todos . Esta es una característica muy deseable para el paradigma frecuentista.C α ( X ) μ θ ( 1 - α ) θ ∈ ΘCα(X) Cα(X) μθ (1−α) θ∈Θ
Por otro lado, después de observar los datos , es solo un conjunto fijo y la probabilidad de que " contenga la media " debería estar en {0,1} para todos .C α ( x ) C α ( x ) μ θ θ ∈ Θx Cα(x) Cα(x) μθ θ∈Θ
Es decir, después de observar los datos , ya no podemos emplear el razonamiento probabilístico. Hasta donde sé, no existe una teoría para tratar los conjuntos de confianza para una muestra observada (estoy trabajando en ello y obtengo algunos buenos resultados). Por un tiempo, el frecuentista debe creer que el conjunto (o intervalo) observado es uno de los conjuntos que contiene para todos .C α ( x ) ( 1 - α ) 100 % μ θ θ ∈ Θx Cα(x) (1−α)100% μθ θ∈Θ
PD: invito cualquier comentario, crítica, crítica o incluso objeción a mi publicación. Discutamos en profundidad. Como no soy hablante nativo de inglés, mi publicación seguramente contiene errores tipográficos y gramaticales.
Referencia:
Schervish, M. (1995), Theory of Statistics, Second ed, Springer.
fuente
Me sorprende que nadie haya mencionado el ejemplo de Berger de un intervalo de confianza del 75% esencialmente inútil descrito en el segundo capítulo de "El principio de probabilidad". Los detalles se pueden encontrar en el texto original (que está disponible de forma gratuita en Project Euclid ): lo esencial del ejemplo es que describe, sin ambigüedades, una situación en la que conoce con absoluta certeza el valor de un parámetro aparentemente desconocido después de observando datos, pero usted afirmaría que solo tiene un 75% de confianza en que su intervalo contiene el valor verdadero. Trabajar en los detalles de ese ejemplo fue lo que me permitió entender toda la lógica de construir intervalos de confianza.
fuente
No sé si esto debería hacerse como una nueva pregunta, pero está abordando la misma pregunta planteada anteriormente al proponer un experimento mental.
En primer lugar, voy a suponer que si selecciono una carta de juego al azar de un mazo estándar, la probabilidad de que haya seleccionado un palo (sin mirarlo) es 13/52 = 25%.
Y en segundo lugar, se ha dicho muchas veces que un intervalo de confianza del 95% debe interpretarse en términos de repetir un experimento varias veces y el intervalo calculado contendrá la media real el 95% del tiempo; creo que esto fue demostrado razonablemente convincentemente por James Waters simulación. La mayoría de las personas parecen aceptar esta interpretación de un IC del 95%.
Ahora, para el experimento mental. Supongamos que tenemos una variable normalmente distribuida en una gran población, tal vez la altura de hombres o mujeres adultos. Tengo un asistente dispuesto e incansable a quien le encargo realizar múltiples procesos de muestreo de un tamaño de muestra dado de la población y calcular la media de la muestra y el intervalo de confianza del 95% para cada muestra. Mi asistente está muy interesado y logra medir todas las muestras posibles de la población. Luego, para cada muestra, mi asistente registra el intervalo de confianza resultante en verde (si el IC contiene la media verdadera) o rojo (si el IC no contiene la media verdadera). Desafortunadamente, mi asistente no me mostrará los resultados de sus experimentos. Necesito obtener información sobre la altura de los adultos en la población, pero solo tengo tiempo, recursos y paciencia para hacer el experimento una vez. Hago una sola muestra aleatoria (del mismo tamaño de muestra utilizada por mi asistente) y calculo el intervalo de confianza (usando la misma ecuación).
No tengo forma de ver los resultados de mi asistente. Entonces, ¿cuál es la probabilidad de que la muestra aleatoria que he seleccionado arroje un IC verde (es decir, el intervalo contiene la media real)?
En mi opinión, esto es lo mismo que la situación de la baraja de cartas descrita anteriormente y puede interpretarse que es un 95% de probabilidad de que el intervalo calculado contenga la media verdadera (es decir, es verde). Y, sin embargo, el consenso parece ser que un intervalo de confianza del 95% NO puede interpretarse ya que existe una probabilidad del 95% de que el intervalo contenga la media real. ¿Por qué (y dónde) se desmorona mi razonamiento en el experimento de pensamiento anterior?
fuente
Si bien ha habido una discusión extensa en las numerosas respuestas excelentes, quiero agregar una perspectiva más simple. (aunque se ha aludido en otras respuestas, pero no explícitamente). Para algunos parámetros , y dada una muestra , un intervalo de confianza de es una declaración de probabilidad de la formaθ (X1,X2,⋯,Xn) 100p%
Si consideramos a ser una constante, entonces la afirmación anterior es sobre las variables aleatorias y , o más exactamente, se trata de el intervalo aleatorio .g ( X 1 , X 2 , ⋯ , X n ) f ( X 1 , X 2 , ⋯ , X n ) ( g ( X 1 , X 2 , ⋯ , X n ) , f ( X 1 , X 2 , ⋯ , X n ) )θ g(X1,X2,⋯,Xn) f(X1,X2,⋯,Xn) (g(X1,X2,⋯,Xn),f(X1,X2,⋯,Xn))
Por lo tanto, en lugar de proporcionar información sobre la probabilidad de que el parámetro esté contenido en el intervalo, proporciona información sobre la probabilidad del intervalo que contiene el parámetro, ya que el intervalo se realiza a partir de variables aleatorias.
fuente
Para fines prácticos, no está más equivocado al apostar que su IC del 95% incluyó la media real con una probabilidad de 95: 5, que apostar al lanzamiento de la moneda de su amigo con una probabilidad de 50:50.
Si tu amigo ya lanzó la moneda y crees que hay un 50% de probabilidad de que sea cara, entonces solo estás usando una definición diferente de la palabra probabilidad. Como han dicho otros, para los frecuentistas no puede asignar una probabilidad a un evento que haya ocurrido, sino que puede describir la probabilidad de que ocurra un evento en el futuro utilizando un proceso dado.
Desde otro blog: El frecuentador dirá: "Un evento en particular no puede tener una probabilidad. La moneda muestra cara o cruz, y a menos que lo muestres, simplemente no puedo decir cuál es el hecho. Solo si repitieras el lanzamiento muchas, muchas veces, cualquiera que varíe las condiciones iniciales de los lanzamientos con la suficiente fuerza, esperaría que la frecuencia relativa de cabezas en todos los lanzamientos se acerque a 0.5 ". http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability
fuente
Digamos que el IC que calculó a partir del conjunto particular de datos que tiene es uno de los 5% de posibles IC que no contiene la media. ¿Qué tan cerca está de ser el intervalo de 95% creíble que te gustaría imaginar que sea? (Es decir, ¿qué tan cerca está de contener la media con un 95% de probabilidad?) No tiene la seguridad de que esté cerca en absoluto. De hecho, su IC puede no superponerse con uno solo del 95% de los IC del 95% que realmente contienen la media. Sin mencionar que no contiene la media en sí, lo que también sugiere que no es un intervalo de 95% creíble.
Tal vez desee ignorar esto y asumir de manera optimista que su IC es uno del 95% que contiene la media. Bien, ¿qué sabemos sobre su IC, dado que está en el 95%? Que contiene la media, pero tal vez solo una salida extrema, excluyendo todo lo demás al otro lado de la media. No es probable que contenga el 95% de la distribución.
De cualquier manera, no hay garantía, tal vez ni siquiera una esperanza razonable de que su IC del 95% sea un intervalo creíble del 95%.
fuente
Si solo está adivinando los lanzamientos de monedas de sus amigos con 50% de cara / cruz, entonces no lo está haciendo bien.
Seguramente la credibilidad de su suposición sobre el lanzamiento de la moneda dependerá de estas condiciones y no siempre será el mismo 50% (a veces su método de 'trampa' puede funcionar mejor).
Su suposición general podría ser, si hace trampa, x> 50% del tiempo correcto, pero eso no significa necesariamente que la probabilidad de cada lanzamiento en particular fuera constantemente x% cara. Por lo tanto, sería un poco extraño proyectar su probabilidad general sobre la probabilidad de un lanzamiento específico. Es un "tipo de probabilidad" diferente.
Se trata un poco de hasta qué nivel o profundidad especifica / define 'probabilidad' .
La confianza es independiente de la 'probabilidad específica en el experimento / volteo particular' e independiente de 'las probabilidades a priori' .
La confianza se trata del conjunto de experimentos . Está construido de tal manera que no es necesario conocer las probabilidades o distribuciones a priori en la población.
La confianza se refiere a la "tasa de falla" general de la estimación, pero para casos específicos uno podría especificar variaciones más precisas en la probabilidad .
( Estas variaciones en la probabilidad al menos existen implícitamente , en teoría, y no necesitamos saberlas para que existan. Pero podemos expresar explícitamente estas probabilidades utilizando un enfoque bayesiano).
Ejemplo 1:
Digamos que está haciendo una prueba para una enfermedad muy rara. Realiza una prueba que podría verse como un ensayo de Bernoulli (positivo o negativo) que tiene un alto para un resultado positivo cuando la persona está enferma o bajo cuando la persona no está enferma.p=0.99 p=0.01
Ahora, esto no se hace normalmente (en la práctica clínica) para estimar un intervalo de CI para pero podría hacerlo (como ejemplo) si lo desea. Si la prueba es positiva, entonces estima y si la prueba es negativa, entonces estima .0.05 ≤ p ≤ 1 0 ≤ p ≤ 0.95p 0.05≤p≤1 0≤p≤0.95
Si tiene 1% de la población enferma, en promedio obtendrá 1.98% de la prueba positiva (1% del 99% de las personas sanas dan positivo y 99% del 1% de las personas enfermas dan positivo). Esto hace que su intervalo de IC del 95% (condicional) cuando encuentre una prueba positiva , solo sea correcto el 50% del tiempo.
Por otro lado, cuando se encuentre con una prueba negativa, será correcto más del 95% del tiempo, por lo que, en general, su intervalo de IC es correcto (al menos) el 95% del tiempo, pero caso por caso (para casos específicos ) realmente no se puede decir que la probabilidad de dentro del intervalo es del 95%. Es probable que haya alguna variación.p
Ejemplo 2
Digamos que hay personas que realizan 300 preguntas de CI. Desde el ingenuo intervalo de confianza y el punto de vista frecuentista, se podría suponer que cada persona tiene una distribución teórica personal para el rendimiento de la prueba, y en función del rendimiento de la prueba observada, podría crear una estimación para un intervalo tal que en el 95% de los casos tendrá derecho a contener adecuadamente el en el intervalo.N ( μ i , σ 2 i ) μ ii N(μi,σ2i) μi
Esto ignora que existe un efecto de regresión a la media y que la probabilidad a priori para el IQ cualquier persona se distribuye como . Luego, en casos extremos, bajo o alto, el resultado de los resultados, la probabilidad del coeficiente intelectual de una persona en los intervalos de confianza del 95% basados en las mediciones / pruebas será inferior al 95%. N ( 100 , 15 )μi N(100,15)
(lo contrario es cierto para las personas que tienen resultados cercanos a 100, su coeficiente intelectual probablemente sea más probable que 95% dentro del 95% -CI, y esto debería compensar los errores que cometió en los extremos, de modo que termine teniendo la razón en el 95% de los casos)
fuente
Primero, demos una definición del intervalo de confianza o, en espacios de dimensión mayor que uno, la región de confianza. La definición es una versión concisa de la dada por Jerzy Neyman en su artículo de 1937 a la Royal Society.
El ejemplo de libro de texto de estimar una media poblacional con un intervalo de confianza estándar construido sobre una estadística normal es un caso especial de los supuestos anteriores. Por lo tanto el intervalo de confianza estándar 95% hace contener la media con una probabilidad de 0,95; pero esta correspondencia generalmente no es válida.
fuente
Aquí hay algunas respuestas interesantes, pero pensé que agregaría una pequeña demostración práctica con R. Recientemente utilizamos este código en un curso de estadísticas para resaltar cómo funcionan los intervalos de confianza. Esto es lo que hace el código:
1 - Muestra de una distribución conocida (n = 1000)
2 - Calcula el IC del 95% para la media de cada muestra
3 - Pregunta si el IC de cada muestra incluye o no la media real.
4 - Informa en la consola la fracción de CI que incluía la media real.
Acabo de ejecutar el script varias veces y en realidad no es demasiado raro encontrar que menos del 94% de los IC contenían la media real. Al menos para mí, esto ayuda a disipar la idea de que un intervalo de confianza tiene un 95% de probabilidad de contener el parámetro verdadero.
¡Espero que esto ayude!
fuente