Tengo dos preguntas sobre los intervalos de confianza:
Aparentemente, un intervalo de confianza estrecho implica que hay una menor posibilidad de obtener una observación dentro de ese intervalo, por lo tanto, nuestra precisión es mayor.
Además, un intervalo de confianza del 95% es más estrecho que un intervalo de confianza del 99%, que es más amplio.
El intervalo de confianza del 99% es más preciso que el 95%.
¿Alguien puede dar una explicación simple que pueda ayudarme a comprender esta diferencia entre precisión y estrechez?
confidence-interval
por encima de
fuente
fuente
a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that interval
correcto. ¿Podría explicarme dónde estoy cometiendo el error?Respuestas:
El 95% no está vinculado numéricamente a la confianza que tiene en haber cubierto el verdadero efecto en su experimento. Quizás reconocer que "intervalo usando el cálculo del rango de cobertura del 95%" podría ser un nombre más preciso para ello. Puede elegir decidir si el intervalo contiene el valor verdadero; y tendrá razón si lo hace constantemente el 95% del tiempo. Pero realmente no sabe qué tan probable es para su experimento particular sin más información.
P1: Su primera consulta combina dos cosas y hace un mal uso de un término. No es de extrañar que estés confundido. Un intervalo de confianza más estrecho puede ser más preciso pero, cuando se calcula de la misma manera, como el método del 95%, todos tienen la misma precisión. Capturan el valor verdadero la misma proporción del tiempo.
Además, el hecho de que sea estrecho no significa que sea menos probable que encuentre una muestra que se encuentre dentro de ese estrecho intervalo de confianza. Un intervalo de confianza estrecho se puede lograr de tres maneras. El método experimental o la naturaleza de los datos podría tener una varianza muy baja. El intervalo de confianza alrededor del punto de ebullición del agua del grifo al nivel del mar es bastante pequeño, independientemente del tamaño de la muestra. El intervalo de confianza en torno al peso promedio de las personas puede ser bastante grande porque las personas son muy variables, pero uno puede hacer que ese intervalo de confianza sea más pequeño con solo obtener más observaciones. En ese caso, a medida que obtenga más certeza sobre dónde cree que está el verdadero valor, al recopilar más muestras y hacer un intervalo de confianza más estrecho, entonces la probabilidad de encontrar a un individuo en ese intervalo de confianza disminuye. (en cualquier caso, disminuye cuando aumenta el tamaño de la muestra, pero no puede molestarse en recoger la muestra grande en la caja de agua hirviendo). Finalmente, podría ser limitado porque su muestra no es representativa. En ese caso, es más probable que tenga uno de los intervalos del 5% que no contiene el valor verdadero. Es un poco una paradoja con respecto al ancho de CI y algo que debe verificar conociendo la literatura y cuán variable es típicamente esta información. En ese caso, es más probable que tenga uno de los intervalos del 5% que no contiene el valor verdadero. Es un poco una paradoja con respecto al ancho de CI y algo que debe verificar conociendo la literatura y cuán variable es típicamente esta información. En ese caso, es más probable que tenga uno de los intervalos del 5% que no contiene el valor verdadero. Es un poco una paradoja con respecto al ancho de CI y algo que debe verificar conociendo la literatura y cuán variable es típicamente esta información.
Considere además que el intervalo de confianza se trata de tratar de estimar el verdadero valor medio de la población. Si conociera ese punto, sería aún más preciso (y exacto) y ni siquiera tendría un rango de estimaciones. Pero su probabilidad de encontrar una observación con ese mismo valor exacto sería mucho menor que encontrar una dentro de cualquier IC basado en una muestra en particular.
P2 : Un intervalo de confianza del 99% es más amplio que un 95%. Por lo tanto, es más probable que contenga el valor verdadero. Vea la distinción anterior entre preciso y exacto, está combinando los dos. Si hago un intervalo de confianza más estrecho con menor variabilidad y mayor tamaño de muestra, se vuelve más preciso, los valores probables cubren un rango más pequeño. Si aumento la cobertura usando un cálculo del 99%, se vuelve más preciso, es más probable que el valor verdadero esté dentro del rango.
fuente
Para un conjunto de datos dado, aumentar el nivel de confianza de un intervalo de confianza solo dará como resultado intervalos más grandes (o al menos no más pequeños ). No se trata de precisión o precisión, sino de cuánto riesgo está dispuesto a asumir por perder el verdadero valor.
Si está comparando intervalos de confianza para el mismo tipo de parámetro de múltiples conjuntos de datos y uno es más pequeño que el otro, se podría decir que el más pequeño es más preciso . Prefiero hablar de precisión en lugar de exactitud en esta situación (vea este artículo relevante de Wikipedia ).
fuente
En primer lugar, un IC para un porcentaje de confianza dado (por ejemplo, 95%) significa, a todos los efectos prácticos (aunque técnicamente no es correcto) que está seguro de que el valor verdadero está en el intervalo.
Si este intervalo es "estrecho" (tenga en cuenta que esto solo puede considerarse de manera relativa, por lo que, en comparación con lo que sigue, digamos que tiene 1 unidad de ancho), significa que no hay mucho espacio para jugar: cualquier valor Si elige ese intervalo, estará cerca del valor verdadero (porque el intervalo es estrecho), y está bastante seguro de eso (95%).
Compare esto con un IC relativamente amplio del 95% (para que coincida con el ejemplo anterior, digamos que tiene 100 unidades de ancho): aquí, todavía está 95% seguro de que el valor verdadero estará dentro de este intervalo, pero eso no le dice mucho mucho, dado que hay relativamente muchos valores en el intervalo (aproximadamente un factor 100 en lugar de 1, y pido, nuevamente, a los puristas que ignoren la simplificación).
Por lo general, necesitará un intervalo mayor cuando desee tener un 99% de certeza de que el valor verdadero está en él, que cuando solo necesita tener un 95% de certeza (nota: esto puede no ser cierto si los intervalos no están anidados ), de hecho, cuanto más confianza necesite, más amplio será el intervalo que deberá elegir.
Por otro lado, se está más seguro con el intervalo de confianza más alto. Entonces, si le doy 2 intervalos del mismo ancho, y digo que uno es un IC del 95% y el otro es un IC del 99%, espero que prefiera el 99%. En este sentido, el 99% de los IC son más precisos: tiene menos dudas de haber perdido la verdad.
fuente
Estoy agregando algunas buenas respuestas aquí a las que les di votos positivos. Creo que hay un poco más que debería decirse para aclarar completamente la conclusión. Me gustan los términos precisos y correctos como los define Efron. Di una larga discusión sobre esto muy recientemente sobre una pregunta diferente. A Whuber moderado realmente le gustó esa respuesta. No iré a la misma longitud para repetir eso aquí. Sin embargo, la precisión de Efron se relaciona con el nivel de confianza y la corrección con respecto al ancho u opresión del intervalo. Pero no se puede hablar de opresión sin considerar primero la precisión. Algunos intervalos de confianza son exactos y precisos porque tienen la cobertura real que anuncian. Un intervalo de confianza del 95% también puede ser aproximado porque utiliza una distribución asintótica. Los intervalos aproximados basados en asintóticos son para un tamaño de muestra finito que no tendrá la cobertura anunciada, que es la cobertura que obtendría si la distribución asintótica fuera la distribución exacta. Por lo tanto, un intervalo aproximado podría ser encubierto (es decir, anunciar el 95% cuando su cobertura real es solo del 91%) o, en el caso raro pero menos grave, encubierto (es decir, la cobertura anunciada es del 95% pero real en el 98%). En el primer caso, nos preocupa la proximidad de la cobertura real a la cobertura anunciada). Una medida de cercanía es el orden de precisión que podría decirse 1 / √n o 1 / n. Si el nivel de confianza real está cerca, lo llamamos preciso. La precisión es importante con intervalos de confianza de arranque que nunca son exactos, pero algunas variantes son más precisas que otras.
Esta definición de precisión puede ser diferente a la que se refiere el OP, pero ahora debe quedar claro cuál es la definición de Efron y por qué es importante ser preciso. Ahora, si tiene dos métodos exactos, podemos preferir uno sobre el otro si para cualquier nivel de confianza tiene el ancho esperado más pequeño. Un intervalo de confianza que sea mejor en este sentido (a veces llamado el más corto) sería el que elegiría. Pero esto requería exactitud. Si el nivel de confianza es solo aproximado, podríamos comparar manzanas y naranjas. Uno podría ser más angosto que otro solo porque es menos preciso y, por lo tanto, tiene una cobertura real más baja que su cobertura anunciada.
Si dos intervalos de confianza son muy precisos o uno es exacto y el otro es muy preciso, la comparación del ancho esperado puede estar bien porque al menos ahora estamos viendo solo dos dos variedades de manzanas.
fuente