Intervalo de confianza estrecho: ¿mayor precisión?

18

Tengo dos preguntas sobre los intervalos de confianza:

Aparentemente, un intervalo de confianza estrecho implica que hay una menor posibilidad de obtener una observación dentro de ese intervalo, por lo tanto, nuestra precisión es mayor.

Además, un intervalo de confianza del 95% es más estrecho que un intervalo de confianza del 99%, que es más amplio.

El intervalo de confianza del 99% es más preciso que el 95%.

¿Alguien puede dar una explicación simple que pueda ayudarme a comprender esta diferencia entre precisión y estrechez?

por encima de
fuente
2
Creo que quiere decir "hay una menor posibilidad de obtener una observación fuera de ese intervalo". Desafortunadamente, un intervalo de confianza puede no significar lo que parece significar, debido a problemas técnicos y estadísticos, pero en general, cuanto más estrecho es el intervalo (en un nivel de confianza dado), menos incertidumbre hay sobre los resultados. Hay muchos hilos en este sitio que discuten lo que significa un intervalo de confianza (en oposición a, digamos, un intervalo creíble). Ni siquiera nos estamos metiendo en intervalos predictivos ...
Wayne
@Wayne ¿Por qué la afirmación no es "hay una menor posibilidad de obtener una observación dentro de ese intervalo"? Dado que el intervalo estrecho tiene un gran error de tipo 1, es más probable que rechace la hipótesis nula verdadera , es decir, mi valor nulo verdadero no está contenido en ese intervalo. Entonces, me parece a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalcorrecto. ¿Podría explicarme dónde estoy cometiendo el error?
usuario 31466

Respuestas:

19

El 95% no está vinculado numéricamente a la confianza que tiene en haber cubierto el verdadero efecto en su experimento. Quizás reconocer que "intervalo usando el cálculo del rango de cobertura del 95%" podría ser un nombre más preciso para ello. Puede elegir decidir si el intervalo contiene el valor verdadero; y tendrá razón si lo hace constantemente el 95% del tiempo. Pero realmente no sabe qué tan probable es para su experimento particular sin más información.

P1: Su primera consulta combina dos cosas y hace un mal uso de un término. No es de extrañar que estés confundido. Un intervalo de confianza más estrecho puede ser más preciso pero, cuando se calcula de la misma manera, como el método del 95%, todos tienen la misma precisión. Capturan el valor verdadero la misma proporción del tiempo.

Además, el hecho de que sea estrecho no significa que sea menos probable que encuentre una muestra que se encuentre dentro de ese estrecho intervalo de confianza. Un intervalo de confianza estrecho se puede lograr de tres maneras. El método experimental o la naturaleza de los datos podría tener una varianza muy baja. El intervalo de confianza alrededor del punto de ebullición del agua del grifo al nivel del mar es bastante pequeño, independientemente del tamaño de la muestra. El intervalo de confianza en torno al peso promedio de las personas puede ser bastante grande porque las personas son muy variables, pero uno puede hacer que ese intervalo de confianza sea más pequeño con solo obtener más observaciones. En ese caso, a medida que obtenga más certeza sobre dónde cree que está el verdadero valor, al recopilar más muestras y hacer un intervalo de confianza más estrecho, entonces la probabilidad de encontrar a un individuo en ese intervalo de confianza disminuye. (en cualquier caso, disminuye cuando aumenta el tamaño de la muestra, pero no puede molestarse en recoger la muestra grande en la caja de agua hirviendo). Finalmente, podría ser limitado porque su muestra no es representativa. En ese caso, es más probable que tenga uno de los intervalos del 5% que no contiene el valor verdadero. Es un poco una paradoja con respecto al ancho de CI y algo que debe verificar conociendo la literatura y cuán variable es típicamente esta información. En ese caso, es más probable que tenga uno de los intervalos del 5% que no contiene el valor verdadero. Es un poco una paradoja con respecto al ancho de CI y algo que debe verificar conociendo la literatura y cuán variable es típicamente esta información. En ese caso, es más probable que tenga uno de los intervalos del 5% que no contiene el valor verdadero. Es un poco una paradoja con respecto al ancho de CI y algo que debe verificar conociendo la literatura y cuán variable es típicamente esta información.

Considere además que el intervalo de confianza se trata de tratar de estimar el verdadero valor medio de la población. Si conociera ese punto, sería aún más preciso (y exacto) y ni siquiera tendría un rango de estimaciones. Pero su probabilidad de encontrar una observación con ese mismo valor exacto sería mucho menor que encontrar una dentro de cualquier IC basado en una muestra en particular.

P2 : Un intervalo de confianza del 99% es más amplio que un 95%. Por lo tanto, es más probable que contenga el valor verdadero. Vea la distinción anterior entre preciso y exacto, está combinando los dos. Si hago un intervalo de confianza más estrecho con menor variabilidad y mayor tamaño de muestra, se vuelve más preciso, los valores probables cubren un rango más pequeño. Si aumento la cobertura usando un cálculo del 99%, se vuelve más preciso, es más probable que el valor verdadero esté dentro del rango.

John
fuente
2
La variabilidad de la media (= lo que está tratando de estimar) en la población es cero.
Nick Sabbe
10

Para un conjunto de datos dado, aumentar el nivel de confianza de un intervalo de confianza solo dará como resultado intervalos más grandes (o al menos no más pequeños ). No se trata de precisión o precisión, sino de cuánto riesgo está dispuesto a asumir por perder el verdadero valor.

Si está comparando intervalos de confianza para el mismo tipo de parámetro de múltiples conjuntos de datos y uno es más pequeño que el otro, se podría decir que el más pequeño es más preciso . Prefiero hablar de precisión en lugar de exactitud en esta situación (vea este artículo relevante de Wikipedia ).

Karl
fuente
¿Qué se entiende por "mismo tipo de parámetro" y "conjuntos de datos múltiples"? Digamos, una encuesta sobre analfabetismo y la encuesta se lleva a cabo en diferentes momentos, 1995, 1998, etc. Entonces, ¿es la "tasa de analfabetismo" el mismo tipo de parámetro y los conjuntos de datos de 1995, 1998, etc. indican conjuntos de datos múltiples?
usuario 31466
Por ejemplo, un conjunto de intervalos de confianza, cada uno para la media de alguna población. Tu ejemplo también encaja, creo.
Karl
3

En primer lugar, un IC para un porcentaje de confianza dado (por ejemplo, 95%) significa, a todos los efectos prácticos (aunque técnicamente no es correcto) que está seguro de que el valor verdadero está en el intervalo.

Si este intervalo es "estrecho" (tenga en cuenta que esto solo puede considerarse de manera relativa, por lo que, en comparación con lo que sigue, digamos que tiene 1 unidad de ancho), significa que no hay mucho espacio para jugar: cualquier valor Si elige ese intervalo, estará cerca del valor verdadero (porque el intervalo es estrecho), y está bastante seguro de eso (95%).

Compare esto con un IC relativamente amplio del 95% (para que coincida con el ejemplo anterior, digamos que tiene 100 unidades de ancho): aquí, todavía está 95% seguro de que el valor verdadero estará dentro de este intervalo, pero eso no le dice mucho mucho, dado que hay relativamente muchos valores en el intervalo (aproximadamente un factor 100 en lugar de 1, y pido, nuevamente, a los puristas que ignoren la simplificación).

Por lo general, necesitará un intervalo mayor cuando desee tener un 99% de certeza de que el valor verdadero está en él, que cuando solo necesita tener un 95% de certeza (nota: esto puede no ser cierto si los intervalos no están anidados ), de hecho, cuanto más confianza necesite, más amplio será el intervalo que deberá elegir.

Por otro lado, se está más seguro con el intervalo de confianza más alto. Entonces, si le doy 2 intervalos del mismo ancho, y digo que uno es un IC del 95% y el otro es un IC del 99%, espero que prefiera el 99%. En este sentido, el 99% de los IC son más precisos: tiene menos dudas de haber perdido la verdad.

Nick Sabbe
fuente
¡Gracias! Entonces, cuando dicen que esta nueva investigación sobre que los neutrinos son más rápidos que la luz tiene un intervalo de confianza muy pequeño (supongo que esto significa estrecho), ¿entonces eso significa que es más probable que sean precisos que si fuera un intervalo de confianza amplio? (sin tener en cuenta todos los demás aspectos)
upabove
10
Nick, tu primera afirmación es incorrecta. No es un "problema técnico", simplemente no es correcto. El intervalo de confianza es una declaración sobre lo que sucedería en experimentos repetidos, que cubrirían el valor verdadero el 95% del tiempo. Una declaración sobre la confianza de que el valor verdadero está dentro de mi rango dado encontrado en mi experimento dado no es lo mismo en absoluto. Si eliminó el "eso" en "esa confianza" y la cantidad numérica entre paréntesis, entonces estaría más cerca de la verdad. Podrías decir que significa que crees que el verdadero valor probablemente caerá en el intervalo.
John
de lo contrario, la respuesta es bastante buena ...
John
44
@John: evité específicamente decir que el intervalo en sí mismo es la variable aleatoria, aunque mi oración no implica que no sea (lo admito, sí lo sugiere). Conozco los problemas involucrados, pero los encontré irrelevantes para la pregunta. Nunca he visto una situación práctica donde la diferencia importara tampoco, de ahí el "para todos los fines prácticos".
Nick Sabbe
44
¿No ha encontrado el problema? Eso es como decir el valor p = la probabilidad del nulo y luego decir que nunca has encontrado un problema con él. No lo hará si permanece en los diarios correctos. Es incorrecto decir que está 95% seguro de que el valor verdadero está en su rango actual. Tratarlo como algo esotérico solo significa que ahora tendremos (al menos) una persona más caminando diciendo: "Estoy 95% seguro de que el valor está en este rango". Difícilmente cambiaría su respuesta para corregirlo. Los otros problemas que evita podrían ignorarse si cambia esa declaración.
John
3

Estoy agregando algunas buenas respuestas aquí a las que les di votos positivos. Creo que hay un poco más que debería decirse para aclarar completamente la conclusión. Me gustan los términos precisos y correctos como los define Efron. Di una larga discusión sobre esto muy recientemente sobre una pregunta diferente. A Whuber moderado realmente le gustó esa respuesta. No iré a la misma longitud para repetir eso aquí. Sin embargo, la precisión de Efron se relaciona con el nivel de confianza y la corrección con respecto al ancho u opresión del intervalo. Pero no se puede hablar de opresión sin considerar primero la precisión. Algunos intervalos de confianza son exactos y precisos porque tienen la cobertura real que anuncian. Un intervalo de confianza del 95% también puede ser aproximado porque utiliza una distribución asintótica. Los intervalos aproximados basados ​​en asintóticos son para un tamaño de muestra finito que no tendrá la cobertura anunciada, que es la cobertura que obtendría si la distribución asintótica fuera la distribución exacta. Por lo tanto, un intervalo aproximado podría ser encubierto (es decir, anunciar el 95% cuando su cobertura real es solo del 91%) o, en el caso raro pero menos grave, encubierto (es decir, la cobertura anunciada es del 95% pero real en el 98%). En el primer caso, nos preocupa la proximidad de la cobertura real a la cobertura anunciada). Una medida de cercanía es el orden de precisión que podría decirse 1 / √n o 1 / n. Si el nivel de confianza real está cerca, lo llamamos preciso. La precisión es importante con intervalos de confianza de arranque que nunca son exactos, pero algunas variantes son más precisas que otras.

Esta definición de precisión puede ser diferente a la que se refiere el OP, pero ahora debe quedar claro cuál es la definición de Efron y por qué es importante ser preciso. Ahora, si tiene dos métodos exactos, podemos preferir uno sobre el otro si para cualquier nivel de confianza tiene el ancho esperado más pequeño. Un intervalo de confianza que sea mejor en este sentido (a veces llamado el más corto) sería el que elegiría. Pero esto requería exactitud. Si el nivel de confianza es solo aproximado, podríamos comparar manzanas y naranjas. Uno podría ser más angosto que otro solo porque es menos preciso y, por lo tanto, tiene una cobertura real más baja que su cobertura anunciada.

Si dos intervalos de confianza son muy precisos o uno es exacto y el otro es muy preciso, la comparación del ancho esperado puede estar bien porque al menos ahora estamos viendo solo dos dos variedades de manzanas.

Michael R. Chernick
fuente