¿Todos los valores dentro de un intervalo de confianza del 95% son igualmente probables?

56

He encontrado información discordante sobre la pregunta: " Si uno construye un intervalo de confianza (IC) del 95% de una diferencia en las medias o una diferencia en las proporciones, ¿todos los valores dentro del IC son igualmente probables? O, ¿es la estimación puntual la más probable? , con valores cerca de las "colas" del CI menos probable que aquellos en el medio del CI?

Por ejemplo, si un informe de ensayo clínico aleatorizado indica que el riesgo relativo de mortalidad con un tratamiento particular es 1.06 (IC del 95%: 0.96 a 1.18), ¿es la probabilidad de que 0.96 sea el valor correcto igual a 1.06?

Encontré muchas referencias a este concepto en línea, pero los siguientes dos ejemplos reflejan la incertidumbre en él:

  1. El módulo de Lisa Sullivan sobre Intervalos de confianza establece:

    Los intervalos de confianza para la diferencia de medias proporcionan un rango de valores probables para ( μ1μ2 ). Es importante tener en cuenta que todos los valores en el intervalo de confianza son estimaciones igualmente probables del valor verdadero de ( μ1μ2 ).

  2. Esta publicación de blog, titulada Dentro del margen de error , establece:

    Lo que tengo en mente es un malentendido sobre el "margen de error" que trata todos los puntos dentro del intervalo de confianza como igualmente probables, como si el teorema del límite central implicara una distribución uniforme limitada en lugar de una distribución t . [...]
    Lo que se habla sobre el "margen de error" es que las posibilidades que están cerca de la estimación puntual son mucho más probables que las posibilidades que están al borde del margen ".

Esto parece contradictorio, ¿cuál es el correcto?

pmgjones
fuente
77
Me pregunto si hay confusión en alguna parte con el concepto relacionado de que los valores p se distribuyen uniformemente bajo la hipótesis nula ..
Michael McGowan
44
La primera cita es un deslizamiento aberrante en una cuenta precisa de los intervalos de confianza. La segunda cita es de una cuenta que, para decirlo bien, es un desastre descuidado: está lleno de declaraciones que son vagas, incorrectas o que solo pueden interpretarse en un sentido bayesiano. ¡Pero ambas citas están equivocadas !
whuber
@whuber No llamaría al segundo un desastre ... Lo llamaría una interpretación bayesiana de la interpretación frequentista :)
Michael McGowan
1
@Michael Un ejemplo de descuido es un solecismo como afirmar que el CLT implica que "un número infinito de estimaciones repetidas de [la población] media seguirá una distribución normal". Uno no tiene que estar equivocado para comunicar ideas simplemente a una audiencia no técnica.
whuber
2
@whuber, considero que la oración que citas solo es un pecado menor. El error principal es que CLT no involucra la distribución t.
vidrioso

Respuestas:

23

Una pregunta que debe responderse es ¿qué significa "probable" en este contexto?

Si significa probabilidad (como a veces se usa como sinónimo de) y estamos usando definiciones estrictas de frecuentista, entonces el verdadero valor del parámetro es un valor único que no cambia, por lo que la probabilidad (probabilidad) de ese punto es 100% y todo otros valores son 0%. Entonces, casi todos son igualmente probables al 0%, pero si el intervalo contiene el valor verdadero, entonces es diferente de los demás.

Si utilizamos un enfoque bayesiano, entonces el IC (Intervalo creíble) proviene de la distribución posterior y puede comparar la probabilidad en los diferentes puntos dentro del intervalo. A menos que el posterior sea perfectamente uniforme dentro del intervalo (teóricamente posible, supongo, pero eso sería una circunstancia extraña), entonces los valores tienen diferentes probabilidades.

Si usamos es probable que sea similar a la confianza, piénselo de esta manera: calcule un intervalo de confianza del 95%, un intervalo de confianza del 90% y un intervalo de confianza del 85%. Estaríamos 5% seguros de que el valor verdadero se encuentra en la región dentro del intervalo del 95% pero fuera del intervalo del 90%, podríamos decir que el valor verdadero es 5% probable de caer en esa región. Lo mismo es cierto para la región que está dentro del intervalo del 90% pero fuera del intervalo del 85%. Entonces, si cada valor es igualmente probable, entonces el tamaño de las 2 regiones anteriores necesitaría ser exactamente el mismo y lo mismo sería válido para la región dentro de un intervalo de confianza del 10% pero fuera de un intervalo de confianza del 5%. Ninguna de las distribuciones estándar con las que se construyen los intervalos tiene esta propiedad (excepto casos especiales con 1 extracción de un uniforme).

Además, puede demostrarlo a usted mismo simulando una gran cantidad de conjuntos de datos de poblaciones conocidas, calculando el intervalo de confianza de interés y luego comparando con qué frecuencia el parámetro verdadero está más cerca de la estimación puntual que de cada uno de los puntos finales.

Greg Snow
fuente
3
La probabilidad es lo que esta pregunta necesita en la respuesta, no la probabilidad, ya sea frecuentista o bayesiana. La probabilidad proporciona exactamente la respuesta, los demás solo pueden hacerlo con algunos giros y estiramientos.
Michael Lew
1
@ Greg Me gusta tu explicación. Para ser claros, su argumento respalda la noción de que los valores en las "colas" del IC del 95% son menos probables (menos probables) que los más cercanos a la estimación puntual, ¿correcto? Gracias por su respuesta.
pmgjones
1
@pmgjones menos probable, NO, ver segundo párrafo. Menos probable en el contexto del cuarto párrafo, sí.
Greg Snow
2
@GregSnow Su segundo párrafo dice casi exactamente que la probabilidad de que el parámetro verdadero sea el parámetro verdadero es del 100%. ¿Realmente crees que esta tautología es lo que las "definiciones frecuentistas estrictas" tienen para ofrecer?
rolando2
2
@ rolando2, creo que las estadísticas frecuentas tienen mucho que ofrecer, solo estaba eliminando las representaciones erróneas comunes que implican cambios en el valor real y, a veces, está fuera del intervalo y, a veces, dentro del intervalo (y, a veces, más cerca de los límites y, a veces, más cerca de la centrar). Los párrafos posteriores luego llegan a la sensación más verdadera de las ideas.
Greg Snow
19

¡Esta es una gran pregunta! Existe un concepto matemático llamado probabilidad que lo ayudará a comprender los problemas. Fisher inventó la probabilidad, pero consideró que era algo menos deseable que la probabilidad, pero la probabilidad resulta ser más `` primitiva '' que la probabilidad e Ian Hacking (1965) consideró que era axiomático porque no es demostrable. La probabilidad apuntala la probabilidad en lugar de lo contrario.

Hacking, 1965. Lógica de la inferencia estadística .

La probabilidad no recibe la atención que debería tener en los libros de texto estándar de estadística, sin ninguna buena razón. Difiere de la probabilidad de tener casi exactamente las propiedades que uno esperaría, y las funciones e intervalos de probabilidad son muy útiles para la inferencia. Tal vez algunos estadísticos no le gusten a la probabilidad porque a veces no existe una forma "adecuada" de derivar las funciones de probabilidad relevantes. Sin embargo, en muchos casos las funciones de probabilidad son obvias y bien definidas. Un estudio de las probabilidades de inferencia probablemente debería comenzar con el libro pequeño y fácil de entender de Richard Royall llamado Evidencia estadística: un paradigma de probabilidad .

La respuesta a su pregunta es que no, los puntos dentro de cualquier intervalo no tienen la misma probabilidad. Aquellos en los bordes de un intervalo de confianza generalmente tienen menores probabilidades que otros hacia el centro del intervalo. Por supuesto, el intervalo de confianza convencional no le dice nada directamente sobre el parámetro relevante para el experimento particular. Los intervalos de confianza de Neyman son 'globales' en el sentido de que están diseñados para tener propiedades a largo plazo en lugar de propiedades 'locales' relevantes para el experimento en cuestión. (Felizmente, el buen desempeño a largo plazo puede interpretarse en el local, pero eso es un atajo intelectual en lugar de una realidad matemática). Los intervalos de probabilidad, en los casos en que se pueden construir, reflejan directamente la probabilidad de relacionar el experimento en cuestión.

Michael Lew
fuente
1
@suncoolsu No es necesario que el intervalo en cuestión sea un intervalo de probabilidad para que la afirmación sea verdadera. El intervalo solo tiene que abarcar la estimación más probable para que los límites del intervalo sean cada vez menos probables que un punto dentro del intervalo. Cualquier intervalo de confianza ordinario satisfará ese requisito.
Michael Lew el
2
@pmjones Un IC del 95% NO le dice si los valores hacia los márgenes del IC están más cerca de la verdad que los valores en el medio. Los IC hacen declaraciones sobre el muestreo repetido de la población. A largo plazo (es decir, después del muestreo repetido), el 95% de dichos IC, que se construyen para cada muestra, cubrirán el valor verdadero. Por lo tanto, hay dos observaciones clave 1) No se puede decir nada sobre el valor verdadero para un CI dado 2) Los CI no le dicen nada sobre los datos observados, lo cual es una crítica bayesiana habitual.
suncoolsu
1
@MichaelLew El principio de verosimilitud es útil, pero estaba diciendo que (citando a LW) "De hecho, toda inferencia frecuentista viola LP, por lo que si nos adherimos a LP tendríamos que abandonar la inferencia frecuenta". Debido a que CI es una idea frecuente, viola LP (que usted dice que es fundamental).
suncoolsu
1
@suncollsu La pregunta no es si un intervalo de confianza solo y sin ninguna otra consideración estadística dice algo acerca de la probabilidad de valores de parámetros dentro de sí mismo. Se trata de la probabilidad de valores de parámetros dentro del intervalo. La función de probabilidad responde la pregunta, y esa respuesta es correcta incluso si el intervalo de confianza viola el principio de probabilidad. (Lea mi comentario anterior nuevamente. Parece haber ignorado por completo su contenido.)
Michael Lew
2
@ rolando2 Los intervalos de confianza del 95% de Neyman están diseñados para que el método contenga el parámetro verdadero en el 95% de las ocasiones en que se utiliza el método. Estrictamente hablando, la confianza se adhiere al método y no a ningún intervalo individual, por lo que el intervalo individual no le dice nada sobre el estado del mundo en ese experimento en particular. Vea mi respuesta a esta pregunta para obtener más detalles: stats.stackexchange.com/questions/8844/…
Michael Lew
18

Supongamos que alguien me dijera que debería depositar la misma confianza en todos los valores dentro de un IC95 como indicadores potenciales del valor de la población. (Estoy deliberadamente evitando los términos "probable" y "probable"). ¿Qué tiene de especial 95? Nada: para ser coherente, también tendría que depositar la misma confianza en todos los valores dentro de un CI96, un CI97, ... y un CI99.9999999. A medida que la cobertura de CI se acercaba a su límite, prácticamente todos los números reales tendrían que ser incluidos. Lo absurdo de esta conclusión me llevaría a rechazar el reclamo inicial.

rolando2
fuente
44
¡Esta es una respuesta genial! Debería haber pensado en el efecto de acercarse a los extremos de posibles IC. Gracias por escribir esto!
pmgjones
2

Comencemos con la definición de un intervalo de confianza. Si digo que un intervalo de confianza del 95% va de esto a eso, quiero decir que las declaraciones de esa naturaleza serán verdaderas aproximadamente el 95% del tiempo y falsas aproximadamente el 5% del tiempo. Yo no necesariamente significa que estoy 95% seguro acerca de este particular comunicado. Un intervalo de confianza del 90% será más estrecho y un 80% aún más estrecho. Por lo tanto, cuando me pregunto cuál es el valor verdadero, tengo menos credibilidad en los valores a medida que se acercan más y más al borde de cualquier intervalo de confianza en particular.

Tenga en cuenta que todo lo anterior es cualitativo, especialmente "credibilidad". (Evité el término "confianza" o "probabilidad" en esa declaración porque llevan equipaje matemático que puede diferir de nuestro equipaje intuitivo). Los enfoques bayesianos reformularían su pregunta a algo que tiene una respuesta cuantitativa pero no quiero abrir esa lata de gusanos aquí.

El texto clásico de Box, Hunter & Hunter ("Estadísticas para experimentadores", Wiley, 1978) también puede ayudar. Consulte "Conjuntos de intervalos de confianza" en las págs. 113, ff.

Emil Friedman
fuente
Dado que tratamos en parte en conceptos y en parte en semántica, señalaré que en su segunda oración usted ha dicho "... las declaraciones de esa naturaleza serán verdaderas ..." sin especificar qué declaraciones serían verdaderas.
rolando2