He encontrado información discordante sobre la pregunta: " Si uno construye un intervalo de confianza (IC) del 95% de una diferencia en las medias o una diferencia en las proporciones, ¿todos los valores dentro del IC son igualmente probables? O, ¿es la estimación puntual la más probable? , con valores cerca de las "colas" del CI menos probable que aquellos en el medio del CI?
Por ejemplo, si un informe de ensayo clínico aleatorizado indica que el riesgo relativo de mortalidad con un tratamiento particular es 1.06 (IC del 95%: 0.96 a 1.18), ¿es la probabilidad de que 0.96 sea el valor correcto igual a 1.06?
Encontré muchas referencias a este concepto en línea, pero los siguientes dos ejemplos reflejan la incertidumbre en él:
El módulo de Lisa Sullivan sobre Intervalos de confianza establece:
Los intervalos de confianza para la diferencia de medias proporcionan un rango de valores probables para ( ). Es importante tener en cuenta que todos los valores en el intervalo de confianza son estimaciones igualmente probables del valor verdadero de ( ).
Esta publicación de blog, titulada Dentro del margen de error , establece:
Lo que tengo en mente es un malentendido sobre el "margen de error" que trata todos los puntos dentro del intervalo de confianza como igualmente probables, como si el teorema del límite central implicara una distribución uniforme limitada en lugar de una distribución t . [...]
Lo que se habla sobre el "margen de error" es que las posibilidades que están cerca de la estimación puntual son mucho más probables que las posibilidades que están al borde del margen ".
Esto parece contradictorio, ¿cuál es el correcto?
fuente
Respuestas:
Una pregunta que debe responderse es ¿qué significa "probable" en este contexto?
Si significa probabilidad (como a veces se usa como sinónimo de) y estamos usando definiciones estrictas de frecuentista, entonces el verdadero valor del parámetro es un valor único que no cambia, por lo que la probabilidad (probabilidad) de ese punto es 100% y todo otros valores son 0%. Entonces, casi todos son igualmente probables al 0%, pero si el intervalo contiene el valor verdadero, entonces es diferente de los demás.
Si utilizamos un enfoque bayesiano, entonces el IC (Intervalo creíble) proviene de la distribución posterior y puede comparar la probabilidad en los diferentes puntos dentro del intervalo. A menos que el posterior sea perfectamente uniforme dentro del intervalo (teóricamente posible, supongo, pero eso sería una circunstancia extraña), entonces los valores tienen diferentes probabilidades.
Si usamos es probable que sea similar a la confianza, piénselo de esta manera: calcule un intervalo de confianza del 95%, un intervalo de confianza del 90% y un intervalo de confianza del 85%. Estaríamos 5% seguros de que el valor verdadero se encuentra en la región dentro del intervalo del 95% pero fuera del intervalo del 90%, podríamos decir que el valor verdadero es 5% probable de caer en esa región. Lo mismo es cierto para la región que está dentro del intervalo del 90% pero fuera del intervalo del 85%. Entonces, si cada valor es igualmente probable, entonces el tamaño de las 2 regiones anteriores necesitaría ser exactamente el mismo y lo mismo sería válido para la región dentro de un intervalo de confianza del 10% pero fuera de un intervalo de confianza del 5%. Ninguna de las distribuciones estándar con las que se construyen los intervalos tiene esta propiedad (excepto casos especiales con 1 extracción de un uniforme).
Además, puede demostrarlo a usted mismo simulando una gran cantidad de conjuntos de datos de poblaciones conocidas, calculando el intervalo de confianza de interés y luego comparando con qué frecuencia el parámetro verdadero está más cerca de la estimación puntual que de cada uno de los puntos finales.
fuente
¡Esta es una gran pregunta! Existe un concepto matemático llamado probabilidad que lo ayudará a comprender los problemas. Fisher inventó la probabilidad, pero consideró que era algo menos deseable que la probabilidad, pero la probabilidad resulta ser más `` primitiva '' que la probabilidad e Ian Hacking (1965) consideró que era axiomático porque no es demostrable. La probabilidad apuntala la probabilidad en lugar de lo contrario.
Hacking, 1965. Lógica de la inferencia estadística .
La probabilidad no recibe la atención que debería tener en los libros de texto estándar de estadística, sin ninguna buena razón. Difiere de la probabilidad de tener casi exactamente las propiedades que uno esperaría, y las funciones e intervalos de probabilidad son muy útiles para la inferencia. Tal vez algunos estadísticos no le gusten a la probabilidad porque a veces no existe una forma "adecuada" de derivar las funciones de probabilidad relevantes. Sin embargo, en muchos casos las funciones de probabilidad son obvias y bien definidas. Un estudio de las probabilidades de inferencia probablemente debería comenzar con el libro pequeño y fácil de entender de Richard Royall llamado Evidencia estadística: un paradigma de probabilidad .
La respuesta a su pregunta es que no, los puntos dentro de cualquier intervalo no tienen la misma probabilidad. Aquellos en los bordes de un intervalo de confianza generalmente tienen menores probabilidades que otros hacia el centro del intervalo. Por supuesto, el intervalo de confianza convencional no le dice nada directamente sobre el parámetro relevante para el experimento particular. Los intervalos de confianza de Neyman son 'globales' en el sentido de que están diseñados para tener propiedades a largo plazo en lugar de propiedades 'locales' relevantes para el experimento en cuestión. (Felizmente, el buen desempeño a largo plazo puede interpretarse en el local, pero eso es un atajo intelectual en lugar de una realidad matemática). Los intervalos de probabilidad, en los casos en que se pueden construir, reflejan directamente la probabilidad de relacionar el experimento en cuestión.
fuente
Supongamos que alguien me dijera que debería depositar la misma confianza en todos los valores dentro de un IC95 como indicadores potenciales del valor de la población. (Estoy deliberadamente evitando los términos "probable" y "probable"). ¿Qué tiene de especial 95? Nada: para ser coherente, también tendría que depositar la misma confianza en todos los valores dentro de un CI96, un CI97, ... y un CI99.9999999. A medida que la cobertura de CI se acercaba a su límite, prácticamente todos los números reales tendrían que ser incluidos. Lo absurdo de esta conclusión me llevaría a rechazar el reclamo inicial.
fuente
Comencemos con la definición de un intervalo de confianza. Si digo que un intervalo de confianza del 95% va de esto a eso, quiero decir que las declaraciones de esa naturaleza serán verdaderas aproximadamente el 95% del tiempo y falsas aproximadamente el 5% del tiempo. Yo no necesariamente significa que estoy 95% seguro acerca de este particular comunicado. Un intervalo de confianza del 90% será más estrecho y un 80% aún más estrecho. Por lo tanto, cuando me pregunto cuál es el valor verdadero, tengo menos credibilidad en los valores a medida que se acercan más y más al borde de cualquier intervalo de confianza en particular.
Tenga en cuenta que todo lo anterior es cualitativo, especialmente "credibilidad". (Evité el término "confianza" o "probabilidad" en esa declaración porque llevan equipaje matemático que puede diferir de nuestro equipaje intuitivo). Los enfoques bayesianos reformularían su pregunta a algo que tiene una respuesta cuantitativa pero no quiero abrir esa lata de gusanos aquí.
El texto clásico de Box, Hunter & Hunter ("Estadísticas para experimentadores", Wiley, 1978) también puede ayudar. Consulte "Conjuntos de intervalos de confianza" en las págs. 113, ff.
fuente