Si entiendo correctamente, un intervalo de confianza de un parámetro es un intervalo construido por un método que produce intervalos que contienen el valor verdadero para una proporción específica de muestras. Entonces, la "confianza" se trata del método en lugar del intervalo que calculo de una muestra particular.
Como usuario de estadísticas, siempre me he sentido engañado por esto, ya que el espacio de todas las muestras es hipotético. Todo lo que tengo es una muestra y quiero saber qué me dice esa muestra sobre un parámetro.
¿Es este juicio incorrecto? ¿Hay formas de ver los intervalos de confianza, al menos en algunas circunstancias, que serían significativos para los usuarios de estadísticas?
[Esta pregunta surge de dudas después de ignorar los intervalos de confianza en una respuesta matemática https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 # 7572 ]
fuente
Un enfoque alternativo relevante para su 2da P, "¿Hay formas de ver los intervalos de confianza, al menos en algunas circunstancias, que serían significativos para los usuarios de estadísticas?":
Debe echar un vistazo a la inferencia bayesiana y los intervalos creíbles resultantes . Un intervalo creíble del 95% se puede interpretar como un intervalo que cree que tiene una probabilidad del 95% de incluir el valor del parámetro verdadero. El precio que paga es que necesita poner una distribución de probabilidad previa en los valores que cree que es probable que tome el parámetro verdadero antes de recopilar los datos. Y su anterior puede diferir del anterior de otra persona, por lo que sus intervalos creíbles resultantes también pueden diferir incluso cuando utiliza los mismos datos.
¡Este es solo mi intento rápido y crudo de resumir! Un buen libro de texto reciente con un enfoque práctico es:
Andrew Gelman, John B. Carlin, Hal S. Stern y Donald B. Rubin. "Análisis de datos bayesianos" (2ª edición). Chapman & Hall / CRC, 2003. ISBN 978-1584883883
fuente
Creo que la premisa de esta pregunta es errónea porque niega la distinción entre lo incierto y lo conocido .
Describir un lanzamiento de moneda proporciona una buena analogía. Antes de lanzar la moneda, el resultado es incierto; luego, ya no es "hipotético". Confundir este hecho consumado con la situación real que deseamos comprender (el comportamiento de la moneda o las decisiones que se tomarán como resultado de su resultado) esencialmente niega un papel de probabilidad en la comprensión del mundo.
Este contraste se presenta con un fuerte relieve dentro de un campo experimental o regulatorio. En tales casos, el científico o el regulador saben que se enfrentarán a situaciones cuyos resultados, en cualquier momento de antemano, son desconocidos, sin embargo, deben tomar determinaciones importantes, como la forma de diseñar el experimento o establecer los criterios para determinar el cumplimiento de las regulaciones (para pruebas de drogas, seguridad en el lugar de trabajo, estándares ambientales, etc.). Estas personas y las instituciones para las que trabajan necesitan métodos y conocimiento de las características probabilísticas de esos métodos para desarrollar estrategias óptimas y defendibles, como buenos diseños experimentales y procedimientos de decisión justos que tengan el menor error posible.
Los intervalos de confianza, a pesar de su pobre justificación clásica, se ajustan a este marco teórico de decisión. Cuando un método para construir un intervalo aleatorio tiene una combinación de buenas propiedades, como asegurar una cobertura mínima esperada del intervalo y minimizar la duración esperada del intervalo, ambas propiedades a priori , no a posteriori , entonces Con una larga carrera en el uso de ese método, podemos minimizar los costos asociados con las acciones indicadas por ese método.
fuente
Tiene razón al decir que los intervalos de confianza del 95% son cosas que resultan del uso de un método que funciona en el 95% de los casos, en lugar de cualquier intervalo individual que tenga una probabilidad del 95% de contener el valor esperado.
"La base lógica y la interpretación de los límites de confianza son, incluso ahora, un tema de controversia". {David Colquhoun, 1971, Conferencias sobre bioestadística}
Esa cita está tomada de un libro de texto de estadísticas publicado en 1971, pero afirmaría que todavía es cierto en 2010. La controversia es probablemente más extrema en el caso de intervalos de confianza para proporciones binomiales. Existen muchos métodos competitivos para calcular esos intervalos de confianza, pero todos son inexactos en uno o más sentidos e incluso el método de peor desempeño tiene defensores entre los autores de libros de texto. Incluso los llamados intervalos "exactos" no producen las propiedades esperadas de los intervalos de confianza.
En un artículo escrito para cirujanos (¡ampliamente conocido por su interés en las estadísticas!), John Ludbrook y yo abogamos por el uso rutinario de intervalos de confianza calculados utilizando un Bayesiano previo uniforme porque dichos intervalos tienen propiedades frecuentas tan buenas como cualquier otro método (en promedio exactamente el 95% de cobertura sobre todas las proporciones verdaderas) pero, lo que es más importante, una cobertura mucho mejor sobre todas las proporciones observadas (exactamente el 95% de cobertura). El documento, debido a su público objetivo, no es terriblemente detallado y, por lo tanto, puede no convencer a todos los estadísticos, pero estoy trabajando en un documento de seguimiento con el conjunto completo de resultados y justificaciones.
Este es un caso en el que el enfoque bayesiano tiene propiedades frecuentistas tan buenas como el enfoque frecuentista, algo que ocurre con bastante frecuencia. La suposición de un previo uniforme no es problemática porque una distribución uniforme de las proporciones de la población está integrada en cada cálculo de cobertura frecuentista que he encontrado.
Usted pregunta: "¿Hay formas de ver los intervalos de confianza, al menos en algunas circunstancias, que serían significativos para los usuarios de estadísticas?" Mi respuesta, entonces, es que para intervalos de confianza binomiales se pueden obtener intervalos que contienen la proporción de la población exactamente el 95% del tiempo para todas las proporciones observadas. Eso es un si. Sin embargo, el uso convencional de intervalos de confianza espera cobertura para todas las proporciones de la población y para eso la respuesta es "¡No!"
La longitud de las respuestas a su pregunta y las diversas respuestas a ellas sugieren que los intervalos de confianza son ampliamente incomprendidos. Si cambiamos nuestro objetivo de la cobertura para todos los valores de parámetros verdaderos a la cobertura del valor de parámetros verdaderos para todos los valores de muestra, podría ser más fácil porque los intervalos se configurarán para ser directamente relevantes para los valores observados en lugar de para el desempeño de método per se.
fuente
Esta es una gran discusión. Siento que los intervalos bayesianos creíbles y los intervalos de probabilidad de apoyo son el camino a seguir, así como las probabilidades bayesianas posteriores de eventos de interés (por ejemplo, un medicamento es eficaz). Pero suplantar los valores de P con intervalos de confianza es una ganancia importante. Prácticamente todos los números de las mejores revistas médicas como NEJM y JAMA tienen un documento con el problema "la ausencia de evidencia no es evidencia de ausencia" en sus resúmenes. El uso de intervalos de confianza evitará en gran medida tales errores. Un pequeño texto excelente es http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751
fuente
Para responder a su pregunta directamente: suponga que está contemplando el uso de una máquina para llenar una caja de cereal con una cierta cantidad de cereal. Obviamente, no desea sobrellenar / llenar en exceso la caja. Desea evaluar la fiabilidad de la máquina. Realiza una serie de pruebas como esta: (a) Use la máquina para llenar la caja y (b) Mida la cantidad de cereal que se llena en la caja.
Con los datos recopilados, construye un intervalo de confianza para la cantidad de cereal que la máquina probablemente llene en la casilla. Este intervalo de confianza nos dice que el intervalo que obtuvimos tiene una probabilidad del 95% de que contendrá la cantidad real de cereal que la máquina pondrá en la caja. Como usted dice, la interpretación del intervalo de confianza se basa en muestras hipotéticas e invisibles generadas por el método considerado. Pero, esto es precisamente lo que queremos en nuestro contexto. En el contexto anterior, a utilizar la máquina varias veces para llenar la caja y por lo tanto que se preocupan por hipotéticos realizaciones, invisibles de la cantidad de cereales los rellenos de la máquina en la caja.
Para abstraerse del contexto anterior: un intervalo de confianza nos da la garantía de que si usáramos el método bajo investigación (en el método de ejemplo anterior = máquina) repetidamente, hay un 95% de probabilidad de que el intervalo de confianza tenga el parámetro verdadero .
fuente