Supongamos que un grupo de personas evalúa cuánto les gustó una película en una escala discreta del 1 al 10, y desea un intervalo [ l , u ] tal que con (al menos) 95% de confianza, (al menos) 90 El% de todas las personas que ven la película lo calificarán no menos que l ni más alto que u . [ l , u ] es entonces un intervalo de tolerancia (de dos lados) con 95% de confianza y 90% de cobertura. (Para ser claros, el 95% de confianza implica que si repite este procedimiento muchas veces, el 95% de los intervalos producidos obtendrían al menos el 90% de cobertura de la población). Por supuesto, generalmente queremos que [ l , u ] sea tan estrecho como posible sin dejar de cumplir nuestros requisitos.
He visto varios métodos no paramétricos para construir intervalos de tolerancia para variables aleatorias continuas. También he visto métodos para construir intervalos de tolerancia para las variables binomiales y de Poisson. (El paquete R tolerance
implementa varios de estos métodos; Young, 2010.) ¿Pero qué pasa con las variables discretas cuando la distribución es desconocida? Este es generalmente el caso para escalas de calificación como la de mi ejemplo, y asumir que una distribución binomial no parece segura porque los datos reales de la escala de calificación a menudo exhiben rarezas como la multimodalidad.
¿Tendría sentido recurrir a los métodos no paramétricos para variables continuas? Alternativamente, ¿qué pasa con un método de Monte Carlo como generar 1,000 réplicas de arranque de la muestra y encontrar un intervalo que capture al menos el 90% de la muestra en al menos 950 de las réplicas?
Young, DS (2010). tolerancia: un paquete R para estimar los intervalos de tolerancia. Revista de software estadístico, 36 (5), 1-39. Recuperado de http://www.jstatsoft.org/v36/i05
fuente
Respuestas:
La variable de interés se distribuye multinomialmente con probabilidades de clase (celda): . Además, las clases están dotadas de un orden natural.p1,p2,...,p10
Primer intento: el "intervalo predictivo" más pequeño que contiene90%
Una medida no paramétrica de la incertidumbre (p. Ej., Varianza, confianza) en las estimaciones cuantitativas podría de hecho obtenerse mediante métodos de arranque estándar .l,u
Segundo enfoque: "búsqueda directa de arranque"
A continuación proporciono un código Matlab ejecutable que aborda la pregunta directamente desde una perspectiva de arranque (el código no está vectorizado de manera óptima).
Comprueba que esto tiene sentido.
Ejecute la simulación de arranque.
El filtro de cada rutina de carga replica los intervalos, , que contienen al menos masa de probabilidad y calcula una estimación de confianza (frecuente) de esos intervalos.[l,u] 90%
Seleccione aquellos que satisfagan el deseo de confianza.
Convenciéndose de que el método de arranque anterior es válido
Las muestras de Bootstrap están destinadas a ser sustitutos de algo que nos gustaría tener, pero no lo hacemos, es decir: nuevos e independientes extractos de la verdadera población subyacente (en resumen: nuevos datos).
En el ejemplo que di, conocemos el proceso de generación de datos (DGP), por lo tanto, podríamos "engañar" y reemplazar las líneas de código pertenecientes a las muestras de arranque por nuevos sorteos independientes del DGP real.
Entonces podemos validar el enfoque bootstrap comparándolo con el ideal. Debajo están los resultados.
La matriz de confianza de datos nuevos e independientes extrae:
Los correspondientes límites inferior y superior del confianza:95%
Encontramos que las matrices de confianza están muy de acuerdo y que los límites son idénticos ... Validando así el enfoque de arranque.
fuente