He oído hablar de la probabilidad empírica de Owen, pero hasta hace poco no le presté atención hasta que lo encontré en un documento de interés ( Mengersen et al. 2012 ).
En mi esfuerzo por comprenderlo, deduje que la probabilidad de los datos observados se representa como , donde y .
Sin embargo, no he podido dar el salto mental que conecta esta representación con cómo se puede usar para hacer inferencias sobre observaciones. ¿Quizás estoy demasiado arraigado en pensar en una probabilidad de parámetros de un modelo?
De todos modos, he estado buscando en Google Académico algún documento que emplee probabilidades empíricas que me ayuden a internalizar el concepto ... sin éxito. Obviamente, está el libro de Art Owen sobre Probabilidad empírica , pero Google Books deja de lado todos los pedazos deliciosos y todavía estoy en el lento proceso de obtener un préstamo entre bibliotecas.
Mientras tanto, ¿alguien puede señalarme amablemente documentos y documentos que ilustren claramente la premisa de la probabilidad empírica y cómo se emplea? ¡Una descripción ilustrativa de EL mismo también sería bienvenida!
Respuestas:
No puedo pensar en un lugar mejor que el libro de Owen para aprender sobre la probabilidad empírica.
Una forma práctica de pensar acerca de es como la probabilidad de una distribución multinomial en los puntos de datos observados . La probabilidad es, por lo tanto, una función del vector de probabilidad , el espacio de parámetros es realmente el simplex dimensional de los vectores de probabilidad, y el MLE está poniendo peso en cada una de las observaciones (suponiendo que son todos diferentes) La dimensión del espacio de parámetros aumenta con el número de observaciones.x 1 , … , x n ( p 1 , … , p n ) n 1 / nL=L(p1,…,pn) x1,…,xn (p1,…,pn) n 1/n
Un punto central es que la probabilidad empírica proporciona un método para calcular los intervalos de confianza mediante la creación de perfiles sin especificar un modelo paramétrico. Si el parámetro de interés es la media, , entonces para cualquier vector de probabilidad tenemos que la media es y podemos calcular la probabilidad de perfil como Entonces podemos calcular los intervalos de confianza de la forma con . Aquí es la media empírica yμ p=(p1,…,pn)
El libro de Owen cubre esto en detalle y proporciona extensiones a problemas estadísticos más complicados y otros parámetros de interés.
fuente
En econometría, muchos trabajos aplicados comienzan con la suposición de que donde es un vector de datos, es un sistema conocido de ecuaciones , y es un parámetro desconocido, . La función proviene de un modelo económico. El objetivo es estimar .X g q θ ∈ Θ ⊆ R p q ≥ p g θ
El enfoque tradicional, en econometría, para la estimación e inferencia sobre es utilizar el método generalizado de momentos: donde es una matriz de ponderación positiva definida y Los proveedores de probabilidad empírica son un estimador alternativo a GMM. La idea es hacer cumplir la condición de momento como una restricción al maximizar la probabilidad no paramétrica. Primero, arregle a . Luego resuelva sujeto a theta GMM = argmin theta ∈ Thetaθ W ˉ g n(θ):=1
Por supuesto, hay muchas otras razones por las cuales EL ha llamado la atención en econometría, pero espero que este sea un punto de partida útil. Los modelos de igualdad de momentos son muy comunes en la economía empírica.
fuente
En el análisis de supervivencia, la curva de Kaplan-Meier es el estimador no paramétrico más famoso de la función de supervivencia , donde denota la variable aleatoria del tiempo hasta el evento. Básicamente, es una generalización de la función de distribución empírica que permite la censura. Se puede derivar heurísticamente, como se da en la mayoría de los libros de texto prácticos. Pero también puede derivarse formalmente como un estimador de probabilidad máxima (empírica). Aquí hay más detalles .T SS(t)=Pr(T>t) T S^
fuente