¿Diferencias entre un modelo estadístico y un modelo de probabilidad?

29

La probabilidad aplicada es una rama importante en la probabilidad, incluida la probabilidad computacional. Dado que las estadísticas utilizan la teoría de la probabilidad para construir modelos para tratar con datos, según tengo entendido, me pregunto cuál es la diferencia esencial entre el modelo estadístico y el modelo de probabilidad. ¿El modelo de probabilidad no necesita datos reales? Gracias.

Honglang Wang
fuente

Respuestas:

29

Un Modelo de probabilidad consiste en el triplete , donde Ω es el espacio de la muestra, F es una σ -algebra (eventos) y P es una medida de probabilidad en F .(Ω,F,PAGS)ΩFσPAGSF

Explicación intuitiva . Un modelo de probabilidad puede ser interpretado como un conocido variable aleatoria . Por ejemplo, sea X una variable aleatoria normalmente distribuida con media 0 y varianza 1 . En este caso, la medida de probabilidad P está asociada con la Función de distribución acumulativa (CDF) F a través deXX0 01PAGSF

F(X)=PAGS(XX)=PAGS(ωΩ:X(ω)X)=-X12πexp(-t22)ret.

Generalizaciones . La definición del modelo de probabilidad depende de la definición matemática de probabilidad, ver, por ejemplo, probabilidad libre y probabilidad cuántica .

Un modelo estadístico es un conjunto de modelos de probabilidad, es decir, un conjunto de medidas / distribuciones de probabilidad en el espacio muestral Ω .SΩ

Este conjunto de distribuciones de probabilidad generalmente se selecciona para modelar un determinado fenómeno del cual tenemos datos.

Explicación intuitiva . En un modelo estadístico, los parámetros y la distribución que describen un determinado fenómeno son desconocidos. Un ejemplo de esto es la familia de distribuciones normales con media y varianza σ 2R + , es decir, ambos parámetros son desconocidos y normalmente desea utilizar el conjunto de datos para estimar los parámetros (es decir, seleccionar un elemento de S ) Este conjunto de distribuciones se puede elegir en cualquier Ω y F , pero, si no me equivoco, en un ejemplo real solo las definidas en el mismo par ( Ω , F )μRσ2R+SΩF(Ω,F) son razonables de considerar.

Generalizaciones . Este documento proporciona una definición muy formal del modelo estadístico, pero el autor menciona que "el modelo bayesiano requiere un componente adicional en forma de distribución previa ... aunque las formulaciones bayesianas no son el foco principal de este documento". Por lo tanto, la definición de modelo estadístico depende del tipo de modelo que usemos: paramétrico o no paramétrico. También en la configuración paramétrica, la definición depende de cómo se tratan los parámetros (por ejemplo, clásico versus bayesiano).

La diferencia es: en un modelo de probabilidad usted conoce exactamente la medida de probabilidad, por ejemplo, una , donde μ 0 , σ 2 0 son parámetros conocidos, mientras que en un modelo estadístico considera conjuntos de distribuciones , por ejemplo Normal ( μ , σ 2 ) , donde μ , σ 2 son parámetros desconocidos.Normal(μ0 0,σ0 02)μ0 0,σ0 02Normal(μ,σ2)μ,σ2

Ninguno de ellos requiere un conjunto de datos, pero diría que generalmente se selecciona un modelo estadístico para modelar uno.

Xi'an
fuente
2
@HonglangWang Eso es correcto hasta cierto punto. La principal diferencia es que un modelo de probabilidad es solo una distribución (conocida), mientras que un modelo estadístico es un conjunto de modelos de probabilidad; los datos se usan para seleccionar un modelo de este conjunto o un subconjunto más pequeño de modelos que mejor (en cierto sentido) describen el fenómeno (a la luz de los datos).
2
(+1) Esta es una buena respuesta, aunque tengo un par de comentarios. Primero, creo que esto puede estar vendiendo al probabilista un poco corto. No es raro considerar un conjunto de espacios de probabilidad en un modelo probabilístico, y de hecho, las posibles medidas pueden incluso ser aleatorias (construidas en un espacio adecuadamente más grande). En segundo lugar, un Bayesiano (en particular) podría encontrar esta respuesta un poco desconcertante, ya que un modelo estadístico Bayesiano a menudo puede verse como un modelo de probabilidad único en un espacio de producto adecuado . Ω×Θ
cardenal
1
@gung Esta es una pregunta más relacionada con la teoría de la medida. Con respecto a su primera pregunta, se define de hecho a través del CDF. Ahora, la interpretación de Ω es la difícil porque, formalmente, P ( X x ) significa P ( ω Ω : X ( ω ) x ) , entonces Ω no son valores observables. F es un σ - álgebra que es la imagen previa del Borel σ - álgebra bajo XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσXDe nuevo, esto no es observable. No estoy seguro de cómo explicar esto en un nivel intuitivo.
2
@gung depende de la aplicación ; No está determinado por la teoría. Por ejemplo, Ω podría ser un conjunto de movimientos brownianos que describen el precio de un derivado financiero y X podría ser el valor alcanzado en un tiempo fijo t . En otra aplicación, Ω podría ser un conjunto de personas y X podría ser la longitud de sus antebrazos. En general, Ω es un modelo matemático de los objetos físicos de estudio y X es una propiedad numérica de esos objetos. F es el conjunto de posibles eventos: aquellas situaciones a las que queremos atribuir probabilidades.ΩΩXtΩXΩXF
whuber
2
@gung es un álgebra sigma : es una colección de subconjuntos (los "eventos"). En la aplicación financiera, es un conjunto de historiales de precios; en la aplicación de medidas del antebrazo, los eventos serían conjuntos de personas. Podemos hablar más sobre esto si lo desea en una sala de chat. F
whuber