Sé muy poco de probabilidad y estadística, y deseo aprender. Veo la palabra "distribución" utilizada en todo el lugar en diferentes contextos.
Por ejemplo, una variable aleatoria discreta tiene una "distribución de probabilidad". Yo sé lo que es esto. Una variable aleatoria continua tiene una función de densidad de probabilidad, entonces para , la integral de a de la función de densidad de probabilidad es la función de distribución acumulativa evaluada en . - ∞ x x
Y aparentemente solo "función de distribución" es sinónimo de "función de distribución acumulativa", al menos cuando se habla de variables aleatorias continuas (pregunta: ¿son siempre sinónimos?).
Luego hay muchas distribuciones famosas. Distribución distribución, etc. Pero, ¿qué es exactamente una distribución ? ¿Es la función de distribución acumulativa de una variable aleatoria ? ¿O la función de densidad de probabilidad de una variable aleatoria ?χ 2 Γ Γ Γ
Pero luego, una distribución de frecuencia de un conjunto de datos finitos parece ser un histograma.
Larga historia corta: en Probabilidad y estadística, ¿cuál es la definición de la palabra "distribución"?
Conozco la definición de distribución en Matemáticas (un elemento del espacio dual de la colección de funciones de prueba equipadas con la topología de límite inductivo), pero no Probabilidad y Estadística.
fuente
Respuestas:
Lo siguiente es para valued random-variables. La extensión a otros espacios es sencilla si está interesado. Yo diría que la siguiente definición un poco más general es más intuitiva que considerar por separado las funciones de densidad, masa y distribución acumulativa.R -
Incluyo algunos términos matemáticos / probabilísticos en el texto para corregirlo. Si uno no está familiarizado con esos términos, la intuición se capta igualmente bien con solo pensar en "conjuntos de Borel" como "cualquier subconjunto de que se me ocurra", y en la variable aleatoria como el resultado numérico de algún experimento con una probabilidad asociadaR
Deje sea un espacio de probabilidad y X ( ω ) un R - valor variable aleatoria en este espacio.( Ω , F, P) X( ω ) R -
La función de conjunto , donde A es un conjunto Borel, se llama la distribución de X .Q ( A ) : = P( ω ∈ Ω : X( ω ) ∈ A ) UN X
En palabras, la distribución le dice (en términos generales), para cualquier subconjunto de , la probabilidad de que X tome un valor en ese conjunto. Se puede demostrar que Q está completamente determinado por la función F ( x ) : = P ( X ≤ x ) y viceversa. Para hacerlo, y omito los detalles aquí, construya una medida en los conjuntos de Borel que asignen la probabilidad F ( x ) a todos los conjuntos ( - ∞ , x ) y argumente que esta medida finita está de acuerdo con Q en unR X Q F( x ) : = P( X≤ x ) F(x) (−∞,x) Q π− sistema que genera el Borelσ− álgebra.
Si sucede queQ(A) puede escribirse como Q(A)=∫Af(x)dx entonces f es una función de densidad para Q y puede ver, aunque esta densidad no está determinada de manera única (considere los cambios en conjuntos de Lebesgue miden cero), tiene sentido hablar también de f como la distribución de . Por lo general, sin embargo, lo llamamos la función de densidad de probabilidad de X .X X
Del mismo modo, si sucede que se puede escribir como Q ( A ) = ∑ i ∈ A ∩ { ... , - 1 , 0 , 1 , ... } f ( i ) , entonces tiene sentido hablar de f como la distribución de X aunque generalmente la llamamos la función de masa de probabilidad.Q(A) Q(A)=∑i∈A∩{…,−1,0,1,…}f(i) f X
Por lo tanto, siempre que lea algo como " sigue una distribución uniforme en [ 0 , 1 ] ", simplemente significa que la función Q ( A ) , que le indica la probabilidad de que X tome valores en ciertos conjuntos, se caracteriza por función de densidad de probabilidad f ( x ) = I [ 0 , 1 ] o la función de distribución acumulativa F ( x ) = ∫ x - ∞ f ( t )X [0,1] Q(A) X f(x)=I[0,1] .F(x)=∫x−∞f(t)dt
Una nota final sobre el caso en el que no se menciona una variable aleatoria, sino solo una distribución. Se puede demostrar que dada una función de distribución (o una función de distribución de masa, densidad o acumulación), existe un espacio de probabilidad con una variable aleatoria que tiene esta distribución. Por lo tanto, esencialmente no hay diferencia en hablar sobre una distribución, o sobre una variable aleatoria que tenga esa distribución. Es solo una cuestión de enfoque.
fuente
Sea un espacio de probabilidad, sea ( X , B ) un espacio medible y sea X : Ω → X una función medible, lo que significa que X - 1 ( B ) = { ω : X ( ω ) ∈ B } ∈ F para cada B ∈ B . La distribución de X es la medida de probabilidad μ(Ω,F,P) (X,B) X:Ω→X X−1(B)={ω:X(ω)∈B}∈F B∈B X sobre ( X , B ) definido por μ X ( B ) = P ( X ∈ B ) . Cuando X = R y B es el campo sigma de Borel, nos referimos a la función X como una "variable" aleatoria.μX (X,B) μX(B)=P(X∈B) X=R B X
fuente
La pregunta y las respuestas hasta ahora parecen haberse centrado en distribuciones teóricas. Las distribuciones empíricas proporcionan una comprensión más intuitiva de las distribuciones.
Una definición ostensiva para una distribución observada es la frecuencia de ocurrencias para cada valor observado de una variable.
En estadística inferencial intentamos ajustar las distribuciones teóricas a las distribuciones observadas, porque nos gustaría trabajar con los supuestos de las distribuciones teóricas. Puede alcanzar una definición similar para distribuciones teóricas reemplazando "observado" por "observable" o para ser más preciso: "esperado".
fuente