¿Cuál es el significado intuitivo detrás de conectar una variable aleatoria en su propio pdf o cdf?

9

Un pdf generalmente se escribe como , donde la minúscula se trata como una realización o resultado de la variable aleatoria que tiene ese pdf. Del mismo modo, un cdf se escribe como , que tiene el significado . Sin embargo, en algunas circunstancias, como la definición de la función de puntuación y esta derivación de que el cdf está distribuido uniformemente , parece que la variable aleatoria se está conectando a su propio pdf / cdf; Al hacerlo, obtenemos una nueva variable aleatoria ox X F X ( x ) P ( X < x ) X Y = f ( X | θ ) Z = F X ( X ) F X ( X ) = P ( X < X )f(x|θ)xXFX(x)P(X<x)X Y=f(X|θ)Z=FX(X). No creo que podamos llamar a esto un pdf o cdf ya que ahora es una variable aleatoria en sí misma, y ​​en este último caso, la "interpretación" parece una tontería.FX(X)=P(X<X)

Además, en el último caso anterior, no estoy seguro de entender la afirmación "el cdf de una variable aleatoria sigue una distribución uniforme". El cdf es una función, no una variable aleatoria, y por lo tanto no tiene una distribución. Más bien, lo que tiene una distribución uniforme es la variable aleatoria transformada usando la función que representa su propio cdf, pero no veo por qué esta transformación es significativa. Lo mismo ocurre con la función de puntuación, donde estamos conectando una variable aleatoria en la función que representa su propia probabilidad logarítmica.

He estado destrozándome el cerebro durante semanas tratando de encontrar un significado intuitivo detrás de estas transformaciones, pero estoy atascado. ¡Cualquier idea sería muy apreciada!

mai
fuente
44
La notación puede confundirte. Por ejemplo, es exactamente tan significativo como lo sería aplicar cualquier función medible aPara una interpretación correcta, deberá tener muy claro qué es una variable aleatoria . Para cualquier variable aleatoria la función para es claramente una variable aleatoria y, por lo tanto, tiene una distribución(Observe los dos significados distintos del símbolo " " en " ".) es uniforme si y solo si tiene una distribución continua. X X : Ohmio R , Y : ω F X ( X ( ω ) ) ω Ohmio F Y . X F X ( X ) F Y XFX(X)XX:ΩR,
Y:ωFX(X(ω))
ωΩFY.XFX(X)FYX
whuber
1
Esto no es realmente un problema de medida teórica: para comprenderlo, puede ignorar con seguridad todas las referencias a la "mensurabilidad". Es posible que se beneficie al estudiar una pequeña teoría de conjuntos al principio de su carrera de posgrado: ahí es donde la mayoría de las personas aprende lo que realmente significa esta terminología y notación matemática básica (y omnipresente), por lo que es mejor no posponer el aprendizaje.
whuber
Tal vez una palabra sobre por qué uno debería hacer algo loco como esto: ¡insertar un RV en su propia densidad! Un ejemplo: digamos que desea estimar la densidad de X, entonces podría medir qué tan bueno es integrando sobre pero esto es "injusto": nunca logrará una buena aproximación cuando no tenga muchos ejemplos de datos (es decir, la densidad real es pequeña). Por lo tanto, una evaluación "justa" sería ponderar el término por la densidad verdadera. Esto es más o menos el efecto de insertar RV en sus propias densidades ...f(x)fX(x)
Fabian Werner

Respuestas:

8

Como usted dice, cualquier función (medible) de una variable aleatoria es en sí misma una variable aleatoria. Es más fácil pensar en y como "cualquier función antigua". Simplemente tienen algunas buenas propiedades. Por ejemplo, si es un RV exponencial estándar, entonces no hay nada particularmente extraño en la variable aleatoria Sucede que . El hecho de que tiene una distribución uniforme (teniendo en cuenta que es un RV continua) puede ser visto para el caso general mediante la derivación de la CDF de .F ( x ) X Y = 1 - e - X Y = F X ( X ) Y X Yf(x)F(x)X

Y=1eX
Y=FX(X)YXY

FY(y)=P(Yy)=P(FX(X)y)=P(XFX1(y))=FX(FX1(y))=y

Que es claramente el CDF de una variable aleatoria . Nota: Esta versión de la prueba supone que es estrictamente creciente y continua, pero no es mucho más difícil mostrar una versión más general.U(0,1)FX(x)

Knrumsey
fuente
1
Su conclusión es incorrecta para el aumento más estricto de : ha asumido que es la identidad, pero ese no es siempre el caso. FXFXFX1
whuber
Si, gracias. La variable aleatoria claramente debe ser continua. ¿Me estoy perdiendo algo ahora? X
knrumsey
1
FX no necesita ser biyectivo. Tomemos, por ejemplo, el caso en el que tiene una distribución uniforme. El cierre de la imagen de debe ser el intervalo completo Esa es esencialmente la definición de una distribución continua. XFX[0,1].
whuber
11

Una transformación de una variable aleatoria por una función medible es otra variable aleatoria cuya distribución está dada por la transformada de probabilidad inversa para todos los conjuntos de tal manera que es medible bajo la distribución de .XT:XYY=T(X)

P(YA)=P(X{x;T(x)A})=defP(XT1(A))
A{x;T(x)A}X

Esta propiedad se aplica al caso especial cuando es el cdf de la variable aleatoria : es una nueva variable aleatoria que toma sus realizaciones en . Como sucede, se distribuye como un Uniforme cuando es continuo. (Si es discontinuo, el rango de ya no es . Lo que siempre sucede es que cuando es un Uniforme , entonces tiene la misma distribución que , dondeFX:X[0,1]XY=FX(X)[0,1]YU([0,1])FXFXY=FX(X)[0,1]UU([0,1])FX(U)XFX denota el inverso generalizado de . Cuál es una forma formal de (a) entender las variables aleatorias como transformaciones medibles de un fundamental ya que es una variable aleatoria con cdf y (b ) generan variables aleatorias de una distribución dada con cdf .)FXωΩX(ω)=FX(ω)FXFX

Para comprender la paradoja de , tome la representación si es la medida dominante y la densidad correspondiente. Entonces es una variable aleatoria ya que el límite superior de La integral es aleatoria. (Esta es la única parte aleatoria de la expresión). La aparente contradicción en se debe a una confusión en las anotaciones. Para definirse adecuadamente, se necesitan dos versiones independientes de la variable aleatoria , yP(XX)

FX(x)=P(Xx)=0xdFX(x)=0xfX(x)dλ(x)
dλfX
FX(X)=0XdFX(x)=0XfX(x)dλ(x)
P(XX)XX1X2, en cuyo caso la variable aleatoria está definida por calculando la probabilidad para la distribución de .FX(X1)
FX(X1)=PX2(X2X1)
X2

La misma observación se aplica a la transformación por la densidad (pdf), , que es una nueva variable aleatoria, excepto que no tiene una distribución fija cuando varía. Sin embargo, es útil para fines estadísticos cuando se considera, por ejemplo, una razón de probabilidad cuyo 2 x logaritmo es aproximadamente una variable aleatoria bajo algunas condicionesfX(X)fXfX(X|θ^(X))/fX(X|θ0)χ2

Y lo mismo vale para la función de puntuación que es una variable aleatoria tal que su expectativa es cero cuando se toma en el valor verdadero del parámetro , es decir,

logfX(X|θ)θ
θ
Eθ0[logfX(X|θ0)θ]=logfX(x|θ0)θfX(x|θ0)dλ(x)=0

[¡Respuesta escrita mientras @whuber y @knrumsey estaban escribiendo sus respectivas respuestas!]

Xi'an
fuente
¿Podría explicar con palabras cuál es el significado / interpretación de la declaración ? Todavía me parece que decir "el cdf de un rv tiene una distribución uniforme" no tiene ningún sentido. FX(X1)=P(X2X1)
mai
El cdf de un rv no es lo mismo que la transformación de un rv por el cdf de este rv, es decir, . X F X ( X )FXXFX(X)
Xi'an
Sí, estoy de acuerdo en que no son lo mismo. En primera instancia no es un rv, mientras que en el segundo caso es un rv ¿Estoy en lo correcto?
mai
Sí, lo que se relaciona con los diferentes significados de enF X ( X )XFX(X)
Xi'an
¿Podría explicar qué quiere decir con "la expectativa es cero cuando se toma en el valor verdadero del parámetro ? Parece que está siendo tratada como una variable aquí. ¿Qué cambia si no está en su" valor verdadero "?θ θθθθ
mai