¿La función de autocorrelación describe completamente un proceso estocástico?

31

¿Es un proceso estocástico completamente descrito por su función de autocorrelación?

Si no, ¿qué propiedades adicionales serían necesarias?

Andreas
fuente

Respuestas:

44

¿Qué se entiende por una descripción completa de un proceso estocástico? Bueno, matemáticamente, un proceso estocástico es una colección de variables aleatorias, una para cada instante instantáneo en un conjunto de índices , donde generalmente es toda la línea real o la línea real positivo, y una descripción completa significa que para cada entero y instantes de tiempo , sabemos que los (conjuntos) distribuciones de las variables aleatorias , ,{X(t):tT}tT T n 1 n t 1 , t 2 , , t nT n X ( t 1 ) X ( t 2 ) , X ( t n ) X ( t ) t X ( t 1 ) X ( t 2 TTn1nt1,t2,,tnTnX(t1)X(t2),X(tn). Esta es una enorme cantidad de información: necesitamos conocer el CDF de para cada instante de tiempo , el CDF conjunto (bidimensional) de y para todas las opciones de instantes de tiempo y , los CDF (tridimensionales) de , y , etc., etc., etc.X(t)tX(t1)X(t2)t1t2X(t1)X(t2)X(t3)

Así que, naturalmente, las personas han buscado descripciones más simples y modelos más restrictivos. Una simplificación ocurre cuando el proceso es invariable a un cambio en el origen del tiempo. Lo que esto significa es que

  • Todas las variables aleatorias en el proceso tienen CDF idénticos: para todos los .FX(t1)(x)=FX(t2)(x)t1,t2
  • Dos variables aleatorias separadas por una cantidad de tiempo específica tienen el mismo CDF conjunto que cualquier otro par de variables aleatorias separadas por la misma cantidad de tiempo. Por ejemplo, las variables aleatorias y están separadas por segundos, al igual que las variables aleatorias y , y por lo tantoX(t1)X(t1+τ)τX(t2)X(t2+τ)FX(t1),X(t1+τ)(x,y)=FX(t2),X(t2+τ)(x,y)
  • Las tres variables aleatorias , , espaciadas y aparte tienen la misma FCD conjunta que , , que también se y ,X(t1)X(t1+τ1)X(t1+τ1+τ2)τ1τ2X(t2)X(t2+τ1)X(t2+τ1+τ2)τ1τ2
  • y así sucesivamente para todos los CDF multidimensionales. Ver, por ejemplo, la respuesta de Peter K. para detalles del caso multidimensional.

Efectivamente, las descripciones probabilísticas del proceso aleatorio no dependen de lo que elijamos llamar el origen en el eje de tiempo: desplazando todos los instantes de tiempo en una cantidad fija a da la misma descripción probabilística de las variables aleatorias. Esta propiedad se llama estacionariedad de sentido estricto y un proceso aleatorio que disfruta de esta propiedad se llama un proceso aleatorio estrictamente estacionario o, más simplemente, un proceso aleatorio estacionario. t1,t2,,tnτt1+τ,t2+τ,,tn+τ

Tenga en cuenta que la estacionariedad estricta por sí sola no requiere ninguna forma particular de CDF. Por ejemplo, no dice que todas las variables son gaussianas.

El adjetivo sugiere estrictamente que es posible definir una forma más flexible de estacionariedad. Si la unión de orden CDF de es la misma que la unión de orden CDF de para todas las opciones de y , entonces se dice que el proceso aleatorio es estacionario para ordenar y se conoce como un proceso aleatorio estacionario de orden . Tenga en cuenta que un proceso aleatorio estacionario de orden también es estacionario para ordenar para cada positivoNthX(t1),X(t2),,X(tN)NthX(t1+τ),X(t2+τ),,X(tN+τ)t1,t2,,tNτNNthNthnn<N . (Esto se debe a que la -orden CDF conjunta es el límite de la -orden CDF como de los argumentos enfoque : una generalización de ). Un proceso aleatorio estrictamente estacionaria entonces es un proceso aleatorio que es estacionario para todos los pedidos .nthNthNnFX(x)=limyFX,Y(x,y)N

Si un proceso aleatorio es estacionario en (al menos) orden , entonces todas las tienen la misma distribución y, suponiendo que exista la media, es la misma para todos . Del mismo modo, es el mismo para todas las , y se conoce como la potencia del proceso. Todos los procesos físicos tienen un poder finito , por lo que es común suponer que en ese caso, y especialmente en la literatura de ingeniería más antigua, el proceso se llama proceso de segundo orden . La elección del nombre es lamentable porque invita a la confusión con el segundo orden. 1X(t)E[X(t)]=μtE[(X(t))2]tE[(X(t))2]<estacionariedad (cf. esta respuesta mía en stats.SE ), y aquí llamaremos a un proceso para el cual es finito para todo (ya sea es una constante) como un proceso de potencia finita y evita esta confusión. Pero tenga en cuenta de nuevo queE[(X(t))2]tE[(X(t))2]

Un proceso estacionario de primer orden no necesita ser un proceso de potencia finita.

Considere un proceso aleatorio que es estacionario al orden . Ahora, dado que la distribución conjunta de y es la misma que la función de distribución conjunta de y , y el valor depende solo de . Estas expectativas son finitas para un proceso de potencia finita y su valor se llama función de autocorrelación del proceso: es una función de , el tiempo separación de las variables aleatorias y , y no depende de2X(t1)X(t1+τ)X(t2)X(t2+τ)E[X(t1)X(t1+τ)]=E[X(t2)X(t2+τ)]τRX(τ)=E[X(t)X(t+τ)]τX(t)X(t+τ)ten absoluto. Tenga en cuenta también que por lo que la función de autocorrelación es una función par de su argumento.

E[X(t)X(t+τ)]=E[X(t+τ)X(t)]=E[X(t+τ)X(t+ττ)]=RX(τ),

Un proceso aleatorio estacionario de segundo orden de potencia finita tiene las propiedades que

  1. Su media es una constanteE[X(t)]
  2. Su función de autocorrelación es una función de , la separación de tiempo de las variables aleatorias y , y no depende de en absoluto.RX(τ)=E[X(t)X(t+τ)]τX(t)X(t+τ)t

El supuesto de estacionariedad simplifica en cierta medida la descripción de un proceso aleatorio, pero, para ingenieros y estadísticos interesados ​​en construir modelos a partir de datos experimentales, estimar todos esos CDF es una tarea no trivial, particularmente cuando solo hay un segmento de una ruta de muestra (o realización) en el que se pueden realizar mediciones. Dos medidas que son relativamente fáciles de hacer (porque el ingeniero ya tiene los instrumentos necesarios en su banco de trabajo (o programas en MATLAB / Python / Octave / C ++ en su biblioteca de software) son el valor de CC de y la función de autocorrelaciónx(t) 1T0Tx(t)dtx(t)Rx(τ)=1T0Tx(t)x(t+τ)dt(o su transformada de Fourier, el espectro de potencia de ). Tomar estas mediciones como estimaciones de la media y la función de autocorrelación de un proceso de potencia finita conduce a un modelo muy útil que discutiremos a continuación.x(t)


Un proceso aleatorio de potencia finita se llama proceso estacionario de sentido amplio (WSS) (también proceso aleatorio débilmente estacionario que afortunadamente también tiene el mismo inicialismo WSS) si tiene una media constante y su función de autocorrelación depende solo de la diferencia de tiempo (o ).RX(t1,t2)=E[X(t1)X(t2)]t1t2t2t1

Tenga en cuenta que la definición no dice nada acerca de los CDF de las variables aleatorias que comprenden el proceso; Es completamente una restricción en los momentos de primer orden y de segundo orden de las variables aleatorias. Por supuesto, un proceso aleatorio estacionario de segundo orden de potencia finita (o -orden (para ) o estrictamente estacionario) es un proceso de WSS, pero lo contrario no tiene por qué ser cierto.NthN>2

Un proceso WSS no necesita ser estacionario en ningún orden.

Considere, por ejemplo, el proceso aleatorio donde adquiere cuatro valores igualmente probables y . (No se asuste: las cuatro posibles rutas de muestra de este proceso aleatorio son solo las cuatro formas de onda de una señal QPSK). Tenga en cuenta que cada es una variable aleatoria discreta que, en general, adopta cuatro valores igualmente probables y , es fácil ver que en general y{X(t):X(t)=cos(t+Θ),<t<}Θ0,π/2,π3π/2X(t)cos(t),cos(t+π/2)=sin(t),cos(t+π)=cos(t)cos(t+3π/2)=sin(t)X(t)X(s)tienen diferentes distribuciones, por lo que el proceso ni siquiera es estacionario de primer orden. Por otro lado, por cada mientras En resumen, el proceso tiene una media cero y su función de autocorrelación depende solo de la diferencia de tiempo , por lo que el proceso es estacionario en sentido amplio. Pero no es estacionaria de primer orden y, por lo tanto, tampoco puede ser estacionaria para órdenes superiores.

E[X(t)]=14cos(t)+14(sin(t))+14(cos(t))+14sin(t)=0
t
E[X(t)X(s)]=14[cos(t)cos(s)+(cos(t))(cos(s))+sin(t)sin(s)+(sin(t))(sin(s))]=12[cos(t)cos(s)+sin(t)sin(s)]=12cos(ts).
ts

Incluso para procesos WSS que son procesos aleatorios estacionarios de segundo orden (o estrictamente estacionarios), poco se puede decir sobre las formas específicas de las distribuciones de las variables aleatorias. En breve,

Un proceso WSS no es necesariamente estacionario (en ningún orden), y la función de media y autocorrelación de un proceso WSS no es suficiente para dar una descripción estadística completa del proceso.

Por último, supongamos que un proceso estocástico se supone ser una gaussiana proceso ( "demostrando" esto con un grado razonable de confianza no es una tarea trivial). Esto significa que para cada , es una variable aleatoria gaussiana y para todos los enteros positivos y opciones de instantes de tiempo , , , las variables aleatorias , , son variables aleatorias gaussianas conjuntas . Ahora, una función de densidad gaussiana conjunta es completamentetX(t)n2nt1t2,tnNX(t1)X(t2),X(tn)determinado por las medias, varianzas y covarianzas de las variables aleatorias, y en este caso, conociendo la función media (no necesita ser una constante como se requiere para el sentido amplio -estacionaridad) y la función de autocorrelación para todos los (no necesita depender solo de como se requiere para la estacionariedad de sentido amplio) es suficiente para determinar las estadísticas del proceso por completo.μX(t)=E[X(t)]RX(t1,t2)=E[X(t1)X(t2)]t1,t2t1t2

Si el proceso gaussiano es un proceso WSS, entonces también es un proceso gaussiano estrictamente estacionario . Afortunadamente para los ingenieros y procesadores de señales, muchos procesos de ruido físico pueden modelarse bien como procesos WSS Gaussianos (y, por lo tanto, procesos estrictamente estacionarios), de modo que la observación experimental de la función de autocorrelación proporciona fácilmente todas las distribuciones conjuntas. Además, dado que los procesos gaussianos retienen su carácter gaussiano a medida que pasan a través de sistemas lineales, y la función de autocorrelación de salida está relacionada con la función de autocorrelación de entrada como

Ry=hh~RX
para que las estadísticas de salida también puedan determinarse fácilmente, el proceso WSS en general y los procesos WSS Gaussianos en particular son de gran importancia en aplicaciones de ingeniería.

Dilip Sarwate
fuente
¿Podría, por favor, comentar sobre "White Noise" en ese sentido? Por definición, la Autocorrelación en es la varianza de las variables aleatorias. ¿Significa que AWGN (ruido blanco gaussiano aditivo) tiene una variación infinita? Lo pregunto porque generalmente la gente escribe , ¿está mal? ¿Debería escribirse ? Gracias. τ=0n(t) N(0,N0/2)n(t) N(0,δ(0)N0/2)
Royi
1
@Drazick Haga una pregunta por separado.
Dilip Sarwate
1
Este es un mini curso fantástico en la definición de procesos estacionarios. Nunca había visto algo así, presentado de manera tan metódica y clara. Wiki de la comunidad?
abalter
@Dilip Sarwate Disculpe por mi ignorancia. En el ejemplo ¿Por qué E [X (t)] = 0 para todo t? ¿Asumiste ergodicidad? ¿Cómo dedujo la función de densidad de probabilidad de X (t) de la función de densidad de probabilidad de theta para calcular el valor esperado? E [X (t) X (s)] = E [cos (t + theta) * cos (s + theta)] ¿verdad? ¿Qué pasos tomaste para simplificar esta expresión y llegar a lo que escribiste? Gracias
VMMF
1
@VMMF NO se utiliza ergodicidad. es una variable aleatoria discreta porque es una variable aleatoria discreta y toma valores y con igual probabilidad . Ergo, . adquiere valores , , y con igual probabilidad . Por lo tanto,X(t)=cos(t+Θ)Θ±cos(t)±sin(t)14E[X(t)]=0X(t)X(s)cos(t)cos(s)(cos(t))(cos(s))=cos(t)cos(s)sin(t)sin(s)(sin(t))(sin(s))=sin(t)sin(s)14E[X(t)(X(s)]=12(cos(t)cos(s)+sin(t)sin(s))=12cos(ts)
.Por lo