Dejar

9

Ahora mismo estoy aprendiendo sobre teoría de modelos lineales, y una cosa que me sorprende es que, aunque E[Y] se define para un vector aleatorio Y=[y1y2yn], no se mencionan más momentos además de la matriz de covarianza.

La búsqueda en Google no ha aparecido mucho. Sonkth (raw) momentos de Y considerado, o hay una idea diferente que no conozco?

Estoy aprendiendo del texto Respuestas del plano a preguntas complejas (el TOC comienza en la página 17 del archivo vinculado). Por "considerado", lo que quiero decir es si existe tal cosa comoE[Yk]y, de ser así, ¿cómo se definiría ese concepto? El libro que tengo solo cubre el primer momento en bruto, y me resulta un poco extraño que no se mencione cómo definirE[Yk] dada mi experiencia en probabilidad univariante, ni tengo la experiencia para definirla.

Además, si E[Yk] no está definido, ¿hay quizás un concepto relacionado que no conozco que se usa en su lugar?

Clarinetista
fuente
Esta página muestra la relación entre momentos crudos y momentos centrales, y describe la ventaja de los momentos centrales.
EdM 01 de
@EdM no entiendo; parece que se trata de momentos univariantes, con los que estoy extremadamente familiarizado. Me pregunto si hay alguna consideración dek-th momentos crudos (k2) para el caso multivariante (es decir, con vectores aleatorios), no para el caso univariado y, de ser así, cómo se definiría dicho concepto.
Clarinetista
Mi sensación es que las estadísticas invariantes con respecto a la traducción a lo largo del eje de una variable se consideran las más útiles, y por lo tanto, los momentos crudos no se examinarían con tanta frecuencia como los momentos centrales, que tienen esa propiedad útil. Esta página de validación cruzada incluye una extensa discusión sobre momentos de orden superior y temas relacionados.
EdM 01 de
¿Podría amplificar lo que quiere decir con "teoría del modelo lineal" y "considerado"? En algunas aplicaciones más simples de modelos lineales, las suposiciones se hacen solo sobre los primeros dos momentos deY, pero en otros, como los modelos lineales generalizados, se hacen suposiciones que tienen implicaciones específicas para toda la distribución de Y.
whuber

Respuestas:

8

El análogo apropiado de los momentos univariados en un entorno multivariado es ver el exponente k=(k1,k2,,kn)como vector también La notación exponencial con bases vectoriales y exponentes vectoriales es una abreviatura del producto,

yk=y1k1y2k2ynkn.

Para cualquiera de esos vectores k, la herida) kth momento de la variable aleatoria Y se define para ser

μk=E(Yk).

Para motivar tal definición, considere un momento univariante de una función lineal de Y:

E((λ1Y1++λnYn)m)=k(mk)λkμk

donde la suma ocurre sobre todo k cuyos componentes son números enteros no negativos que suman m y (mk)=m!/(k1!k2!kn!)son los coeficientes multinomiales. La aparición de los momentos multivariados en el lado derecho muestra por qué son generalizaciones naturales e importantes de los momentos univariados.

Estos aparecen todo el tiempo. Por ejemplo, la covarianza entreYi y Yj no es otro que

Cov(Yi,Yj)=E(YiYj)E(Yi)E(Yj)=μki+kjμkiμkj

dónde ki y kjson los vectores indicadores con ceros en todos menos un lugar y uno en la ubicación indicada. (La misma fórmula da elegancia a la varianza deYi cuando i=j.)

Existen generalizaciones naturales de todos los conceptos de momento univariante en el entorno multivariado: una función generadora de momentos, acumulantes, una función generadora de acumulantes, momentos centrales, una función característica y relaciones algebraicas y analíticas entre todos.

Referencia

Alan Stuart y J. Keith Ord, Teoría avanzada de estadística de Kendall , quinta edición. Oxford University Press, 1987: Volumen I, Capítulo 3, Momentos y acumulantes.

whuber
fuente
3

Además de los puntos de @ whuber

1) No estoy seguro de lo que implica la teoría del modelo lineal, pero recuerde que en los modelos lineales generalmente estamos tratando con variables aleatorias normales que tienen 0 sesgo y 0 curtosis.

2) En términos más generales, la pregunta es de la forma "¿Cuán preciso es preciso?". Si quiero describir muestras de IID, podría decir que solo quiero la media. Alternativamente, podría decir que quiero la media y los errores en los medios. Una alternativa aún más detallada sería medios, errores en los medios y errores en los errores en los medios. A partir de este patrón, puede ver cómo los momentos más altos siguen aumentando. No existe una solución real para este problema, por lo que las personas generalmente se detienen en el nivel 2 (es decir, media y varianza). Eso no quiere decir que los momentos superiores sean inútiles. De hecho, para problemas relacionados con distribuciones de cola gruesa, estos problemas se vuelven relevantes

Sid
fuente