Dejar

Ahora mismo estoy aprendiendo sobre teoría de modelos lineales, y una cosa que me sorprende es que, aunque $\mathbb{E}[\mathbf{Y}]$ se define para un vector aleatorio $\mathbf{Y} = \begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_n\end{bmatrix}$ , no se mencionan más momentos además de la matriz de covarianza.

La búsqueda en Google no ha aparecido mucho. Son $k$ th (raw) momentos de $\mathbf{Y}$ considerado, o hay una idea diferente que no conozco?

Estoy aprendiendo del texto Respuestas del plano a preguntas complejas (el TOC comienza en la página 17 del archivo vinculado). Por "considerado", lo que quiero decir es si existe tal cosa como $\mathbb{E}\left[\mathbf{Y}^k\right]$ y, de ser así, ¿cómo se definiría ese concepto? El libro que tengo solo cubre el primer momento en bruto, y me resulta un poco extraño que no se mencione cómo definir $\mathbb{E}\left[\mathbf{Y}^k\right]$ dada mi experiencia en probabilidad univariante, ni tengo la experiencia para definirla.

Además, si $\mathbb{E}\left[\mathbf{Y}^k\right]$ no está definido, ¿hay quizás un concepto relacionado que no conozco que se usa en su lugar?

self-study moments Clarinetista
fuente

Esta página muestra la relación entre momentos crudos y momentos centrales, y describe la ventaja de los momentos centrales.

EdM 01 de

@EdM no entiendo; parece que se trata de momentos univariantes, con los que estoy extremadamente familiarizado. Me pregunto si hay alguna consideración de

k

$k$ -th momentos crudos (

k \geq 2

$k \geq 2$ ) para el caso multivariante (es decir, con vectores aleatorios), no para el caso univariado y, de ser así, cómo se definiría dicho concepto.

Clarinetista

Relacionado: mathoverflow.net/questions/202732/…

Andrew M

Mi sensación es que las estadísticas invariantes con respecto a la traducción a lo largo del eje de una variable se consideran las más útiles, y por lo tanto, los momentos crudos no se examinarían con tanta frecuencia como los momentos centrales, que tienen esa propiedad útil. Esta página de validación cruzada incluye una extensa discusión sobre momentos de orden superior y temas relacionados.

EdM 01 de

¿Podría amplificar lo que quiere decir con "teoría del modelo lineal" y "considerado"? En algunas aplicaciones más simples de modelos lineales, las suposiciones se hacen solo sobre los primeros dos momentos de

Y

$\mathbf{Y}$ , pero en otros, como los modelos lineales generalizados, se hacen suposiciones que tienen implicaciones específicas para toda la distribución de

Y

$\mathbf{Y}$ .

whuber

Respuestas:

El análogo apropiado de los momentos univariados en un entorno multivariado es ver el exponente $\mathbf{k} = (k_1, k_2, \ldots, k_n)$ como vector también La notación exponencial con bases vectoriales y exponentes vectoriales es una abreviatura del producto,

y^{k} = y_{1}^{k_{1}} y_{2}^{k_{2}} \dots y_{n}^{k_{n}} .

$\mathbf{y}^\mathbf{k} = y_1^{k_1} y_2 ^{k_2} \cdots y_n^{k_n}.$

Para cualquiera de esos vectores $\mathbf{k}$ , la herida) $\mathbf{k}^\text{th}$ momento de la variable aleatoria $\mathbf{Y}$ se define para ser

μ_{k} = E (Y^{k}) .

$\mu_\mathbf{k} = \mathbb{E}\left(\mathbf{Y}^\mathbf{k}\right).$

Para motivar tal definición, considere un momento univariante de una función lineal de $\mathbf{Y}$ :

E ({(λ_{1} Y_{1} + \dots + λ_{n} Y_{n})}^{m}) = \sum_{k} (\binom{m}{k}) λ^{k} μ_{k}

$\mathbb{E}\left(\left(\lambda_1 Y_1 + \cdots + \lambda_n Y_n\right)^m\right) = \sum_\mathbf{k} \binom{m}{\mathbf{k}}\lambda^\mathbf{k} \mu_\mathbf{k}$

donde la suma ocurre sobre todo $\mathbf{k}$ cuyos componentes son números enteros no negativos que suman $m$ y $\binom{m}{\mathbf{k}} = m!/(k_1!k_2!\cdots k_n!)$ son los coeficientes multinomiales. La aparición de los momentos multivariados en el lado derecho muestra por qué son generalizaciones naturales e importantes de los momentos univariados.

Estos aparecen todo el tiempo. Por ejemplo, la covarianza entre $Y_i$ y $Y_j$ no es otro que

Cov (Y_{i}, Y_{j}) = E (Y_{i} Y_{j}) - E (Y_{i}) E (Y_{j}) = μ_{k_{i} + k_{j}} - μ_{k_{i}} μ_{k_{j}}

$\text{Cov}(Y_i, Y_j) = \mathbb{E}(Y_i Y_j)- \mathbb{E}(Y_i)\mathbb{E}(Y_j) = \mu_{\mathbf{k}_i + \mathbf{k}_j} - \mu_{\mathbf{k}_i}\mu_{\mathbf{k}_j}$

dónde $\mathbf{k}_i$ y $\mathbf{k}_j$ son los vectores indicadores con ceros en todos menos un lugar y uno en la ubicación indicada. (La misma fórmula da elegancia a la varianza de $Y_i$ cuando $i=j$ .)

Existen generalizaciones naturales de todos los conceptos de momento univariante en el entorno multivariado: una función generadora de momentos, acumulantes, una función generadora de acumulantes, momentos centrales, una función característica y relaciones algebraicas y analíticas entre todos.

Referencia

Alan Stuart y J. Keith Ord, Teoría avanzada de estadística de Kendall , quinta edición. Oxford University Press, 1987: Volumen I, Capítulo 3, Momentos y acumulantes.

whuber
fuente

Además de los puntos de @ whuber

1) No estoy seguro de lo que implica la teoría del modelo lineal, pero recuerde que en los modelos lineales generalmente estamos tratando con variables aleatorias normales que tienen 0 sesgo y 0 curtosis.

2) En términos más generales, la pregunta es de la forma "¿Cuán preciso es preciso?". Si quiero describir muestras de IID, podría decir que solo quiero la media. Alternativamente, podría decir que quiero la media y los errores en los medios. Una alternativa aún más detallada sería medios, errores en los medios y errores en los errores en los medios. A partir de este patrón, puede ver cómo los momentos más altos siguen aumentando. No existe una solución real para este problema, por lo que las personas generalmente se detienen en el nivel 2 (es decir, media y varianza). Eso no quiere decir que los momentos superiores sean inútiles. De hecho, para problemas relacionados con distribuciones de cola gruesa, estos problemas se vuelven relevantes

Sid
fuente