Distribución de muestreo del radio de distribución normal 2D

La distribución normal bivariada con media y matriz de covarianza puede reescribirse en coordenadas polares con radio y ángulo . Mi pregunta es: ¿Cuál es la distribución de muestreo de , es decir, de la distancia desde un punto al centro estimado dada la matriz de covarianza de muestra ? $\mu$ $\Sigma$ $r$ $\theta$ $\hat{r}$ $x$ $\bar{x}$ $S$

Antecedentes: la verdadera distancia desde un punto hasta la media sigue una distribución de Hoyt . Con valores propios de y , su parámetro de forma es , y su parámetro de escala es . Se sabe que la función de distribución acumulativa es la diferencia simétrica entre dos funciones Q de Marcum. $r$ $x$ $\mu$ $\lambda_{1}, \lambda_{2}$ $\Sigma$ $\lambda_{1} > \lambda_{2}$ $q=\frac{1}{\sqrt{(\lambda_{1}+\lambda_{2})/\lambda_{2})-1}}$ $\omega = \lambda_{1} + \lambda_{2}$

La simulación sugiere que conectar las estimaciones y para y en el verdadero cdf funciona para muestras grandes, pero no para muestras pequeñas. El siguiente diagrama muestra los resultados de 200 veces $\bar{x}$ $S$ $\mu$ $\Sigma$

simulando 20 vectores normales 2D para cada combinación de ( eje ), (filas) y cuantil (columnas) dados $q$ $x$ $\omega$
para cada muestra, calculando el cuantil dado del radio observado a $\hat{r}$ $\bar{x}$
para cada muestra, calcular el cuantil de la Hoyt teórico (normal 2D) cdf, y de la cdf teórico Rayleigh después de conectar las estimaciones de la muestra y . $\bar{x}$ $S$

ingrese la descripción de la imagen aquí

A medida que acerca a 1 (la distribución se vuelve circular), los cuantiles Hoyt estimados se aproximan a los cuantiles Rayleigh estimados que no se ven afectados por . A medida que crece, la diferencia entre los cuantiles empíricos y los estimados aumenta, especialmente en la cola de la distribución. $q$ $q$ $\omega$

probability normal-distribution multivariate-analysis rayleigh lince
fuente

¿Cuál es la pregunta?

John

@John destaqué la pregunta: "¿Cuál es la distribución de muestreo de [radio] , es decir, de la distancia desde un punto al centro estimado dada la matriz de convarianza de muestra ?"

r

$r$

x

$x$

\bar{x}

$\bar{x}$

S

$S$

caracal

¿Por qué en lugar de ?

\hat{r}

$\hat{r}$

\hat{r^{2}}

$\hat{r^2}$

SomeEE

@MathEE simplemente porque la literatura que conozco se refiere a la distribución de (verdadero) , no (verdadero) . Tenga en cuenta que esto es diferente a la situación con la distancia de Mahalanobis discutida en esta pregunta . Por supuesto, los resultados para la distribución de serían muy bienvenidos.

\hat{r}

$\hat{r}$

r

$r$

r^{2}

$r^{2}$

{\hat{r}}^{2}

$\hat{r}^{2}$

caracal

Como mencionó en su publicación, conocemos la distribución de la estimación de si se nos da por lo que sabemos la distribución de la estimación de la verdadera . $\widehat{r_{true}}$ $\mu$ $\widehat{r^2_{true}}$ $r^2$

Queremos encontrar la distribución de donde se expresan como vectores de columna.

\hat{r^{2}} = \frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} (x_{i} - \bar{x})

$\widehat{r^2} = \frac{1}{N}\sum_{i=1}^N (x_i-\overline{x})^T(x_i-\overline{x})$

x_{i}

$x_i$

Ahora hacemos el truco estándar

\begin{array}{rcl} \hat{r_{t r u e}^{2}} & = & \frac{1}{N} \sum_{i = 1}^{N} (x_{i} - μ)^{T} (x_{i} - μ) \\ = & \frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x} + \bar{x} - μ)^{T} (x_{i} - \bar{x} + \bar{x} - μ) \\ = & [\frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} (x_{i} - \bar{x})] + (\bar{x} - μ)^{T} (\bar{x} - μ) (1) \\ = & \hat{r^{2}} + (\bar{x} - μ)^{T} (\bar{x} - μ) \end{array}

$\begin{eqnarray*} \widehat{r^2_{true}} &=& \frac{1}{N}\sum_{i=1}^N(x_i - \mu)^T(x_i-\mu)\\ &=& \frac{1}{N}\sum_{i=1}^N(x_i-\overline{x} + \overline{x} -\mu)^T(x_i-\overline{x} + \overline{x}-\mu)\\ &=&\left[\frac{1}{N}\sum_{i=1}^N(x_i - \overline{x})^T(x_i-\overline{x})\right] + (\overline{x} - \mu)^T(\overline{x}-\mu) \hspace{20pt}(1)\\ &=& \widehat{r^2} + (\overline{x}-\mu)^T(\overline{x}-\mu) \end{eqnarray*}$ donde surge de la ecuación y su transposición.

(1)

$(1)$

\frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} (\bar{x} - μ) = (\bar{x} - \bar{x})^{T} (\bar{x} - μ) = 0

$\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^T(\overline{x}-\mu) = (\overline{x} - \overline{x})^T(\overline{x} - \mu) = 0$

Observe que es el rastro de la matriz de covarianza de muestra y solo depende de la media la muestra . Por lo tanto, hemos escrito como la suma de dos Variables aleatorias independientes. Conocemos las distribuciones de y y así hemos terminado a través del truco estándar usando ese Las funciones características son multiplicativas. $\widehat{r^2}$ $S$ $(\overline{x}-\mu)^T(\overline{x}-\mu)$ $\overline{x}$

\hat{r_{t r u e}^{2}} = \hat{r^{2}} + (\bar{x} - μ)^{T} (\bar{x} - μ)

$\widehat{r_{true}^2} = \widehat{r^2} + (\overline{x}-\mu)^T(\overline{x}-\mu)$

\hat{r_{t r u e}^{2}}

$\widehat{r^2_{true}}$

(\bar{x} - μ)^{T} (\bar{x} - μ)

$(\overline{x} - \mu)^T(\overline{x}-\mu)$

Editado para agregar:

$||x_i-\mu||$ es Hoyt, entonces tiene pdf donde es la función Bessel modificada del primer tipo .

f (ρ) = \frac{1 + q^{2}}{q ω} ρ e^{- \frac{(1 + q^{2})^{2}}{4 q^{2} ω} ρ^{2}} I_{O} (\frac{1 - q^{4}}{4 q^{2} ω} ρ^{2})

$f(\rho) = \frac{1+q^2}{q\omega}\rho e^{-\frac{(1+q^2)^2}{4q^2\omega} \rho^2}I_O\left(\frac{1-q^4}{4q^2\omega} \rho^2\right)$

I_{0}

$I_0$

0^{t h}

$0^{th}$

Esto significa que el pdf de es $||x_i-\mu||^2$

f (ρ) = \frac{1}{2} \frac{1 + q^{2}}{q ω} e^{- \frac{(1 + q^{2})^{2}}{4 q^{2} ω} ρ} I_{0} (\frac{1 - q^{4}}{4 q^{2} ω} ρ) .

$f(\rho) = \frac{1}{2}\frac{1+q^2}{q\omega}e^{-\frac{(1+q^2)^2}{4q^2\omega}\rho}I_0\left(\frac{1-q^4}{4q^2\omega}\rho\right).$

Para facilitar la notación, configure , y . $a = \frac{1-q^4}{4q^2\omega}$ $b=-\frac{(1+q^2)^2}{4q^2\omega}$ $c=\frac{1}{2}\frac{1+q^2}{q\omega}$

La función generadora de momento de es $||x_i-\mu||^2$

{\begin{cases} \frac{c}{\sqrt{(s - b)^{2} - a^{2}}} & (s - b) > a \\ 0 & else \end{cases}

$\begin{cases} \frac{c}{\sqrt{(s-b)^2-a^2}} & (s-b) > a\\ 0 & \text{ else}\\ \end{cases}$

Por lo tanto, la función generadora de momento de es y la función generadora de momento de es $\widehat{r^2_{true}}$

{\begin{cases} \frac{c^{N}}{((s / N - b)^{2} - a^{2})^{N / 2}} & (s / N - b) > a \\ 0 & else \end{cases}

$\begin{cases} \frac{c^N}{((s/N-b)^2-a^2)^{N/2}} & (s/N-b) > a\\ 0 & \text{else} \end{cases}$

| | \bar{x} - μ | |^{2}

$||\overline{x} - \mu||^2$

{\begin{cases} \frac{N c}{\sqrt{(s - N b)^{2} - (N a)^{2}}} = \frac{c}{\sqrt{(s / N - b)^{2} - a^{2}}} & (s / N - b) > a \\ 0 & else \end{cases}

$\begin{cases} \frac{Nc}{\sqrt{(s-Nb)^2-(Na)^2}} = \frac{c}{\sqrt{(s/N-b)^2-a^2}} & (s/N-b) > a\\ 0 & \text{ else} \end{cases}$

Esto implica que la función generadora de momento de es $\widehat{r^2}$

{\begin{cases} \frac{c^{N - 1}}{((s / N - b)^{2} - a^{2})^{(N - 1) / 2}} & (s / N - b) > a \\ 0 & else . \end{cases}

$\begin{cases} \frac{c^{N-1}}{((s/N-b)^2-a^2)^{(N-1)/2}} & (s/N-b) > a\\ 0 & \text{ else}. \end{cases}$

La aplicación de la transformación inversa de Laplace da que tiene pdf $\widehat{r^2}$

g (ρ) = \frac{\sqrt{π} N c^{N - 1}}{Γ (\frac{N - 1}{2})} {(\frac{2 i a}{N ρ})}^{(2 - N) / 2} e^{b N ρ} J_{N / 2 - 1} (i a N ρ) .

$g(\rho) = \frac{\sqrt{\pi}Nc^{N-1}}{\Gamma(\frac{N-1}{2})}\left(\frac{2\mathrm{i} a}{N\rho}\right)^{(2 - N)/2} e^{b N \rho} J_{N/2-1}( \mathrm{i} a N \rho).$

SomeEE
fuente

¡Gracias! Tendré que resolver los detalles antes de aceptar.

caracal

\hat{r_{true}^{2}} \sim Hoyt

$\widehat{r^{2}_{\text{true}}} \sim \text{Hoyt}$ , y ? Entonces la función característica de es el producto de las dos funciones características como se explica aquí . Eso efectivamente responde a mi pregunta. ¿Sabe cómo podríamos transformar adecuadamente modo que su distribución sea conocida sin acceso a ? ¿Como la distancia de Mahalanobis o la estadística univariada ?

| | \bar{x} - μ | |^{2} \sim N (0, \frac{1}{N} Σ)

$||\bar{x}-\mu||^{2} \sim \mathcal{N}(0, \frac{1}{N}\Sigma)$

\hat{r^{2}}

$\widehat{r^{2}}$

\hat{r^{2}}

$\widehat{r^{2}}$

Σ

$\Sigma$

t

$t$

caracal

He editado mi respuesta a una respuesta completa. Avísame si estás de acuerdo.

SomeEE

No estoy seguro acerca de desconocido . Lo obvio sería tratar de "dividir" por la covarianza de muestra que se vería como una suma de distancias de Mahalanobis, es decir, considere . Lamentablemente, esta suma es siempre .

Σ

$\Sigma$

\hat{r^{2}}

$\widehat{r^2}$

S

$S$

\frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} S^{- 1} (x_{i} - \bar{x})

$\frac{1}{N} \sum_{i=1}^N(x_i - \overline{x})^T S^{-1}(x_i-\overline{x})$

1

$1$

SomeEE

¡Gracias por seguir trabajando en la respuesta! No estoy seguro acerca de la distribución de . No soy capaz de hacer frente a esta forma analítica, sino una simulación rápida de da una distribución diferente de : código de simulación R . Aunque bien podría ser que no entiendo correctamente la parametrización .

| | x_{i} - μ | |^{2}

$||x_{i}-\mu||^{2}$

r^{2}

$r^{2}$

Γ (q, \frac{ω}{q})

$\Gamma(q, \frac{\omega}{q})$

Γ

$\Gamma$

caracal

Distribución de muestreo del radio de distribución normal 2D

Respuestas: