Si e son dos vectores unitarios aleatorios independientes en (distribuidos uniformemente en una esfera unitaria), ¿cuál es la distribución de su producto escalar (producto de puntos) ?
Actualizar
Ejecuté algunas simulaciones rápidas. Primero, al generar 10000 pares de vectores unitarios aleatorios para , es fácil ver que la distribución de sus productos de puntos es perfectamente gaussiana (de hecho, ya es bastante gaussiana para ), vea la subtrama a la izquierda. En segundo lugar, para cada varía de 1 a 10000 (con pasos crecientes), generé 1000 pares y calculé la varianza. Gráfico log-log se muestra a la derecha, y es evidente que la fórmula está muy bien aproximada por . Tenga en cuenta que para y esta fórmula incluso da resultados exactos (pero no estoy seguro de lo que sucede más adelante).
fuente
Respuestas:
Debido a que ( como es bien sabido ) se obtiene una distribución uniforme en la esfera de la unidad normalizando una distribución normal de variación y el producto de punto de los vectores normalizados es su coeficiente de correlación, las respuestas a los tres las preguntas son:SD−1 D t
La varianza de es igual a (como se especula en la pregunta).t 1/D
La distribución estandarizada de aproxima a la normalidad a una tasa det O(1D).
Método
La distribución exacta del producto escalar de los vectores unitarios se obtiene fácilmente geométricamente, porque este es el componente del segundo vector en la dirección del primero. Dado que el segundo vector es independiente del primero y se distribuye uniformemente en la esfera de la unidad, su componente en la primera dirección se distribuye de la misma manera que cualquier coordenada de la esfera. (Tenga en cuenta que la distribución del primer vector no importa).
Encontrar la densidad
Dejando que esa coordenada sea la última, la densidad en es, por lo tanto, proporcional al área de superficie que se encuentra a una altura entre y en la esfera de la unidad. Esa proporción ocurre dentro de un cinturón de altura y radio que es esencialmente un tronco cónico construido a partir de un de radio de altura y pendiente . De donde la probabilidad es proporcional at∈[−1,1] t t+dt dt 1−t2−−−−−√, SD−2 1−t2−−−−−√, dt 1/1−t2−−−−−√
Dejar implica . Sustituyendo eso en el precedente da el elemento de probabilidad hasta una constante de normalización:u=(t+1)/2∈[0,1] t=2u−1
Es inmediato que tiene una distribución Beta , porque (por definición) su densidad también es proporcional au=(t+1)/2 ((D−1)/2,(D−1)/2)
Determinando el comportamiento limitante
La información sobre el comportamiento limitante se deduce fácilmente de esto mediante técnicas elementales: se puede integrar para obtener la constante de proporcionalidad ; puede integrarse (usando las propiedades de las funciones Beta, por ejemplo) para obtener momentos, mostrando que la varianza es y se reduce a (de donde, por el Teorema de Chebyshev, la probabilidad se concentra cerca de ); y la distribución limitante se encuentra luego considerando los valores de la densidad de la distribución estandarizada, proporcional a para valores pequeños defD Γ(n2)π√Γ(D−12) tkfD(t) 1/D 0 t=0 fD(t/D−−√), t :
donde las representan constantes (log) de integración. Evidentemente, la velocidad a la que esto se aproxima a la normalidad (para la cual la densidad logarítmica es igual a ) esC −12t2 O(1D).
Este gráfico muestra las densidades del producto escalar para , según la varianza estandarizada, y su densidad limitante. Los valores en aumentan con (de azul a rojo, dorado y luego verde para la densidad normal estándar). La densidad para sería indistinguible de la densidad normal en esta resolución.D=4,6,10 0 D D=1000
fuente
Encontremos la distribución y luego la varianza sigue los resultados estándar. Considere el producto vectorial y escríbalo en su forma coseno, es decir, tenga en cuenta que donde es el ángulo entre e . En el último paso lo he usado para cualquier evento yAhora considere el término . Está claro que dado que se elige de manera uniforme con respecto a la superficie de la esfera, no importa qué
Para obtener un resultado explícito de la varianza, use el hecho de que el producto de punto es cero por independencia y, como se muestra arriba, se distribuye como la primera coordenada de . Según estos resultados, encontrar equivale a encontrar . Ahora, tenga en cuenta que por construcción y así podemos escribir donde la última igualdad se deduce de que las coordenadas de están idénticamente distribuidas. Al poner las cosas juntas, hemos encontrado quex Var(x′y) Ex21 x′x=1
fuente
Para responder la primera parte de su pregunta, denote . Definir El producto de los elementos de e indicados aquí ya que se distribuirá de acuerdo con la distribución conjunta de e . entonces desde ,Z=⟨X,Y⟩=∑XiYi
Para la segunda parte, creo que si quieres decir algo interesante sobre el comportamiento asintótico de necesitas al menos asumir la independencia de e , y luego aplicar un CLT.σ X Y
Por ejemplo, si estaba dispuesto a asumir que los se combinan con y podría digamos que y .{Z1,…,ZD} E[Zi]=μ V[Zi]=σ2 σ2(D)=σ2D limD→∞σ2(D)=0
fuente