¿Cómo generar matrices ortogonales uniformemente aleatorias de determinante positivo?

9

Probablemente tengo una pregunta tonta sobre la cual, debo confesar, estoy confundido. Imagine la generación repetida de una matriz ortogonal aleatoria (ortonormal) distribuida uniformemente de algún tamaño . Algunas veces la matriz generada tiene determinante y otras veces tiene determinante . (Solo hay dos valores posibles. Desde el punto de vista de la rotación ortogonal significa que también hay una reflexión adicional además de la rotación).p11det=1

Podemos cambiar el signo de det de una matriz ortogonal de menos a más cambiando el signo de cualquier uno (o, más generalmente, cualquier número impar de) la columna de la misma.

Mi pregunta es: dado que generamos tales matrices aleatorias repetidamente, ¿ introduciremos algún sesgo en su naturaleza aleatoria uniforme si cada vez que elegimos revertir el signo de una columna específica (por ejemplo, siempre primero o siempre último)? ¿O debemos tener para recoger la columna al azar con el fin de mantener las matrices representan aleatoria uniformemente distribuida colección?

ttnphns
fuente

Respuestas:

7

La elección de la columna no importa: la distribución resultante en las matrices ortogonales especiales, SO(n) , sigue siendo uniforme.

Explicaré esto usando un argumento que se extiende, de manera obvia, a muchas preguntas relacionadas sobre la generación uniforme de elementos de grupos. Cada paso de este argumento es trivial, no requiere más que una referencia a definiciones adecuadas o un cálculo simple (como señalar que la matriz es ortogonal y autoinversa).I1

El argumento es una generalización de una situación familiar. Considere la tarea de elaborar positivos números reales de acuerdo a una distribución continua especificada . Esto se puede hacer extrayendo cualquier número real de una distribución continua y negando el resultado, si es necesario, para garantizar un valor positivo (casi seguro). Para que este proceso tenga la distribución , debe tener la propiedad queG F GFGFG

G(x)G(x)=F(x).

La forma más sencilla de lograr esto es cuando es simétrico alrededor de modo que , lo que implica : toda probabilidad positiva las densidades simplemente se duplican y se eliminan todos los resultados negativos. La relación familiar entre la distribución medio normal ( ) y la distribución normal ( ) es de este tipo.0 G ( x ) - 1 / 2 = 1 / 2 - G ( - x ) F ( x ) = 2 G ( x ) - 1 F GG0G(x)1/2=1/2G(x)F(x)=2G(x)1FG

A continuación, el grupo desempeña el papel de los números reales distintos de cero (considerados como un grupo multiplicativo ) y su subgrupo desempeña el papel de los números reales positivos . La medida de Haar es invariable bajo negación, por lo que cuando se "dobla" de a , la distribución de los valores positivos no cambia . (Esta medida, desafortunadamente, no se puede normalizar a una medida de probabilidad, pero esa es la única forma en que la analogía se rompe).S O ( n ) R + d x / x R - { 0 } R +O(n)SO(n)R+dx/xR{0}R+

Negar una columna específica de una matriz ortogonal (cuando su determinante es negativo) es el análogo de negar un número real negativo para plegarlo en el subgrupo positivo. En términos más generales, puede elegir de antemano cualquier matriz ortogonal de determinante negativo y usarla en lugar de : los resultados serían los mismos.I 1JI1


Aunque la pregunta se formula en términos de generar variables aleatorias, realmente pregunta sobre las distribuciones de probabilidad en los grupos de matriz y . La conexión entre estos grupos se describe en términos de la matriz ortogonal.S O ( n , R ) = S O ( n )O(n,R)=O(n)SO(n,R)=SO(n)

I1=(1000010000001)

porque negar la primera columna de una matriz ortogonal significa multiplicar a la derecha por . Observe que y es la unión disjuntaX I 1 S O ( n ) O ( n ) O ( n )XXI1SO(n)O(n)O(n)

O(n)=SO(n)SO(n)I11.

Dado un espacio de probabilidad definido en , el proceso descrito en la pregunta define un mapaO ( n )(O(n),S,P)O(n)

f:O(n)SO(n)

configurando

f(X)=X

cuando yXSO(n)

f(X)=XI1

para .XSO(n)I11

La pregunta se refiere a generar elementos aleatorios en obteniendo elementos aleatorios : es decir, "empujándolos hacia adelante" a través de para producir . El avance crea un espacio de probabilidad conω O ( n ) f f ω = f ( ω ) S O ( n ) ( S O ( n ) , S , P )SO(n)ωO(n)ffω=f(ω)SO(n)(SO(n),S,P)

S=fS={f(E)|ES}

y

P(E)=(fP)(E)=P(f1(E))=P(EEI1)

para todo .ES

Suponiendo que la multiplicación correcta por preserva la medida y observa que, en cualquier caso, , se inmediatamente que para todos , EEI1E SEEI1=ES

P(E)=P(EEI11)=P(E)+P(EI11)=2P(E).

En particular, cuando es invariante bajo la multiplicación a la derecha en (que es lo que normalmente significa "uniforme"), el hecho obvio de que y su inverso (que es igual a sí) son ambas ortogonales significa lo anterior, lo que demuestra que es uniforme. Por lo tanto, no es necesario seleccionar una columna aleatoria para la negación. O ( n ) I 1 I 1 PPO(n)I1I1P

whuber
fuente
+1. Esta es una muy buena reseña, gracias por publicar esta respuesta.
ameba
1
Una respuesta fabulosa. Pero a partir de The question is concerned about generatingeso me resultó difícil empujarme hacia adelante a través del simbolismo. ¿Podría resumir el razonamiento en palabras , para un laico antes, por favor?
ttnphns