Las implementaciones actuales del algoritmo de proyección aleatoria reducen la dimensionalidad de las muestras de datos al mapearlas de a usando una matriz de proyección cuyas entradas son iid de una distribución adecuada (por ejemplo, de ):
Convenientemente, existen pruebas teóricas que muestran que este mapeo conserva aproximadamente las distancias por pares.
Sin embargo, recientemente encontré estas notas donde el autor afirma que este mapeo con una matriz aleatoria no es una proyección en el sentido estrictamente algebraico lineal de la palabra (página 6). De las explicaciones dadas allí, esto se debe a que las columnas de no son estrictamente ortogonales cuando sus entradas se eligen independientemente de . Por lo tanto, las versiones anteriores de RP donde se aplicaba la ortogonalidad de las columnas de pueden considerarse como una proyección.
¿Puede proporcionar una explicación más detallada de (1) cuál es la definición de una proyección en este sentido estricto y (2) por qué no es una proyección RP bajo esta definición?
Respuestas:
¿Cuál es la definición de una proyección en este sentido estricto (algebraico lineal) (de la palabra)
Para la proyección ortogonal o la proyección vectorial, tiene eso
¿Por qué no es RP una proyección bajo esta definición?
Michael Mahoney escribe en sus notas de clase que depende de cómo se construya el RP , si el RP es o no una proyección en el sentido algebraico lineal tradicional. Esto lo hace en los puntos tercero y cuarto:
Por lo tanto, podría hacer, en principio, la proyección aleatoria con una construcción diferente que se limita a las matrices ortogonales (aunque no es necesario). Ver por ejemplo el trabajo original:
La entrada de wikipedia describe la proyección aleatoria de esta manera (lo mismo se menciona en las notas de clase en las páginas 10 y 11)
Pero generalmente no obtienes esta ortogonalidad cuando tomas todas las entradas de matriz en la matriz variables aleatorias e independientes con una distribución normal (como Whuber mencionó en su comentario con una consecuencia muy simple "si las columnas siempre fueran ortogonales, sus entradas podrían no ser independiente ").
Entonces, la proyección aleatoria de diferentes construcciones, como el uso de entradas aleatorias en la matriz, no es exactamente igual a una proyección ortogonal. Pero es computacionalmente más simple y, según Michael Mahoney, es "lo suficientemente bueno".
fuente
Eso es correcto: "proyección aleatoria" es estrictamente hablando, no una proyección.
fuente
Le agradecería que pudiera confirmar / corregir mi razonamiento aquí.
Referencia:
[1] http://www.dankalman.net/AUhome/classes/classesS17/linalg/projections.pdf
fuente
Si utiliza el cambio de signo aleatorio o la permutación antes de la transformación Fast Walsh Hadamard, la proyección aleatoria es ortogonal.
fuente