¿Por qué los estadísticos definieron matrices aleatorias?

18

Estudié matemáticas hace una década, así que tengo antecedentes en matemáticas y estadísticas, pero esta pregunta me está matando.

Esta pregunta sigue siendo un poco filosófica para mí. ¿Por qué los estadísticos desarrollaron todo tipo de técnicas para trabajar con matrices aleatorias? Quiero decir, ¿un vector aleatorio no resolvió el problema? Si no, ¿cuál es la media de las diferentes columnas de una matriz aleatoria? Anderson (2003, Wiley) considera un vector aleatorio un caso especial de una matriz aleatoria con una sola columna.

No veo el punto de tener matrices aleatorias (y estoy seguro de que es porque soy ignorante). Pero, tengan paciencia conmigo. Imagina que tengo un modelo con 20 variables aleatorias. Si quiero calcular la función de probabilidad conjunta, ¿por qué debería representarla como una matriz en lugar de un vector?

¿Qué me estoy perdiendo?

ps: lo siento por la pregunta mal etiquetada, pero no había etiquetas para matriz aleatoria y todavía no puedo crear una.

editar: matriz cambiada a matrices en el título

Eduardo
fuente
1
Creo que estás bien conceptualmente pensando en él como un vector aleatorio que se ha reorganizado para que sea matriz.
Matthew Gunn el
2
Posiblemente relevante: en.wikipedia.org/wiki/Random_projection .
dsaxton el
99
También podría preguntar por qué las matrices son de interés. Es perfectamente natural ver al azar cualquier matriz utilizada para representar un fenómeno observado o medido en el mundo real. Esto da como resultado una gran cantidad de posibles tipos y modelos para matrices aleatorias, que van desde matrices de adyacencia de gráficos aleatorios hasta matrices de covarianza de muestra y más.
whuber
2
@ Aksakal Creo que el punto del OP es cuándo es útil analizar algo como matrices aleatorias. por ejemplo, en la clasificación de imágenes, generalmente convierte sus matrices de imágenes en vectores ... no existe un 'análisis' de matrices. así que el comentario de whuber es la mejor respuesta hasta ahora: por ejemplo, una matriz de covarianza tiene que ser semi-definida positiva; si desea simular matrices de covarianza aleatorias, es más fácil trabajar con una especificación de matriz que con un vector.
seanv507
2
Las matrices aleatorias son solo un caso especial de tensores aleatorios.
Anony-Mousse -Reinstalar a Monica el

Respuestas:

23

Depende de en qué campo se encuentre, pero uno de los grandes esfuerzos iniciales para el estudio de matrices aleatorias surgió de la física atómica, y fue pionero de Wigner. Puede encontrar una breve descripción aquí . Específicamente, fueron los valores propios (que son niveles de energía en física atómica) de matrices aleatorias lo que generó toneladas de interés porque las correlaciones entre los valores propios dieron una idea del espectro de emisión de los procesos de desintegración nuclear.

Más recientemente, ha habido un gran resurgimiento en este campo, con el advenimiento de la distribución / s de Tracy-Widom para los valores propios más grandes de matrices aleatorias, junto con conexiones impresionantes a campos aparentemente no relacionados, como la teoría de mosaico , la física estadística, integrable sistemas , fenómenos KPZ , combinatoria aleatoria e incluso la hipótesis de Riemann . Puedes encontrar más ejemplos aquí .

Para obtener más ejemplos prácticos, una pregunta natural sobre una matriz de vectores de fila es cómo se verían sus componentes de PCA. Puede obtener estimaciones heurísticas para esto asumiendo que los datos provienen de alguna distribución y luego observando los valores propios de la matriz de covarianza, que se pronosticarán a partir de la universalidad de la matriz aleatoria : independientemente (dentro de lo razonable) de la distribución de sus vectores, la distribución limitante de los valores propios siempre se acercarán a un conjunto de clases conocidas. Puede pensar en esto como una especie de CLT para matrices aleatorias. Consulte este documento para ver ejemplos.

Alex R.
fuente
Gracias por tu respuesta. Sospeché que podría estar relacionado con algunos tecnicismos matemáticos. Pero ahora todo tiene sentido, la física siempre ha estado relacionada con las matemáticas y al revés también.
Eduardo
El periódico de Wigner fue a mediados de la década de 1950, el periódico de Wishart fue a fines de la década de 1920. Entonces, es difícil afirmar que Wigner dio el primer gran impulso, en mi opinión.
Aksakal
13

Parece que se siente cómodo con las aplicaciones de vectores aleatorios. Por ejemplo, trato con este tipo de vectores aleatorios todos los días: tasas de interés de diferentes plazos. El Banco de la Reserva Federal tiene la serie H15 , mire las letras del Tesoro a 4 semanas, 3 meses, 6 meses y 1 año. Puede pensar en estas 4 tasas como un vector con 4 elementos. También es aleatorio, mira los valores históricos en la trama a continuación.

ingrese la descripción de la imagen aquí

Al igual que con cualquier número aleatorio, podríamos preguntarnos: ¿cuál es la covarianza entre ellos? Ahora obtienes una matriz de covarianza 4x4. Si lo estima en datos diarios de un mes, obtiene 12 matrices de covarianza diferentes cada año, si desea que no se superpongan. La matriz de covarianza muestral de series aleatorias es en sí misma un objeto aleatorio, vea el artículo de Wishart "LA DISTRIBUCIÓN DE MOMENTOS DE PRODUCTOS GENERALIZADOS EN MUESTRAS DE UNA POBLACIÓN MULTIVARIADA NORMAL". Aquí . Hay una distribución llamada después de él.

Esta es una forma de llegar a matrices aleatorias. No es de extrañar que la teoría de la matriz aleatoria (RMT) se use en finanzas, como puede ver ahora.

Aksakal
fuente
1
¿Mencionas estimarlo en "datos de un mes", quieres decir "datos diarios de un mes"?
John
1
@John, en este ejemplo en particular, sí, diariamente. Sin embargo, algunas series se miden durante el día, como los precios de las acciones. Si tiene una cartera de acciones, puede obtener matrices de covarianza intradía a frecuencias muy altas.
Aksakal
3
+1. Parafraseando aquí, pero creo que una forma de motivar matrices aleatorias es que en estos casos, a menudo estamos interesados ​​en la relación entre (no solo dentro) de los vectores aleatorios. Esto naturalmente motiva a pensar en matrices en lugar de vectores.
Cliff AB el
@ Aksakal Los datos que menciona vienen en una frecuencia mensual y diaria. Me pareció confuso antes de revisar la publicación porque no tendría sentido estimar una matriz de covarianza utilizando un mes de datos mensuales.
John
@John, puede estimar la matriz de covarianza en datos mensuales o semanales, superpuestos o no superpuestos, etc. No hay una forma correcta de hacerlo.
Aksakal
8

En física teórica, las matrices aleatorias juegan un papel importante para comprender las características universales de los espectros de energía de sistemas con simetrías particulares.

Mi experiencia en física teórica puede hacer que presente un punto de vista ligeramente sesgado aquí, pero incluso iría tan lejos como para sugerir que la popularidad de la teoría de matrices aleatorias (RMT) se originó a partir de su aplicación exitosa en física.

Sin entrar en demasiados detalles, por ejemplo, se pueden obtener espectros de energía en la mecánica cuántica calculando valores propios de los sistemas hamiltonianos, que se pueden expresar como una matriz hermitiana. A menudo, los físicos no están interesados ​​en sistemas particulares, pero quieren saber cuáles son las propiedades generales de los sistemas cuánticos que tienen propiedades caóticas, lo que lleva a los valores de la matriz hermitiana hamiltoniana a llenar ergódicamente el espacio matriz al variar la energía u otros parámetros ( por ejemplo, condiciones de contorno). Esto motiva tratar una clase de sistemas físicos como matrices aleatorias y observar las propiedades promedio de estos sistemas. Recomiendo literatura sobre la conjetura de Bohigas-Gianonni-Schmidt si quieres profundizar en esto.

En resumen, se puede mostrar, por ejemplo, que los niveles de energía de los sistemas que tienen simetría de inversión de tiempo se comportan universalmente diferentes a los niveles de energía de los sistemas que no tienen simetría de inversión de tiempo (lo que sucede, por ejemplo, si agrega un campo magnético). De hecho, un cálculo bastante corto utilizando matrices aleatorias gaussianas puede mostrar que los niveles de energía tienden a ser diferentes en ambos sistemas.

Estos resultados pueden ampliarse y ayudar a comprender también otras simetrías, que tuvieron un gran impacto en diferentes campos, como también la física de partículas o la teoría del transporte mesoscópico y más tarde incluso en los mercados financieros.

Clusterfari
fuente
1
es por eso que dejé la física :) demasiado "daño cerebral"
Aksakal
Estadísticos como Wishart donde antes los físicos atómicos.
kjetil b halvorsen
5

Un mapa lineal es un mapa entre espacios vectoriales. Supongamos que tiene un mapa lineal y ha elegido bases para sus espacios de dominio y rango. Luego puede escribir una matriz que codifique el mapa lineal. Si desea considerar mapas lineales aleatorios entre esos dos espacios, debe proponer una teoría de matrices aleatorias. La proyección aleatoria es un ejemplo simple de tal cosa.

Además, hay objetos con valores de matriz / tensor en física. El tensor de estrés viscoso es uno de ellos (entre un verdadero zoológico). En materiales viscoelásticos casi homogéneos, puede ser útil modelar las cepas (elásticas, viscosas, et al.) Y, por lo tanto, las tensiones puntiagudas como un tensor aleatorio con una pequeña variación. Aunque hay un sentido de "mapa lineal" para este esfuerzo / tensión, es más honesto describir esta aplicación de matrices aleatorias como aleatorizar algo que ya era una matriz.

Eric Towers
fuente
4

La detección de compresión como una aplicación en el procesamiento de imágenes se basa en matrices aleatorias como medidas combinadas de una señal 2D. Las propiedades específicas de estas matrices, a saber, la coherencia , se definen para estas matrices y juegan un papel en la teoría.

Bastante simplificado, resulta que minimizar la norma L1 de un determinado producto de una matriz gaussiana y una señal de entrada dispersa le permite recuperar mucha más información de la que podría esperar.

La investigación inicial más notable en esta área que conozco es el trabajo de la Universidad de Rice: http://dsp.rice.edu/research/compressive-sensing/random-matrices

La teoría de los productos matriciales como "medidas de una señal" se remonta al menos a la Segunda Guerra Mundial. Como me contó un ex profesor mío, probar individualmente a cada alistado del ejército por, por ejemplo, sífilis, tenía un costo prohibitivo. Mezclar estas muestras de manera sistemática (al mezclar porciones de cada muestra de sangre y analizarlas) reduciría la cantidad de veces que se necesita realizar una prueba. Esto podría modelarse como un vector binario aleatorio multiplicado por una matriz dispersa.

Lucero
fuente