Para la norma vectorial, la norma L2 o "distancia euclidiana" es la definición ampliamente utilizada e intuitiva. Pero, ¿por qué la definición de norma "más utilizada" o "predeterminada" para una matriz es la norma espectral , pero no la norma Frobenius (que es similar a la norma L2 para los vectores)?
¿Tiene eso algo que ver con algoritmos iterativos / potencias de matriz (si el radio espectral es menor que 1, entonces el algoritmo convergerá)?
Siempre es discutible para las palabras como "más utilizado", "predeterminado". La palabra "predeterminado" mencionada anteriormente proviene del tipo de retorno predeterminado en la
Matlab
funciónnorm
. EnR
la norma predeterminada para la matriz es la norma L1. Ambos son "antinaturales" para mí (para una matriz, parece más "natural" hacer como en un vector). (Gracias por los comentarios de @ usεr11852 y @ whuber y perdón por la confusión).¿Se puede ampliar el uso de la norma de la matriz que me ayudaría a comprender más?
fuente
norm
R
enumera la norma como predeterminada, no la norma espectral.Respuestas:
En general, no estoy seguro de que la norma espectral sea la más utilizada. Por ejemplo, la norma de Frobenius se usa para aproximar la solución en factorización de matriz no negativa o regularización de matriz de correlación / covarianza . Creo que parte de esta pregunta proviene del delito de terminología que algunas personas hacen (incluido yo mismo) cuando se refieren a la norma de Frobenius como la norma de la matriz euclidiana . No deberíamos porque en realidad la norma de la matriz (es decir, la norma espectral) es la que se induce a las matrices cuando se usa la norma del vector . La norma de Frobenius es que es un elemento sabio: , mientras queL2 L2 ||A||F=∑i,ja2i,j−−−−−−√ | El | A| El | 2=√L2 la norma de matriz ( ) se basa en valores singulares, por lo que es más "universal". (¿para tener suerte de un término mejor?) La norma de la matriz es una norma de tipo euclidiano ya que es inducida por la norma del vector euclidiano, donde . Por lo tanto, es una norma inducida para matrices porque es inducida por una norma vectorial , la norma vectorial en este caso.L2| El | A| El | 2=max | El | x | El | 2 = 1 | El | Ax| El | 2L2||A||2=λmax(ATA)−−−−−−−−−√) L2 ||A||2=max||x||2=1||Ax||2 L2
Probablemente MATLAB tiene como objetivo proporcionar la norma por defecto cuando se utiliza el comando ; Como consecuencia, proporciona la norma del vector euclidiano, pero también la norma de la matriz , es decir. la norma de la matriz espectral (en lugar de la " norma de la matriz de Frobenius / Euclidiana " erróneamente citada ). Finalmente, permítanme señalar que la norma predeterminada es una cuestión de opinión hasta cierto punto: por ejemplo, " Matrix Algebra - Theory, Computations and Applications in Statistics " de JE Gentle literalmente tiene un capítulo (3.9.2) llamado: " The Frobenius Norma - La norma "habitual"L2 L2 "; ¡así que claramente la norma espectral no es la norma predeterminada para todas las partes consideradas! :) Como comentó @amoeba, las diferentes comunidades podrían tener diferentes convenciones terminológicas. No hace falta decir que creo que el libro de Gentle es un recurso invaluable sobre el tema de Lin. Aplicación de Álgebra en Estadísticas y le pediría que lo busque más.
norm
fuente
Una parte de la respuesta puede estar relacionada con la computación numérica.
Cuando resuelve el sistema con precisión finita, no obtiene la respuesta exacta a ese problema. Obtiene una aproximación debido a las restricciones de la aritmética finita, de modo que , en algún sentido adecuado. ¿Qué representa tu solución, entonces? Bueno, puede ser una solución exacta para algún otro sistema como Entonces, para que tenga utilidad, el sistema tilde debe estar cerca del sistema original: Si su algoritmoAx=b x~ Ax~≈b A~x~=b~ x~ A~≈A,b~≈b de resolver el sistema original satisface esa propiedad, entonces se conoce como estable hacia atrás . Ahora, el análisis preciso de cuán grandes son las discrepancias , eventualmente conduce a errores en los límites que se expresan como,. Para algunos análisis, la norma (suma máxima de columnas) es la más fácil de , para otros, la norma (suma máxima de filas) es la más fácil de aplicar (para componentes de la solución en el caso del sistema lineal , por ejemplo), y para otros, la norma espectral es la más apropiada (inducida por el tradicionalA~−A b~−b ∥A~−A∥ ∥b~−b∥ l1 l∞ l2 l2 norma vectorial, como se señala en otra respuesta ). Para el trabajo de la computación estadística en la inversión de matriz simétrica psd, descomposición de Cholesky (trivia: el primer sonido es un [x] como en la letra griega "chi", no [tʃ] como en "chase"), la norma más conveniente para realizar un seguimiento de los límites de error es la norma ... aunque la norma Frobenius también aparece en algunos resultados, por ejemplo, en la inversión de matriz particionada.l2
fuente
La respuesta a esto depende del campo en el que se encuentre. Si es matemático, entonces todas las normas en dimensiones finitas son equivalentes : para cualesquiera dos normas y , allí existen constantes , que dependen solo de la dimensión (y a, b) de modo que:∥⋅∥a ∥⋅∥b C1,C2
Esto implica que las normas en dimensiones finitas son bastante aburridas y esencialmente no hay diferencia entre ellas, excepto en cómo se escalan. Esto generalmente significa que puede elegir la norma más conveniente para el problema que está tratando de resolver . Por lo general, desea responder preguntas como "¿está limitado este operador o procedimiento" o "converge este proceso numérico"? Con límites, generalmente solo te importa que algo sea finito. Con la convergencia, al sacrificar la velocidad a la que tiene convergencia, puede optar por utilizar una norma más conveniente.
Por ejemplo, en álgebra lineal numérica, a veces se prefiere la norma de Frobenius porque es mucho más fácil de calcular que la norma euclidiana, y también que se conecta naturalmente con una clase más amplia de operadores de Hilbert Schmidt . Además, al igual que la norma euclidiana, es submultiplictiva: , a diferencia de, por ejemplo, la norma máxima, por lo que le permite hablar fácilmente sobre la multiplicación del operador en lo que sea espacio en el que está trabajando. A la gente le gusta mucho la norma y la norma Frobenius porque tienen relaciones naturales con los valores propios y los valores singulares de las matrices, además de ser submultiplictivas.∥AB∥F≤∥A∥F∥B∥F p=2
Para fines prácticos , las diferencias entre las normas se vuelven más pronunciadas porque vivimos en un mundo de dimensiones y generalmente importa cuán grande es una determinada cantidad y cómo se mide. Esas constantes anteriores no son exactamente estrictas, por lo que se vuelve importante cuánto más o menos una determinada norma se compara con .C1,C2 ∥x∥a ∥x∥b
fuente