Una norma es única (al menos en parte) porque está en el límite entre no convexo y convexo. Una norma es la norma convexa 'más escasa' (¿verdad?).
Entiendo que la norma euclidiana tiene raíces en la geometría y tiene una interpretación clara cuando las dimensiones tienen las mismas unidades. Pero no entiendo por qué se usa preferentemente sobre otros números reales : ? ? ¿Por qué no usar el rango continuo completo como un hiperparámetro?
¿Qué me estoy perdiendo?
regression
regularization
sparse
Trenton
fuente
fuente
Respuestas:
Una explicación más matemática es que el espacio , que consiste en todas las series que convergen en la norma p, es solo Hilbert con y ningún otro valor. Esto significa que este espacio está completo y la norma sobre ese espacio puede ser inducida por un producto interno (piense en el producto punto familiar en ), por lo que es un poco más agradable trabajar con él.lp p=2 Rn
fuente
Aquí hay un par de razones:
Está relacionado de una manera muy especial con el producto interno: es su propia norma dual (es decir, es "auto dual").ℓ2 z ℓ2 z ∥x∥22=x⋅x ℓp
Esto significa que, si se tiene en cuenta todos los vectores en el interior del bola unidad, su producto interior máximo con cualquier vector z es el ℓ 2 norma de z en sí. Menos elegante, satisface la propiedad de que ‖ x ‖ 2 2 = x ⋅ x . Ninguna otra norma ℓ p se comporta de esta manera.
Tiene un gradiente muy convenientemente suave: ¡Realmente no puedes superar eso!
fuente
Aunque puede haber muchas más razones, AFAIK p = 2 se prefiere por las siguientes razones:
fuente
Los errores al cuadrado en modelos lineales a menudo se prefieren debido a:
fuente