En la técnica de reducción de dimensionalidad, como el análisis de componentes principales, LDA, etc., a menudo se usa el término múltiple. ¿Qué es una variedad en términos no técnicos? Si un punto pertenece a una esfera cuya dimensión quiero reducir, y si hay un ruido y e no están correlacionados, entonces los puntos reales estarían muy separados entre sí debido al ruido. Por lo tanto, se requeriría filtrado de ruido. Entonces, la reducción de dimensión se realizaría en . Por lo tanto, por aquí hace e pertenecen a diferentes colectores?y x y x z = x + y x y
Estoy trabajando en datos de nube de puntos que a menudo se usan en visión de robot; las nubes de puntos son ruidosas debido al ruido en la adquisición y necesito reducir el ruido antes de la reducción de dimensiones. De lo contrario, obtendré una reducción de dimensión incorrecta. Entonces, ¿cuál es la variedad aquí y es el ruido una parte de la misma variedad a la que pertenece ?
fuente
Respuestas:
En términos no técnicos, un múltiple es una estructura geométrica continua que tiene una dimensión finita: una línea, una curva, un plano, una superficie, una esfera, una bola, un cilindro, un toro, un "blob" ... algo como esto :
Es un término genérico utilizado por los matemáticos para decir "una curva" (dimensión 1) o "superficie" (dimensión 2), o un objeto 3D (dimensión 3) ... para cualquier posible dimensión finita . Una variedad unidimensional es simplemente una curva (línea, círculo ...). Un colector bidimensional es simplemente una superficie (plano, esfera, toro, cilindro ...). Una variedad tridimensional es un "objeto completo" (bola, cubo completo, el espacio 3D que nos rodea ...).n
Un múltiple se describe a menudo mediante una ecuación: el conjunto de puntos como es un múltiple unidimensional (un círculo).x 2 + y 2 = 1(x,y) x2+y2=1
Una variedad tiene la misma dimensión en todas partes. Por ejemplo, si agrega una línea (dimensión 1) a una esfera (dimensión 2), la estructura geométrica resultante no es múltiple.
A diferencia de las nociones más generales de espacio métrico o espacio topológico que también pretenden describir nuestra intuición natural de un conjunto continuo de puntos, un múltiple está destinado a ser algo localmente simple: como un espacio vectorial de dimensión finita: . Esto excluye espacios abstractos (como espacios de dimensión infinita) que a menudo no tienen un significado concreto geométrico.Rn
A diferencia de un espacio vectorial, los colectores pueden tener varias formas. Algunos colectores se pueden visualizar fácilmente (esfera, bola ...), algunos son difíciles de visualizar, como la botella de Klein o el plano proyectivo real .
En estadística, aprendizaje automático o matemática aplicada en general, la palabra "múltiple" a menudo se usa para decir "como un subespacio lineal" pero posiblemente curva. Cada vez que escribe una ecuación lineal como: obtiene un subespacio lineal (afín) (aquí un plano). Por lo general, cuando la ecuación no es lineal como , esta es una variedad (aquí una esfera estirada).x 2 + 2 y 2 + 3 z 2 = 73x+2y−4z=1 x2+2y2+3z2=7
Por ejemplo, la " hipótesis múltiple " de ML dice que "los datos de alta dimensión son puntos en una variedad de baja dimensión con ruido de alta dimensión agregado". Puede imaginar puntos de un círculo 1D con algo de ruido 2D agregado. Si bien los puntos no están exactamente en el círculo, satisfacen estadísticamente la ecuación . El círculo es la variedad subyacente:x2+y2=1
fuente
Una variedad (topológica) es un espacio que es:M
(1) "localmente" "equivalente" a para algunos . nRn n
"Localmente", la "equivalencia" se puede expresar mediante funciones de coordenadas, , que juntas forman una función de "preservación de la estructura", , llamado un gráfico .c i : M → R c : M → R nn ci:M→R c:M→Rn
(2) se puede realizar de forma "preservadora de la estructura" como un subconjunto de para algunos . (1) (2) N≥nRN N≥n
Tenga en cuenta que para hacer que la "estructura" sea precisa aquí, uno necesita comprender las nociones básicas de topología ( def. ), Lo que le permite a uno hacer nociones precisas de comportamiento "local" y, por lo tanto, "localmente" arriba. Cuando digo "equivalente", me refiero a la estructura topológica equivalente ( homeomórfica ), y cuando digo "preservar la estructura" me refiero a lo mismo (crea una estructura topológica equivalente).
Tenga en cuenta también que para hacer cálculos en múltiples , uno necesita una condición adicional que no se sigue de las dos condiciones anteriores, que básicamente dice algo así como "los gráficos se comportan lo suficientemente bien como para permitirnos hacer cálculos". Estos son los múltiples más utilizados en la práctica. A diferencia de las variedades topológicas generales , además del cálculo también permiten triangulaciones , lo cual es muy importante en aplicaciones como la suya que involucran datos de nubes de puntos .
Tenga en cuenta que no todas las personas usan la misma definición para una variedad (topológica). Varios autores lo definirán como la única condición satisfactoria (1) anterior, no necesariamente también (2). Sin embargo, la definición que satisface tanto (1) como (2) se comporta mucho mejor, por lo tanto, es más útil para los profesionales. Uno podría esperar intuitivamente que (1) implica (2), pero en realidad no lo hace.
EDITAR: Si está interesado en aprender sobre qué es precisamente una "topología", el ejemplo más importante de una topología para entender es la topología euclidiana de . Esto se tratará en profundidad en cualquier (buen) libro introductorio sobre "análisis real" .Rn
fuente
En este contexto, el término múltiple es exacto, pero es innecesariamente alto en falutina. Técnicamente, una variedad es cualquier espacio (conjunto de puntos con una topología) que es suficientemente suave y continuo (de una manera que, con cierto esfuerzo, puede hacerse matemáticamente bien definido).
Imagine el espacio de todos los valores posibles de sus factores originales. Después de una técnica de reducción dimensional, no todos los puntos en ese espacio son alcanzables. En cambio, solo se podrán obtener puntos en algún subespacio incorporado dentro de ese espacio. Ese subespacio incrustado cumple con la definición matemática de una variedad. Para una técnica de reducción dimensional lineal como PCA, ese subespacio es solo un subespacio lineal (por ejemplo, un hiperplano), que es una variedad relativamente trivial. Pero para la técnica de reducción dimensional no lineal, ese subespacio podría ser más complicado (por ejemplo, una hiper-superficie curva). Para fines de análisis de datos, comprender que estos son subespacios es mucho más importante que cualquier inferencia que extraiga al saber que cumplen con la definición de múltiple.
fuente