Preguntas etiquetadas con high-dimensional

Pertenece a una gran cantidad de características o dimensiones (variables) para datos. (Para una gran cantidad de puntos de datos, use la etiqueta [datos grandes]; si el problema es un número mayor de variables que datos, use la etiqueta [subdeterminado]).

23
¿Debería la reducción de dimensionalidad para la visualización considerarse un problema "cerrado", resuelto por t-SNE?

He estado leyendo mucho sobre el algoritmo -snettt para la reducción de dimensionalidad. Estoy muy impresionado con el rendimiento en los conjuntos de datos "clásicos", como MNIST, donde logra una separación clara de los dígitos ( ver artículo original ): También lo he usado para visualizar las...

10
Es el teorema del contraste relativo de Beyer et al. artículo: "¿Sobre el comportamiento sorprendente de las métricas de distancia en el espacio de alta dimensión" engañoso?

Esto se cita muy a menudo cuando se menciona la maldición de la dimensionalidad y va (fórmula de la derecha llamada contraste relativo) limre→ ∞var ( | | XreEl | El |kmi[ | El | XreEl | El |k]) =0,entonces: Dmaxkre- Dminkrereminkre→ 0limre→∞var(El |El |XreEl |El |kmi[El |El |XreEl |El |k])=0...

9
Datos correlacionados de alta dimensión y características principales / covariables descubiertas; prueba de hipótesis múltiples?

Tengo un conjunto de datos con aproximadamente 5,000 características / covariables a menudo correlacionadas y una respuesta binaria. Me dieron los datos, no los recolecté. Utilizo Lasso y el refuerzo de gradiente para construir modelos. Utilizo validación cruzada anidada iterada. Reporto los 40...