Estadísticas y Big Data

10
Métodos de inicialización de agrupamiento de K-medias

Estoy interesado en el estado actual de la técnica para seleccionar semillas iniciales (centros de agrupación) para K-means. Buscar en Google lleva a dos opciones populares: selección aleatoria de semillas iniciales, y utilizando la técnica de selección KMeans ++: Arthur & Vassilvitskii...

10
Relación LASSO entre y

Mi comprensión de la regresión LASSO es que los coeficientes de regresión se seleccionan para resolver el problema de minimización: minβ∥y−Xβ∥22 s.t.∥β∥1≤tminβ‖y−Xβ‖22 s.t.‖β‖1≤t\min_\beta \|y - X \beta\|_2^2 \ \\s.t. \|\beta\|_1 \leq t En la práctica, esto se hace usando un multiplicador de...

10
Muestreo exacto de mezclas impropias

Supongamos que quiero muestrear a partir de una distribución continua . Si tengo una expresión de en la formapp(x)pag(X)p(x)ppagp p(x)=∑i=1∞aifi(x)pag(X)=∑yo=1∞unayoFyo(X)p(x) = \sum_{i=1}^\infty a_i f_i(x) donde y f_i son distribuciones de las que se puede muestrear fácilmente, entonces puedo...