Estadísticas y Big Data

8
Cómo realizar SVD para imputar valores perdidos, un ejemplo concreto

He leído los excelentes comentarios sobre cómo lidiar con los valores perdidos antes de aplicar SVD, pero me gustaría saber cómo funciona con un ejemplo simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada la matriz anterior, si elimino los valores de NA,...

8
Rastreo de probabilidad extraño de la cadena MCMC

Tengo un modelo que va: Single parameter -> Complex likelihood function -> Log-likelihood. Ejecuté una cadena MCMC (usando pymc) y tracé el rastro del parámetro y la probabilidad logarítmica. La estimación del parámetro terminó siendo razonable, pero el gráfico de probabilidad de registro me...

8
Entendiendo que intuitivamente

Acabo de ver esta pregunta y la maravillosa respuesta aceptada en este foro. Luego me activaron para tratar de comprender intuitivamente por qué la división de está normalizando la covarianza:SxSySxSyS_xS_y COV(X,Y)SxSy∈[−1,1]COV⁡(X,Y)SxSy∈[−1,1]\frac{\operatorname{COV}(X,Y)}{S_xS_y} \in...

8
¿Hay alguna forma de lidiar con el gradiente de desaparición para saturar las no linealidades que no involucran unidades de Normalización por lotes o ReLu?

Quería entrenar una red con no linealidades que sufren el desvanecimiento (o el problema de gradiente explosivo, aunque principalmente se desvanecen). Sé que la forma estándar (actual) es usar la normalización por lotes 1 [BN] 1 o simplemente abandonar la no linealidad y usar las unidades ReLu...