Estadísticas y Big Data

11
¿Cuáles son los pros y los contras de aplicar información mutua puntual en una matriz de coincidencia de palabras antes de SVD?

Una forma de generar incrustaciones de palabras es la siguiente ( espejo ): Obtenga un corpus, por ejemplo, "Me gusta volar. Me gusta la PNL. Me gusta el aprendizaje profundo". Construya la matriz de concordancia de palabras a partir de ella: Realice SVD en y mantenga las primeras columnas...

11
¿Cómo interpretar el coeficiente de la segunda etapa en la regresión de variables instrumentales con un instrumento binario y una variable endógena binaria?

(publicación bastante larga, lo siento. Incluye mucha información de fondo, así que no dudes en pasar a la pregunta en la parte inferior). Introducción: estoy trabajando en un proyecto en el que intentamos identificar el efecto de una variable endógena binaria, , en un resultado continuo, y . Se...

11
Aproximación

Estaba leyendo casualmente un artículo (en economía) que tenía la siguiente aproximación para :log(E(X))log⁡(E(X))\log(E(X)) log(E(X))≈E(log(X))+0.5var(log(X))log⁡(E(X))≈E(log⁡(X))+0.5var(log⁡(X))\log(E(X)) \approx E(\log(X))+0.5 \mathrm{var}(\log(X)) , lo que el autor dice que es exacto si X es...