Estadísticas y Big Data

12
k-medias || también conocido como K-Means escalable ++

Bahman Bahmani y col. introdujo k-means ||, que es una versión más rápida de k-means ++. Este algoritmo está tomado de la página 4 de su artículo , Bahmani, B., Moseley, B., Vattani, A., Kumar, R. y Vassilvitskii, S. (2012). Escalable k-significa ++. Actas de la Fundación VLDB , 5 (7),...

12
¿Cuándo es útil MCMC?

Tengo problemas para comprender en qué situación el enfoque MCMC es realmente útil. Estoy revisando un ejemplo de juguete del libro de Kruschke "Haciendo análisis de datos bayesianos: un tutorial con R y BUGS". Lo que entendí hasta ahora es que necesitamos una distribución objetivo que sea...

12
Dimensión VC de modelos de regresión

En la serie de conferencias Aprendiendo de los datos , el profesor menciona que la dimensión VC mide la complejidad del modelo sobre cuántos puntos puede romper un modelo dado. Por lo tanto, esto funciona perfectamente para los modelos de clasificación en los que podríamos decir de N puntos si el...

12
Cuantificación de similitudes entre dos conjuntos de datos

Resumen : intentar encontrar el mejor método resume la similitud entre dos conjuntos de datos alineados con un solo valor. Detalles : Mi pregunta se explica mejor con un diagrama. Los gráficos a continuación muestran dos conjuntos de datos diferentes, cada uno con valores etiquetados nfy nr. Los...

12
Variación de la estadística

La de Cohen es una de las formas más comunes en que medimos el tamaño de un efecto ( ver Wikipedia ). Simplemente mide la distancia entre dos medias en términos de la desviación estándar agrupada. ¿Cómo podemos derivar la fórmula matemática de la estimación de la varianza de la de Cohen ?...

12
¿Cuál es el nombre del método de estimación de densidad donde se usan todos los pares posibles para crear una distribución de mezcla Normal?

Acabo de pensar en una forma ordenada (no necesariamente buena) de crear estimaciones de densidad unidimensionales y mi pregunta es: ¿Este método de estimación de densidad tiene un nombre? Si no, ¿es un caso especial de algún otro método en la literatura? Aquí está el método: Tenemos un vector...