Estadísticas y Big Data

9
Comprender los bigotes de un diagrama de caja

Tengo una pregunta sobre la interpretación de los bigotes de un diagrama de caja. He leído lo siguiente: "En la parte superior e inferior del rectángulo, los" bigotes "muestran el rango de 1,5 veces la distancia entre los cuantiles de 0,25 y 0,75", pero no entiendo completamente lo que se entiende...

9
Regresión al rompecabezas malo

En el capítulo "Regresión a la media" de "Pensamiento, rápido y lento" de Daniel Kahneman, se da un ejemplo y se le pide al lector que pronostique las ventas de tiendas individuales dado el pronóstico general de ventas y los números de ventas del año anterior . Por ejemplo (el ejemplo del libro...

9
Elección de clústeres para k-means: el caso de 1 clúster

¿Alguien sabe un buen método para determinar si la agrupación utilizando kmeans es incluso apropiada? Es decir, ¿qué pasa si su muestra es realmente homogénea? Sé que algo así como un modelo de mezcla (a través de mclust en R) proporcionará estadísticas de ajuste para el caso de clúster 1: k, pero...

9
Regresión a través del origen.

Tenemos los siguientes puntos: ¿Cómo podemos encontrar la mejor línea de ajuste través de los puntos? Mi calculadora tiene la opción de encontrar la mejor línea de ajuste través de estos puntos, que es:( 0 , 0 ) ( 1 , 51.8 ) ( 1.9 , 101.3 ) ( 2.8 , 148.4 ) ( 3.7 , 201.5 ) ( 4.7 , 251.1 )( 5.6 ,...