Estadísticas y Big Data

52
Agrupación con una matriz de distancia

Tengo una matriz (simétrica) Mque representa la distancia entre cada par de nodos. Por ejemplo, ABCDEFGHIJKL A 0 20 20 20 40 60 60 60100120120120 B 20 0 20 20 60 80 80 80120140140140 C 20 20 0 20 60 80 80 80120140140140 D 20 20 20 0 60 80 80 80120140140140 E 40 60 60 60 0 20 20 20 60 80 80 80 F...

52
Derivación de solución de lazo de forma cerrada

Para el problema del lazo minβ(Y−Xβ)T(Y−Xβ)minβ(Y−Xβ)T(Y−Xβ)\min_\beta (Y-X\beta)^T(Y-X\beta) tal que ∥β∥1≤t‖β‖1≤t\|\beta\|_1 \leq t . A menudo veo el resultado de umbral suave βlassoj=sgn(βLSj)(|βLSj|−γ)+βjlasso=sgn(βjLS)(|βjLS|−γ)+ \beta_j^{\text{lasso}}=...

52
¿Por qué nos importan tanto los términos de error normalmente distribuidos (y la homocedasticidad) en la regresión lineal cuando no tenemos que hacerlo?

Supongo que me siento frustrado cada vez que escucho a alguien decir que la no normalidad de los residuos y / o la heterocedasticidad viola los supuestos de OLS. Para estimar los parámetros en un modelo OLS, ninguno de estos supuestos es necesario según el teorema de Gauss-Markov. Veo cómo esto...

52
Cumming (2008) afirma que la distribución de los valores p obtenidos en las réplicas depende solo del valor p original. ¿Cómo puede ser verdad?

He estado leyendo el artículo de Geoff Cumming 2008 Replication and Intervals: los valores predicen el futuro solo vagamente, pero los intervalos de confianza funcionan mucho mejor pppppp p p[~ 200 citas en Google Scholar] , y estoy confundido por una de sus afirmaciones centrales. Este es uno de...

51
Estadísticas e inferencia causal?

En su artículo de 1984 "Estadísticas e inferencia causal" , Paul Holland planteó una de las preguntas más fundamentales en estadística: ¿Qué puede decir un modelo estadístico sobre la causalidad? Esto llevó a su lema: SIN CAUSAS SIN MANIPULACIÓN que enfatizó la importancia de las...

51
¿Cuál es un buen recurso en el diseño de mesas?

He visto varios tratamientos teóricos de gráficos, como la Gramática de Gráficos . Pero no he visto nada equivalente con respecto a las tablas. Mientras tanto, he desarrollado un modelo informal de buenas prácticas en el diseño de tablas. Sin embargo, me gustaría poder proporcionar una buena...