Estadísticas y Big Data

18
¿Separación de fuente ciega de mezcla convexa?

Supongamos que tengo nnn fuentes independientes, X1,X2,...,XnX1,X2,...,XnX_1, X_2, ..., X_n y observo mmm mezclas convexas: Y1...Ym=a11X1+a12X2+⋯+a1nXn=am1X1+am2X2+⋯+amnXnY1=a11X1+a12X2+⋯+a1nXn...Ym=am1X1+am2X2+⋯+amnXn\begin{align} Y_1 &= a_{11}X_1 + a_{12}X_2 + \cdots + a_{1n}X_n\\ ...&\\ Y_m &=...

18
No transitividad de la correlación: correlaciones entre el género y el tamaño del cerebro y entre el tamaño del cerebro y el coeficiente intelectual, pero no hay correlación entre el género y el coeficiente intelectual

Encontré una siguiente explicación en un blog y me gustaría obtener más información sobre la no transitividad de la correlación: Tenemos los siguientes hechos indiscutibles: En promedio, hay una diferencia en el volumen cerebral entre hombres y mujeres. Existe una correlación entre el...

18
En la prueba exacta de Fisher: ¿Qué prueba hubiera sido apropiada si la mujer no hubiera sabido el número de tazas de leche primero?

En el famoso experimento de degustación de té de dama por RA Fisher, se informa a la dama de cuántas tazas de leche primero / té primero hay (4 por cada una de las 8 tazas). Esto respeta el supuesto total marginal fijo de la prueba exacta de Fisher. Estaba imaginando hacer esta prueba con mi...

18
Usando bootstrap bajo H0 para realizar una prueba para la diferencia de dos medios: reemplazo dentro de los grupos o dentro de la muestra agrupada

Supongamos que tengo datos con dos grupos independientes: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50,...

18
¿Significado en lenguaje sencillo de pruebas "dependientes" e "independientes" en la literatura de comparaciones múltiples?

Tanto en la literatura de la tasa de error familiar (FWER) como de la tasa de descubrimiento falso (FDR), se dice que métodos particulares para controlar FWER o FDR son apropiados para pruebas dependientes o independientes. Por ejemplo, en el artículo de 1979 "Un procedimiento de prueba múltiple...

18
Posicionar las flechas en un biplot PCA

Estoy buscando implementar un biplot para el análisis de componentes principales (PCA) en JavaScript. Mi pregunta es, ¿cómo determino las coordenadas de las flechas a partir de la salida U,V,DU,V,DU,V,D de la descomposición vectorial singular (SVD) de la matriz de datos? Aquí hay un ejemplo de...

18
Suavizado: ¿cuándo usarlo y cuándo no?

Hay una publicación bastante antigua en el blog de William Briggs que analiza las trampas de suavizar datos y llevarlos a análisis. El argumento clave es a saber: Si, en un momento de locura, suaviza los datos de series de tiempo y los utiliza como entrada para otros análisis, ¡aumenta...