Estadísticas y Big Data

9
La fórmula de Doane para la agrupación de histogramas

Estoy implementando varios algoritmos para estimar el mejor número de contenedores para usar en histogramas. La mayoría de los que estoy implementando se describen en la página "Histograma" de Wikipedia en la sección " Número de contenedores y ancho " *. Estoy atrapado en un problema con la...

9
Navaja de Occam obsoleta?

Vi los libros de Vapnik sobre aprendizaje estadístico ... Leí los primeros capítulos. De todos modos, lo que más me sorprendió fue que pensó que la navaja de afeitar de Occam era obsoleta. Pensé que estaba relacionado con la situación en la que asumir una dimensión más alta mejora...

9
Tipo III sumas de cuadrados

Tengo un modelo de regresión lineal con una variable categórica (macho y hembra) y una variable continua B .UNAUNAAsisiB Configuré códigos de contrastes en R con options(contrasts=c("contr.sum","contr.poly")). Y ahora tengo sumas de cuadrados de Tipo III para , B y su interacción (A: B) usando...

9
Teorema de Gauss-Markov: AZUL y OLS

Estoy leyendo el teorema de Guass-Markov en Wikipedia , y esperaba que alguien pudiera ayudarme a descubrir el punto principal del teorema. Suponemos un modelo lineal, en forma de matriz, está dada por: y que estamos buscando la BLUE, β .y=Xβ+ηy=Xβ+η y = X\beta +\eta βˆβ^ \widehat\beta De...

9
Significado de correlación parcial

De Wikipedia Formalmente, la correlación parcial entre e dado un conjunto de variables de control , escrita ρ_ {XY · Z} , es la correlación entre los residuos RX y RY resultantes de regresión lineal de X con Z y de Y con Z , respectivamente.XXXYYYnnnZ={Z1,Z2,…,Zn}Z={Z1,Z2,…,Zn}Z = \{Z_1, Z_2, …,...