Estadísticas y Big Data

32
¿Cuál es el concepto estadístico más difícil de entender?

Esta es una pregunta similar a la de aquí , pero creo que merece la pena hacerla. Pensé que lo pondría como titular, lo que creo que es uno de los más difíciles de entender. La mía es la diferencia entre probabilidad y frecuencia . Uno está en el nivel de "conocimiento de la realidad"...

32
¿Cómo maneja R los valores perdidos en lm?

Me gustaría hacer una regresión de un vector B contra cada una de las columnas de una matriz A. Esto es trivial si no faltan datos, pero si la matriz A contiene valores faltantes, entonces mi regresión contra A está limitada a incluir solo filas donde todos los valores están presentes (el...

32
Varianza del producto de variables dependientes

¿Cuál es la fórmula para la varianza del producto de variables dependientes? En el caso de variables independientes, la fórmula es simple: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) -...

32
¿Por qué R devolvería NA como un coeficiente lm ()?

Estoy adaptando un lm()modelo a un conjunto de datos que incluye indicadores para el trimestre financiero (Q1, Q2, Q3, lo que hace que Q4 sea un valor predeterminado). Usando lm(Y~., data = data) obtengo a NAcomo coeficiente para Q3, y una advertencia de que una variable fue excluida debido a...