Estadísticas y Big Data

10
Elegir el número de componentes principales para retener

Un método que me sugirieron es mirar un diagrama de pantalla y verificar el "codo" para determinar la cantidad correcta de PC a usar. Pero si el gráfico no está claro, ¿tiene R un cálculo para determinar el número? fit <- princomp(mydata,

10
Modelo de Dirichlet multinomial con distribución hiperprior en los parámetros de concentración.

Trataré de describir el problema en cuestión de la manera más general posible. Estoy modelando observaciones como una distribución categórica con un vector de probabilidad de parámetro theta. Entonces, supongo que el vector de parámetros theta sigue una distribución previa de Dirichlet con los...

10
Valor esperado de una variable aleatoria gaussiana transformada con una función logística

Tanto la función logística como la desviación estándar generalmente se denotan como σσ\sigma . Voy a usar σ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x)) y sss para la desviación estándar. Tengo una neurona logística con una entrada aleatoria cuya media μμ\mu y desviación estándar...

10
Modelo de ajuste para dos distribuciones normales en PyMC

Como soy un ingeniero de software que intenta obtener más estadísticas, tendrás que perdonarme incluso antes de que comience, este es un nuevo territorio serio ... He estado aprendiendo PyMC y trabajando con algunos ejemplos muy (muy) simples. Un problema con el que no puedo trabajar (y no puedo...

10
Influencial residual vs. atípico

Primero, debo decir que he buscado en este sitio la respuesta. No encontré una pregunta que respondiera a mi pregunta o mi nivel de conocimiento es tan bajo que no me di cuenta de que ya leí la respuesta. Estoy estudiando para el Examen de Estadística AP. Tengo que aprender la regresión lineal y...