Estadísticas y Big Data

23
Análisis forense estadístico: Benford y más allá

¿Qué métodos generales existen para detectar fraudes, anomalías, falsificaciones, etc. en trabajos científicos producidos por un tercero? (El reciente asunto de Marc Hauser me motivó a preguntar esto ). Por lo general, por fraude electoral y contable, se cita alguna variante de la Ley de Benford ....

23
¿Cuál es la diferencia entre PCA y PCA asintótica?

En dos artículos en 1986 y 1988 , Connor y Korajczyk propusieron un enfoque para modelar los rendimientos de los activos. Dado que estas series de tiempo generalmente tienen más activos que las observaciones de períodos de tiempo, propusieron realizar un PCA en covarianzas transversales de...

23
¿Por qué desglosar el denominador en el Teorema de Bayes?

(Soy un novato en las estadísticas. Soy matemático y programador y estoy tratando de construir algo así como un ingenuo filtro de spam bayesiano). He notado en muchos lugares que las personas tienden a descomponer el denominador en la ecuación del Teorema de Bayes. Entonces, en lugar de...

23
Establecer nudos en splines cúbicos naturales en R

Tengo datos con muchas funciones correlacionadas, y quiero comenzar reduciendo las funciones con una función de base suave, antes de ejecutar un LDA. Estoy tratando de usar splines cúbicas naturales en el splinespaquete con la nsfunción. ¿Cómo hago para asignar los nudos? Aquí está el código R...

23
Bibliotecas C ++ para computación estadística

Tengo un algoritmo MCMC particular que me gustaría portar a C / C ++. Gran parte del cálculo costoso ya está en C a través de Cython, pero quiero tener todo el muestreador escrito en un lenguaje compilado para poder escribir envoltorios para Python / R / Matlab / lo que sea. Después de hurgar, me...