Estadísticas y Big Data

8

¿Por qué usar la estadística F?

Podemos usar la estadística F para determinar si al menos uno de los predictores tiene un efecto en la respuesta. Pero, ¿por qué no tomar un valor p mínimo en todos los predictores? No requiere la introducción de un nuevo

f-statistic

8

Correlación cruzada entre dos series estacionales

Para determinar la correlación cruzada entre Salesy Variable cost, ambos con estacionalidad mensual, ¿necesito desestacionalizar ambas

time-series seasonality cross-correlation

8

Explicar el algoritmo hacia atrás para el modelo oculto de Markov

He implementado los algoritmos Viterbi y Forward , por desgracia, no puedo entender cómo funciona el algoritmo Backward . Intuitivamente siento que necesito hacer lo mismo que en Forward solo hacia atrás, usando los valores calculados durante la propagación de Forward . ¿Es correcta mi intuición?...

markov-process hidden-markov-model viterbi-algorithm

8

Aparte de la familia exponencial, ¿de dónde más pueden venir los conjugados anteriores?

¿ Todos los anteriores conjugados tienen que venir de la familia exponencial? Si no, ¿qué otras familias se sabe que tienen / producen antecedentes

bayesian conjugate-prior

8

Ejemplos concretos de un enfoque frecuentista que es superior a uno bayesiano [cerrado]

Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . ¿Me pueden...

bayesian frequentist

8

¿Se puede usar BIC para pruebas de hipótesis?

Defina el criterio de información bayesiano como (no dejo caer el constante, , para evitar problemas cuando se compara con la probabilidad marginal)BIC=−2⋅lnL^+k⋅(ln(n)−ln(2π))BIC=−2⋅ln⁡L^+k⋅(ln⁡(n)−ln⁡(2π)) \mathrm{BIC} = {-2 \cdot \ln{\hat L} + k \cdot (\ln(n) - \ln(2 \pi))} −ln(2π)−ln⁡(2π) -...

hypothesis-testing bayesian bic

8

¿Cuáles son las ventajas y desventajas de emplear LASSO para el análisis causal?

El aprendizaje estadístico y sus resultados están actualmente presentes en las ciencias sociales. Hace un par de meses, Guido Imbens dijo: "LASSO es el nuevo OLS". Estudié Machine Learning un poco y sé que su objetivo principal es la predicción. También estoy de acuerdo con la distinción de Leo...

machine-learning lasso causality

8

detalle de implementación práctica de la optimización bayesiana

Estoy probando la optimización bayesiana, siguiendo a Snoek, Larochelle y Adams [ http://arxiv.org/pdf/1206.2944.pdf] , usando GPML [ http://www.gaussianprocess.org/gpml/code/matlab / doc /] . Implementé la función de adquisición Mejora esperada que se describe en la página 3, y supongo que estoy...

gaussian-process optimization bayesian-optimization

8

Una interacción estadística es significativa, pero el autor la niega. ¿Por qué?

Estoy evaluando un artículo de revista sobre sus interacciones estadísticas. El artículo está tratando de establecer una relación entre un control menos estricto de la presión arterial y la progresión a hipertensión severa. Sospecha que la hipertensión preexistente es un factor pronóstico (dado...

interaction odds

8

¿Cómo entender la intuición geométrica del funcionamiento interno de las redes neuronales?

He estado estudiando la teoría detrás de ANNs últimamente y quería entender la 'magia' detrás de su capacidad de clasificación no lineal de múltiples clases. Esto me llevó a este sitio web que hace un buen trabajo al explicar geométricamente cómo se logra esta aproximación. Así es como lo entendí...

machine-learning neural-networks approximation intuition function

8

Covarianza para tres variables.

Estoy tratando de entender cómo funciona la matriz de covarianza . Supongamos que tenemos dos variables:X, YX,YX, Y, dónde Cov(X,Y)=E[(x−E[X])(y−E[Y])]Cov(X,Y)=E[(x−E[X])(y−E[Y])]\text{Cov}(X,Y) = \mathbb{E}[(x -\mathbb{E}[X])(y-\mathbb{E}[Y])] da la relación entre las variables, es decir, cuánto...

correlation covariance moments

8

Intervalo de confianza para la mediana

Tengo un conjunto de valores xi,i=1,…,Nxi,i=1,…,N{x_i}, i=1, \dots ,N de los cuales calculo la mediana M. Me preguntaba cómo podría calcular el error en esta estimación. En la red descubrí que se puede calcular como 1.2533σN√1.2533σN1.2533\frac{\sigma}{\sqrt{N}} dónde σσ\sigmaes la desviación...

standard-deviation bootstrap standard-error median

8

Árbol de decisión con variable de entrada continua

Se sabe que al construir un árbol de decisión, dividimos la variable de entrada exhaustivamente y encontramos la "mejor" división por enfoque de prueba estadística o enfoque de función de impureza. Mi pregunta es cuando usamos una variable continua como la variable de entrada (solo unos pocos...

cart

8

Series de tiempo binario

Tengo una serie temporal binaria: tenemos 2160 datos (0 = no sucedió, 1 = sucedió) por un período de una hora en 90 días. Quiero pronosticar después de estos 90 días, dónde ocurrirá el próximo 1, y también extender esta disposición para el próximo

time-series binary-data

8

Probabilidad gaussiana + which prior = Gaussian Marginal?

Dada una probabilidad gaussiana para una muestra como con siendo el espacio de parámetros y , parametrizaciones arbitrarias del vector medio y la matriz de covarianza.yyyp ( yEl | θ)= N( y; μ ( θ ) , Σ ( θ ) )p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) = \mathcal{N}(y;\mu(\theta),\Sigma(\theta))ΘΘ\Thetaμ ( θ...

normal-distribution mixed-model prior marginal conjugate-prior

8

¿Cuál es la diferencia entre la optimización bayesiana (procesos gaussianos) y el recocido simulado en la práctica

Parece que ambos procesos se usan para estimar el valor máximo de una función desconocida, y ambos obviamente tienen diferentes formas de hacerlo. Pero en la práctica, ¿cualquier método es esencialmente intercambiable? ¿Dónde me gustaría usar uno sobre el

optimization maximum bayesian-optimization

8

¿El teorema de Basu requiere una suficiencia mínima?

Casella y Berger establecen el Teorema de Basu (Th 6.2.24) de la siguiente manera: Si es una estadística completa y mínimamente suficiente, entonces es independiente de cada estadística auxiliar.T(X)T(X)T(X)T(X)T(X)T(X) Sin embargo, en la conferencia, vi una prueba del teorema que solo usaba...

sufficient-statistics

8

¿Corrección para pruebas múltiples en un número modesto de pruebas (10-20) con FDR?

La tasa de descubrimiento falso (Benjamini-Hochberg) se usa generalmente en 'Big Data', como los estudios genéticos que utilizan cientos de pruebas. ¿Pero también se puede usar en un número menor de pruebas? Por ejemplo, observando los resultados de dos grupos (hombres frente a mujeres) en, por...

multiple-comparisons small-sample false-discovery-rate

8

Interpretación de los resultados del modelo gam.

Estoy ajustando algunos modelos aditivos generalizados usando el mgcvpaquete en R, y quiero probar entre dos modelos; si puedo eliminar un término o no. Sin embargo, estoy obteniendo resultados contradictorios (por lo que puedo decir). Un modelo, m1con un término suave para xagregar, parece dar un...

r regression gam

8

¿Todas las bolas de la urna son del mismo color (cuando no se pueden ver con claridad)

Tengo un problema que se reduce a bolas en las urnas (en realidad se trata de alelos alternativos y de referencia en las poblaciones). Supongamos que tengo una urna grande bien mezclada (sorteos iid) que puede contener dos colores de bolas: aguamarina y azul huevo de petirrojo ( a y r...

hypothesis-testing