Podemos usar la estadística F para determinar si al menos uno de los predictores tiene un efecto en la respuesta. Pero, ¿por qué no tomar un valor p mínimo en todos los predictores? No requiere la introducción de un nuevo
Podemos usar la estadística F para determinar si al menos uno de los predictores tiene un efecto en la respuesta. Pero, ¿por qué no tomar un valor p mínimo en todos los predictores? No requiere la introducción de un nuevo
Para determinar la correlación cruzada entre Salesy Variable cost, ambos con estacionalidad mensual, ¿necesito desestacionalizar ambas
He implementado los algoritmos Viterbi y Forward , por desgracia, no puedo entender cómo funciona el algoritmo Backward . Intuitivamente siento que necesito hacer lo mismo que en Forward solo hacia atrás, usando los valores calculados durante la propagación de Forward . ¿Es correcta mi intuición?...
¿ Todos los anteriores conjugados tienen que venir de la familia exponencial? Si no, ¿qué otras familias se sabe que tienen / producen antecedentes
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . ¿Me pueden...
Defina el criterio de información bayesiano como (no dejo caer el constante, , para evitar problemas cuando se compara con la probabilidad marginal)BIC=−2⋅lnL^+k⋅(ln(n)−ln(2π))BIC=−2⋅lnL^+k⋅(ln(n)−ln(2π)) \mathrm{BIC} = {-2 \cdot \ln{\hat L} + k \cdot (\ln(n) - \ln(2 \pi))} −ln(2π)−ln(2π) -...
El aprendizaje estadístico y sus resultados están actualmente presentes en las ciencias sociales. Hace un par de meses, Guido Imbens dijo: "LASSO es el nuevo OLS". Estudié Machine Learning un poco y sé que su objetivo principal es la predicción. También estoy de acuerdo con la distinción de Leo...
Estoy probando la optimización bayesiana, siguiendo a Snoek, Larochelle y Adams [ http://arxiv.org/pdf/1206.2944.pdf] , usando GPML [ http://www.gaussianprocess.org/gpml/code/matlab / doc /] . Implementé la función de adquisición Mejora esperada que se describe en la página 3, y supongo que estoy...
Estoy evaluando un artículo de revista sobre sus interacciones estadísticas. El artículo está tratando de establecer una relación entre un control menos estricto de la presión arterial y la progresión a hipertensión severa. Sospecha que la hipertensión preexistente es un factor pronóstico (dado...
He estado estudiando la teoría detrás de ANNs últimamente y quería entender la 'magia' detrás de su capacidad de clasificación no lineal de múltiples clases. Esto me llevó a este sitio web que hace un buen trabajo al explicar geométricamente cómo se logra esta aproximación. Así es como lo entendí...
Estoy tratando de entender cómo funciona la matriz de covarianza . Supongamos que tenemos dos variables:X, YX,YX, Y, dónde Cov(X,Y)=E[(x−E[X])(y−E[Y])]Cov(X,Y)=E[(x−E[X])(y−E[Y])]\text{Cov}(X,Y) = \mathbb{E}[(x -\mathbb{E}[X])(y-\mathbb{E}[Y])] da la relación entre las variables, es decir, cuánto...
Tengo un conjunto de valores xi,i=1,…,Nxi,i=1,…,N{x_i}, i=1, \dots ,N de los cuales calculo la mediana M. Me preguntaba cómo podría calcular el error en esta estimación. En la red descubrí que se puede calcular como 1.2533σN√1.2533σN1.2533\frac{\sigma}{\sqrt{N}} dónde σσ\sigmaes la desviación...
Se sabe que al construir un árbol de decisión, dividimos la variable de entrada exhaustivamente y encontramos la "mejor" división por enfoque de prueba estadística o enfoque de función de impureza. Mi pregunta es cuando usamos una variable continua como la variable de entrada (solo unos pocos...
Tengo una serie temporal binaria: tenemos 2160 datos (0 = no sucedió, 1 = sucedió) por un período de una hora en 90 días. Quiero pronosticar después de estos 90 días, dónde ocurrirá el próximo 1, y también extender esta disposición para el próximo
Dada una probabilidad gaussiana para una muestra como con siendo el espacio de parámetros y , parametrizaciones arbitrarias del vector medio y la matriz de covarianza.yyyp ( yEl | θ)= N( y; μ ( θ ) , Σ ( θ ) )p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) = \mathcal{N}(y;\mu(\theta),\Sigma(\theta))ΘΘ\Thetaμ ( θ...
Parece que ambos procesos se usan para estimar el valor máximo de una función desconocida, y ambos obviamente tienen diferentes formas de hacerlo. Pero en la práctica, ¿cualquier método es esencialmente intercambiable? ¿Dónde me gustaría usar uno sobre el
Casella y Berger establecen el Teorema de Basu (Th 6.2.24) de la siguiente manera: Si es una estadística completa y mínimamente suficiente, entonces es independiente de cada estadística auxiliar.T(X)T(X)T(X)T(X)T(X)T(X) Sin embargo, en la conferencia, vi una prueba del teorema que solo usaba...
La tasa de descubrimiento falso (Benjamini-Hochberg) se usa generalmente en 'Big Data', como los estudios genéticos que utilizan cientos de pruebas. ¿Pero también se puede usar en un número menor de pruebas? Por ejemplo, observando los resultados de dos grupos (hombres frente a mujeres) en, por...
Estoy ajustando algunos modelos aditivos generalizados usando el mgcvpaquete en R, y quiero probar entre dos modelos; si puedo eliminar un término o no. Sin embargo, estoy obteniendo resultados contradictorios (por lo que puedo decir). Un modelo, m1con un término suave para xagregar, parece dar un...
Tengo un problema que se reduce a bolas en las urnas (en realidad se trata de alelos alternativos y de referencia en las poblaciones). Supongamos que tengo una urna grande bien mezclada (sorteos iid) que puede contener dos colores de bolas: aguamarina y azul huevo de petirrojo ( a y r...