En el algoritmo de modelo de tema LDA, vi esta suposición. Pero no sé por qué eligió la distribución Dirichlet? No sé si podemos usar la distribución uniforme sobre Multinomial como un
Una distribución a priori en la estadística bayesiana que es tal que, cuando se combina con la probabilidad, el posterior resultante es de la misma familia de distribuciones.
En el algoritmo de modelo de tema LDA, vi esta suposición. Pero no sé por qué eligió la distribución Dirichlet? No sé si podemos usar la distribución uniforme sobre Multinomial como un
Sé que la distribución beta es conjugado a la binomial. Pero, ¿qué es el conjugado antes de la beta?
He estado tratando de entender la idea de conjugar los antecedentes en las estadísticas bayesianas por un tiempo, pero simplemente no lo entiendo. ¿Alguien puede explicar la idea en los términos más simples posibles, quizás utilizando el "previo gaussiano" como
Algunas distribuciones tienen anteriores conjugados y otras no. ¿Es esta distinción solo un accidente? Es decir, usted hace los cálculos y funciona de una forma u otra, pero en realidad no le dice nada importante sobre la distribución, excepto por el hecho en sí ¿O la presencia o ausencia de un...
¿Cómo hacemos para calcular un posterior con un N ~ anterior (a, b) después de observar n puntos de datos? Supongo que tenemos que calcular la media muestral y la varianza de los puntos de datos y hacer algún tipo de cálculo que combine lo posterior con lo anterior, pero no estoy muy seguro de cómo...
¿Existe un conjugado previo para la distribución de Laplace ? Si no, ¿existe una expresión de forma cerrada conocida que se aproxime a la posterior para los parámetros de la distribución de Laplace? He buscado mucho en Google sin éxito, así que mi suposición actual es "no" en las preguntas...
Al inferir la matriz de precisión ΛΛ\boldsymbol{\Lambda} de una distribución normal utilizada para generar NNN vectores dimensionales D x1,..,xNx1,..,xN\mathbf{x_1},..,\mathbf{x_N} xi∼N(μ,Λ−1)xi∼N(μ,Λ−1)\begin{align} \mathbf{x_i} &\sim \mathcal{N}(\boldsymbol{\mu, \Lambda^{-1}}) \\ \end{align}...
Además de la usabilidad, ¿hay alguna justificación epistémica (matemática, filosófica, heurística, etc.) para usar los conjugados anteriores? ¿O se debe principalmente a que suele ser una aproximación lo suficientemente buena y hace las cosas mucho más
Lo siguiente es un extracto de la Introducción a las estadísticas bayesianas de Bolstad . Para todos los expertos, esto puede ser trivial, pero no entiendo cómo el autor concluye que no tenemos que hacer ninguna integración para calcular la probabilidad posterior de algún valor de . Entiendo la...
¿Los estimadores de Bayes son inmunes al sesgo de selección? La mayoría de los artículos que discuten la estimación en alta dimensión, por ejemplo, datos de secuencia del genoma completo, a menudo plantean el problema del sesgo de selección. El sesgo de selección surge del hecho de que, aunque...
Ejemplos: Tengo una oración en la descripción del trabajo: "Ingeniero senior de Java en el Reino Unido". Quiero usar un modelo de aprendizaje profundo para predecirlo en 2 categorías: English y IT jobs. Si uso el modelo de clasificación tradicional, solo puede predecir 1 etiqueta con...
Dado que la estimación posterior de de una probabilidad normal y una gamma inversa antes de es:σ′2σ′2\sigma'^{2}σ2σ2\sigma^2 σ′2∼IG(α+n2,β+∑ni=1(yi−μ)22)σ′2∼IG(α+n2,β+∑i=1n(yi−μ)22)\sigma'^{2}\sim\textrm{IG}\left(\alpha + \frac{n}{2}, \beta +\frac{\sum_{i=1}^n{(y_i-\mu)^2}}{2}\right) que es...
La función de probabilidad de una distribución lognormal es: F( x ; μ , σ) ∝∏norteyo11σXyoExp( -( lnXyo- μ)22σ2)F(X;μ,σ)∝∏yo1norte1σXyoExp(-(EnXyo-μ)22σ2)f(x; \mu, \sigma) \propto \prod_{i_1}^n \frac{1}{\sigma x_i} \exp \left ( - \frac{(\ln{x_i} - \mu)^2}{2 \sigma^2} \right ) y el Prior de...
Tengo una pregunta sobre la mezcla de anteriores conjugados. Aprendí y digo la mezcla de anteriores conjugados un par de veces cuando estoy aprendiendo bayesiano. Me pregunto por qué este teorema es tan importante, cómo lo aplicaremos cuando hagamos un análisis bayesiano. Para ser más específicos,...
¿ Todos los anteriores conjugados tienen que venir de la familia exponencial? Si no, ¿qué otras familias se sabe que tienen / producen antecedentes
Dada una probabilidad gaussiana para una muestra como con siendo el espacio de parámetros y , parametrizaciones arbitrarias del vector medio y la matriz de covarianza.yyyp ( yEl | θ)= N( y; μ ( θ ) , Σ ( θ ) )p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) = \mathcal{N}(y;\mu(\theta),\Sigma(\theta))ΘΘ\Thetaμ ( θ...