¿Es cierto que para dos variables aleatorias y ,AAABBB E(A∣B)=E(B∣A)E(A)E(B)?E(A∣B)=E(B∣A)E(A)E(B)?E(A\mid B)=E(B\mid
¿Es cierto que para dos variables aleatorias y ,AAABBB E(A∣B)=E(B∣A)E(A)E(B)?E(A∣B)=E(B∣A)E(A)E(B)?E(A\mid B)=E(B\mid
A menudo se argumenta que el marco bayesiano tiene una gran ventaja en la interpretación (más frecuente), porque calcula la probabilidad de un parámetro dados los datos - lugar de como en el marco frecuentista. Hasta aquí todo bien.p(θ|x)p(θ|x)p(\theta|x)p(x|θ)p(x|θ)p(x|\theta) Pero, toda la...
¿Alguien sabe en qué año MCMC se convirtió en un lugar común (es decir, un método popular para la inferencia bayesiana)? Un enlace a la cantidad de artículos publicados de MCMC (revista) a lo largo del tiempo sería especialmente
Tengo muchas ganas de aprender sobre las técnicas bayesianas, así que he estado tratando de enseñarme un poco. Sin embargo, estoy teniendo dificultades para ver cuando el uso de técnicas bayesianas confiere una ventaja sobre los métodos frequentistas. Por ejemplo: he visto en la literatura un poco...
Mi comprensión del debate bayesiano vs frecuentista es que las estadísticas frecuentistas: es (o pretende ser) objetivo o al menos imparcial así que diferentes investigadores, utilizando diferentes supuestos aún pueden obtener resultados cuantitativamente comparables mientras que las...
Esta es una pregunta muy simple, pero no puedo encontrar la derivación en ningún lugar de Internet o en un libro. Me gustaría ver la derivación de cómo un Bayesiano actualiza una distribución normal multivariada. Por ejemplo: imagina que P(x|μ,Σ)P(μ)==N(μ,Σ)N(μ0,Σ0).P(x|μ,Σ)=N(μ,Σ)P(μ)=N(μ0,Σ0)....
En la literatura, a veces me atonto la observación, que elegir los antecedentes que dependen de los datos en sí (por ejemplo, Zellners g-prior) puede ser criticado desde un punto de vista teórico. ¿Dónde está exactamente el problema si lo anterior no se elige independientemente de los...
¿Qué es un buen libro sobre filosofía bayesiana, que compara subjetivistas contra objetivistas, que explica la visión de la probabilidad como estado de conocimiento en las estadísticas bayesianas, etc.? ¿Quizás el libro de Savage? Al principio pensé que Berger (1986) podría funcionar, pero no es...
Bloqueado . Esta pregunta y sus respuestas están bloqueadas porque la pregunta está fuera de tema pero tiene un significado histórico. Actualmente no acepta nuevas respuestas o interacciones. Compré este libro: Cómo medir cualquier cosa: encontrar el valor de los...
Estoy buscando un buen tutorial sobre la agrupación de datos al Rusar el proceso de dirichlet jerárquico (HDP) (uno de los métodos bayesianos no paramétricos recientes y populares). Hay DPpackage(en mi humilde opinión, el más completo de todos los disponibles) en Rel análisis bayesiano no...
¿Alguien ha escrito una breve encuesta sobre los diversos enfoques de las estadísticas? Para una primera aproximación, tiene estadísticas frecuentistas y bayesianas. Pero cuando miras más de cerca, también tienes otros enfoques como Bayes probabilista y empírico. Y luego tienes subdivisiones dentro...
Mi comprensión del algoritmo es la siguiente: Ningún muestreador de giro en U (NUTS) es un método hamiltoniano de Monte Carlo. Esto significa que no es un método de la cadena de Markov y, por lo tanto, este algoritmo evita la parte de la caminata aleatoria, que a menudo se considera ineficiente y...
Estaba leyendo acerca de Jeffreys antes en la wikipedia: Jeffreys Prior y vi que después de cada ejemplo, describe cómo una transformación estabilizadora de la varianza convierte a Jeffreys prior en un uniforme previo. Como ejemplo, para el caso de Bernoulli, establece que para una moneda con cara...
Con un previo plano, coinciden los estimadores ML (frecuentista - máxima verosimilitud) y MAP (Bayesiano - máximo a posteriori). Sin embargo, en términos más generales, estoy hablando de estimadores puntuales derivados como optimizadores de alguna función de pérdida. Es decir (Bayesiano) x...
¿Cómo hacemos para calcular un posterior con un N ~ anterior (a, b) después de observar n puntos de datos? Supongo que tenemos que calcular la media muestral y la varianza de los puntos de datos y hacer algún tipo de cálculo que combine lo posterior con lo anterior, pero no estoy muy seguro de cómo...
Cuando se usa el modelado de temas (Asignación de Dirichlet latente), el número de temas es un parámetro de entrada que el usuario debe especificar. ¿Me parece que también deberíamos proporcionar una colección de conjunto de temas candidatos que el proceso de Dirichlet tiene que probar? ¿Es...
Se estima que los estimadores de regresión penalizados como LASSO y ridge corresponden a estimadores bayesianos con ciertos antecedentes. Supongo (como no sé lo suficiente sobre las estadísticas bayesianas) que para un parámetro de ajuste fijo, existe un previo concreto correspondiente. Ahora un...
Robby McKilliam dice en un comentario a esta publicación: Cabe señalar que, desde el punto de vista de los frecuentistas, no hay razón para que no pueda incorporar el conocimiento previo al modelo. En este sentido, la vista frecuentista es más simple, solo tiene un modelo y algunos datos. No es...
Si tenemos un tamaño de muestra pequeño, ¿influirá mucho la distribución previa en la distribución
Actualmente trato de entender el Principio de Probabilidad y francamente no lo entiendo en absoluto. Por lo tanto, escribiré todas mis preguntas como una lista, incluso si esas podrían ser preguntas bastante básicas. ¿Qué significa exactamente la frase "toda la información" en el contexto de este...