He preguntado sobre esto antes y realmente he estado luchando para identificar qué hace que un parámetro modelo y qué lo hace una variable latente. Mirando varios hilos sobre este tema en este sitio, la distinción principal parece ser:
Las variables latentes no se observan, pero tienen una distribución de probabilidad asociada con ellas, ya que son variables y los parámetros tampoco se observan y no tienen distribución asociada con ellas, lo que entiendo es que estas son constantes y tienen un valor fijo pero desconocido que estamos tratando de encontrar. Además, podemos poner prioridades en los parámetros para representar nuestra incertidumbre acerca de estos parámetros a pesar de que solo hay un valor verdadero asociado con ellos o al menos eso es lo que suponemos. Espero estar en lo cierto hasta ahora?
Ahora, he estado mirando este ejemplo para la regresión lineal ponderada bayesiana de un artículo de revista y he estado realmente luchando por comprender qué es un parámetro y qué es una variable:
Aquí y y se observan pero sólo y se trata como una variable es decir, tiene una distribución asociada a ella.
Ahora, los supuestos de modelado son:
Entonces, la varianza de es ponderada.
También hay una distribución previa en y w , que son distribuciones normales y gamma respectivamente.
Entonces, la probabilidad de registro completa está dada por:
Ahora, según tengo entendido, tanto como w son parámetros del modelo. Sin embargo, en el artículo siguen refiriéndose a ellos como variables latentes. Mi razonamiento es β y w son ambos parte de la distribución de probabilidad para la variable y y son parámetros del modelo. Sin embargo, los autores los tratan como variables aleatorias latentes. ¿Es eso correcto? Si es así, ¿cuáles serían los parámetros del modelo?
El documento se puede encontrar aquí ( http://www.jting.net/pubs/2007/ting-ICRA2007.pdf ).
El documento es Detección automática de valores atípicos: un enfoque bayesiano de Ting et al.
Respuestas:
En el trabajo, y en general, las variables (aleatorias) son todo lo que se extrae de una distribución de probabilidad. Las variables latentes (aleatorias) son las que no observa directamente (y se observa, β no, pero ambas son rv). De una variable aleatoria latente puede obtener una distribución posterior, que es su distribución de probabilidad condicionada a los datos observados.
Por otro lado, un parámetro es fijo, incluso si no conoce su valor. La Estimación de máxima verosimilitud, por ejemplo, le brinda el valor más probable de su parámetro. Pero te da un punto, no una distribución completa, ¡porque las cosas fijas no tienen distribuciones! (Puede poner una distribución sobre qué tan seguro está sobre este valor, o en qué rango cree que es este valor, pero esto no es lo mismo que la distribución del valor en sí, que solo existe si el valor es realmente aleatorio variable)
En esta oración:
en teoría hablan de los dos parámetros, no de los que son variables aleatorias, ya que en EM esto es lo que haces, optimizando los parámetros.
fuente