¿Cuál es la diferencia de significado entre la notación y que se usan comúnmente en muchos libros y documentos?P
probability
notation
Aprendiz
fuente
fuente
Respuestas:
Creo que el origen de esto es el paradigma de probabilidad (aunque no he verificado la corrección histórica real de lo siguiente, es una forma razonable de entender cómo surgió).
Digamos que en una configuración de regresión, tendrías una distribución: p (Y | x, beta) Lo que significa: la distribución de Y si conoces (condicionalmente) los valores de x y beta.
Si desea estimar las betas, desea maximizar la probabilidad: L (beta; y, x) = p (Y | x, beta) Esencialmente, ahora está viendo la expresión p (Y | x, beta) como una función de los beta, pero aparte de eso, no hay diferencia (para las expresiones matemáticas correctas que puede derivar correctamente, esto es una necesidad, aunque en la práctica nadie se molesta).
Luego, en la configuración bayesiana, la diferencia entre los parámetros y otras variables pronto se desvanece, por lo que uno comenzó a usar ambas anotaciones entremezcladas.
Entonces, en esencia: no existe una diferencia real: ambos indican la distribución condicional de la cosa a la izquierda, condicional a la (s) cosa (s) a la derecha.
fuente
X x θ f ( x , θ ) X Θ ( x , θ ) Θ f ( x | θ ) X Θ Θf(x;θ) es la densidad de la variable aleatoria en el punto , siendo el parámetro de la distribución. es la densidad conjunta de y en el punto y solo tiene sentido si es una variable aleatoria. es la distribución condicional de dada , y nuevamente, solo tiene sentido si es una variable aleatoria. Esto se volverá mucho más claro cuando profundice en el libro y observe el análisis bayesiano.X x θ f(x,θ) X Θ (x,θ) Θ f(x|θ) X Θ Θ
fuente
fuente
Aunque no siempre ha sido así, en estos días generalmente se usa cuando no son variables aleatorias (lo que no quiere decir que sean conocidas, necesariamente). indica condicionamiento en los valores de . El condicionamiento es una operación en variables aleatorias y, como tal, usar esta notación cuando no son variables aleatorias es confuso (y trágicamente común).d , w P ( z | d , w ) d , w d , wP(z;d,w) d,w P(z|d,w) d,w d,w
Como @Nick Sabbe señala es una notación común para la distribución de muestreo de los datos observados . Algunos frecuentistas usarán esta notación pero insisten en que no es una variable aleatoria, lo cual es un abuso de la OMI. Pero no tienen el monopolio allí; También he visto a bayesianos hacerlo, añadiendo hiperparámetros fijos al final de los condicionales.y Θp(y|X,Θ) y Θ
fuente