Covarianza en el proceso gaussiano

8

Estoy un poco confundido sobre la fórmula para calcular la covarianza en el proceso gaussiano (la adición de la varianza siempre me confunde, ya que no siempre se denota explícitamente). El origen de la confusión es que las fórmulas que se dan en Reconocimiento de patrones y Aprendizaje automático de Bishop y el proceso gaussiano para Aprendizaje automático de Rasmussen son diferentes.

La media de GP está dada por la relación:

μ=K(X,X)[K(X,X)+σ2I]1y

La variación según Bishop (página no: 308) es:

Σ=[K(X,X)+σ2]K(X,X)[K(X,X)+σ2I]1K(X,X)

La varianza según Rasmussen (página no: 16) es:

Σ=K(X,X)K(X,X)[K(X,X)+σ2I]1K(X,X)

Mi duda es si la varianza existe o no en el primer término en RHS para la matriz de covarianza . ¿O he estropeado las cosas?Σ

Avíseme si necesito proporcionar más información.

pkj
fuente

Respuestas:

8

El parámetro de ruido, , es el parámetro de la función de probabilidad, también conocida como función de ruido.σ2

El que tiene es la varianza de (observación). El que no tiene es la varianza de (variable latente = observación - ruido). Entonces están separados unos de otros por que es lo mismo para todos los valores de la variable de entrada .+σ2yfσ2x

Las fórmulas me parecen correctas. Como puede ver, la varianza de (la observación sin ruido) también depende del parámetro de ruido. Tiene sentido también. Su estimación del ruido afectaría la estimación de la incertidumbre (es decir, la varianza) de la variable latente (sin ruido).y

Para evitar confusiones, me referiría a ellos por y .var(y)var(f)

Una cosa más: las dos expresiones que denotaste con son escalares, no matrices. La matriz de covarianza es no . es varianza, no covarianza, ya que se trata de una sola variable -D (ya sea o ).ΣKΣΣ1yf

Seeda
fuente