Quiero transformar mis datos modo que las variaciones sean una y las covarianzas sean cero (es decir, quiero blanquear los datos). Además, los medios deben ser cero.
Sé que llegaré allí haciendo la estandarización Z y la transformación PCA, pero ¿en qué orden debo hacerlo?
Debo agregar que la transformación de blanqueamiento compuesta debe tener la forma .
¿Existe un método similar a PCA que hace exactamente ambas transformaciones y me da una fórmula del formulario anterior?
pca
linear-algebra
Angelorf
fuente
fuente
Respuestas:
Primero, obtienes la media cero restando la mediaμ=1N∑x .
En segundo lugar, obtienes las covarianzas cero al hacer PCA. Si es la matriz de covarianza de sus datos, entonces PCA equivale a realizar una descomposición propia , donde es una matriz de rotación ortogonal compuesta de vectores propios de y es una matriz diagonal con valores propios en la diagonal. Matrix proporciona una rotación necesaria para descorrelacionar los datos (es decir, asigna las características originales a los componentes principales).Σ Σ=UΛU⊤ U Σ Λ U⊤
Tercero, después de la rotación, cada componente tendrá una variación dada por un valor propio correspondiente. Entonces, para hacer variaciones iguales a , debe dividir por la raíz cuadrada de .1 Λ
En conjunto, la transformación de blanqueamiento es . Puede abrir los corchetes para obtener el formulario que está buscando.x↦Λ−1/2U⊤(x−μ)
Actualizar. Consulte también este hilo posterior para obtener más detalles: ¿Cuál es la diferencia entre el blanqueamiento ZCA y el blanqueamiento PCA?
fuente