Preguntas etiquetadas con pca

El análisis de componentes principales (PCA) es una técnica de reducción de dimensionalidad lineal. Reduce un conjunto de datos multivariado a un conjunto más pequeño de variables construidas, conservando tanta información (tanta varianza) como sea posible. Estas variables, llamadas componentes principales, son combinaciones lineales de las variables de entrada.

147
¿Se puede aplicar el análisis de componentes principales a conjuntos de datos que contienen una combinación de variables continuas y categóricas?

Tengo un conjunto de datos que tiene datos continuos y categóricos. Estoy analizando utilizando PCA y me pregunto si está bien incluir las variables categóricas como parte del análisis. Entiendo que PCA solo se puede aplicar a variables continuas. ¿Es eso correcto? Si no se puede utilizar para...

78
Un ejemplo: regresión LASSO usando glmnet para el resultado binario

Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...

70
¿Cómo visualizar lo que hace el análisis de correlación canónica (en comparación con lo que hace el análisis de componentes principales)?

El análisis de correlación canónica (CCA) es una técnica relacionada con el análisis de componentes principales (PCA). Si bien es fácil enseñar PCA o regresión lineal utilizando un diagrama de dispersión (vea algunos miles de ejemplos en la búsqueda de imágenes de Google), no he visto un ejemplo...

67
Cargas vs autovectores en PCA: ¿cuándo usar uno u otro?

En el análisis de componentes principales (PCA), obtenemos vectores propios (vectores unitarios) y valores propios. Ahora, definamos las cargas comoCargas = Eigenvectores ⋅ Eigenvalores----------√.Cargas=Vectores propios⋅Valores propios.\text{Loadings} = \text{Eigenvectors} \cdot...