Cuando construye un biplot para un análisis de PCA, tiene puntajes de PC1 del componente principal en el eje xy puntajes de PC2 en el eje y. ¿Pero cuáles son los otros dos ejes a la derecha y la parte superior de la
Cuando construye un biplot para un análisis de PCA, tiene puntajes de PC1 del componente principal en el eje xy puntajes de PC2 en el eje y. ¿Pero cuáles son los otros dos ejes a la derecha y la parte superior de la
He realizado un análisis de componentes principales de seis variables AAA , BBB , CCC , DDD , EEE y FFF . Si entiendo correctamente, PC1 sin rotar me dice qué combinación lineal de estas variables describe / explica la mayor variación en los datos y PC2 me dice qué combinación lineal de estas...
Supongamos que tenemos variables medibles, , hacemos un número de mediciones y luego deseamos realizar una descomposición de valores singulares en los resultados para encontrar los ejes de mayor varianza para los puntos en el espacio -dimensional. ( Nota: suponga que las medias de ya se han...
Tengo dos grupos de sujetos, A y B, cada uno con un tamaño de aproximadamente 400 y aproximadamente 300 predictores. Mi objetivo es construir un modelo de predicción para una variable de respuesta binaria. Mi cliente quiere ver el resultado de aplicar el modelo creado a partir de A en B. (En su...
Estaba leyendo la siguiente justificación (de las notas del curso cs229) sobre por qué dividimos los datos sin procesar por su desviación estándar: Aunque entiendo lo que dice la explicación, no me queda claro por qué dividir por la desviación estándar alcanzaría tal objetivo. Dice para que...
Si en el núcleo PCA elijo un núcleo lineal K(x,y)=x⊤yK(x,y)=x⊤yK(\mathbf{x},\mathbf{y}) = \mathbf x^\top \mathbf y , ¿el resultado será diferente del PCA lineal ordinario ? ¿Son las soluciones fundamentalmente diferentes o existe alguna relación bien
Estoy usando FactoMineRpara reducir mi conjunto de datos de mediciones a las variables latentes. El mapa de la variable anterior es claro para mí de interpretar, pero estoy confundido cuando se trata de las asociaciones entre las variables y el componente 1. Mirando el mapa variables, ddpy...
El artículo de Wikipedia sobre análisis de componentes principales establece que Existen algoritmos eficientes para calcular la SVD de sin tener que formar la matriz , por lo que calcular la SVD es ahora la forma estándar de calcular un análisis de componentes principales a partir de una matriz...
El PCA robusto (desarrollado por Candes et al. 2009 o mejor aún, Netrepalli et al. 2014 ) es un método popular para la detección de valores atípicos multivariados , pero la distancia de Mahalanobis también se puede utilizar para la detección de valores atípicos dada una estimación robusta y...
Después de algunas búsquedas, encuentro muy poco sobre la incorporación de los pesos de observación / errores de medición en el análisis de componentes principales. Lo que encuentro tiende a depender de enfoques iterativos para incluir ponderaciones (por ejemplo, aquí ). Mi pregunta es ¿por qué es...
¿Alguien puede ayudarme a interpretar los puntajes de PCA? Mis datos provienen de un cuestionario sobre actitudes hacia los osos. Según las cargas, he interpretado uno de mis componentes principales como "miedo a los osos". ¿Se relacionarían los puntajes de ese componente principal con la forma en...
Estoy siguiendo un tutorial aquí: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ para obtener una mejor comprensión de PCA. El tutorial utiliza el conjunto de datos Iris y aplica una transformación de registro antes de PCA: Observe que en el siguiente código aplicamos una...
Estoy analizando los puntajes dados por los participantes que asistieron a un experimento. Quiero estimar la confiabilidad de mi cuestionario que se compone de 6 ítems destinados a estimar la actitud de los participantes hacia un producto. Calculé el alfa de Cronbach tratando todos los ítems como...
Estoy intentando realizar la agrupación a nivel de documento. Construí la matriz de frecuencia de término-documento y estoy tratando de agrupar estos vectores de alta dimensión usando k-means. En lugar de agrupar directamente, lo que hice fue aplicar primero la descomposición vectorial singular de...
¿La regresión de rango reducido y la regresión de componentes principales son solo casos especiales de mínimos cuadrados parciales? Este tutorial (Página 6, "Comparación de objetivos") establece que cuando hacemos mínimos cuadrados parciales sin proyectar X o Y (es decir, "no parcial"), se...
¿Son los componentes de PCA (en el análisis de componentes principales) estadísticamente independientes si nuestros datos son multivariados normalmente distribuidos? Si es así, ¿cómo se puede demostrar / probar esto? Pregunto porque vi esta publicación , donde la respuesta principal dice: PCA...
Acabo de volver a ver una conferencia del curso de Machine Learning en Coursera. En la sección donde el profesor discute PCA para el procesamiento previo de datos en aplicaciones de aprendizaje supervisado, dice que PCA solo debe realizarse en los datos de entrenamiento y luego el mapeo se utiliza...
Tengo datos para una red de estaciones meteorológicas en los Estados Unidos. Esto me da un marco de datos que contiene fecha, latitud, longitud y algunos valores medidos. Suponga que los datos se recopilan una vez al día y son impulsados por el clima a escala regional (no, no vamos a entrar en...
Estoy tratando de ver si elegir la regresión de cresta , LASSO , la regresión de componentes principales (PCR) o los mínimos cuadrados parciales (PLS) en una situación en la que hay un gran número de variables / características ( ) y un menor número de muestras ( ), y mi objetivo es la...
Sé que el PCA regular no sigue el modelo probabilístico para los datos observados. Entonces, ¿cuál es la diferencia básica entre PCA y PPCA ? En PPCA, el modelo de variable latente contiene, por ejemplo, variables observadas , latente (variables no observadas x ) y una matriz W que no tiene que ser...