Estoy tratando de entender los modelos de factorización matricial para sistemas de recomendación y siempre leo 'características latentes', pero ¿qué significa eso? Sé lo que significa una característica para un conjunto de datos de entrenamiento, pero no puedo entender la idea de las características latentes. Cada artículo sobre el tema que puedo encontrar es demasiado superficial.
Editar:
si al menos puedes señalarme algunos documentos que explican la idea.
machine-learning
data-mining
recommender-system
Jack Twain
fuente
fuente
Respuestas:
Latente significa no directamente observable. El uso común del término en PCA y análisis factorial es reducir la dimensión de un gran número de características directamente observables en un conjunto más pequeño de características observables indirectamente.
fuente
En el contexto del Método de Factorización, las características latentes generalmente están destinadas a caracterizar elementos a lo largo de cada dimensión. Déjame explicarte con el ejemplo.
fuente
Diría que los factores son más representativos que los componentes principales para obtener una percepción de 'latencia' / ocultamiento de una variable. La latencia es una de las razones por las cuales los científicos del comportamiento miden construcciones perceptivas como el sentimiento, la tristeza en términos de múltiples elementos / medidas y derivan un número para tales variables ocultas que no se pueden medir directamente.
fuente
Aquí sus datos son calificaciones otorgadas por varios usuarios a varias películas. Como otros han señalado, latente significa no directamente observable.
Para una película, sus características latentes determinan la cantidad de acción, romance, argumento, un actor famoso, etc. Del mismo modo, para otro conjunto de datos que consta de dígitos escritos a mano, las variables latentes pueden ser ángulo de bordes, sesgo, etc.
fuente