Significado de las características latentes?

15

Estoy tratando de entender los modelos de factorización matricial para sistemas de recomendación y siempre leo 'características latentes', pero ¿qué significa eso? Sé lo que significa una característica para un conjunto de datos de entrenamiento, pero no puedo entender la idea de las características latentes. Cada artículo sobre el tema que puedo encontrar es demasiado superficial.

Editar:

si al menos puedes señalarme algunos documentos que explican la idea.

Jack Twain
fuente
Aquí hay un ejemplo simple que podría ayudarte quuxlabs.com/blog/2010/09/…
Akavall

Respuestas:

9

Latente significa no directamente observable. El uso común del término en PCA y análisis factorial es reducir la dimensión de un gran número de características directamente observables en un conjunto más pequeño de características observables indirectamente.

samthebest
fuente
Entonces, ¿las dimensiones reducidas son las características latentes? En el caso de PCA, los vectores propios de la matriz de covarianza, es decir, los componentes principales, ¿verdad?
Jack Twain
Correcto @AlexTwain
samthebest
¿Me puede proporcionar un tutorial / documento que mencione eso? ¡No puedo encontrar ningún tutorial / papel sistemático!
Jack Twain
Bueno, la página wiki es bastante buena, puedes seguir las referencias allí si realmente quieres en.wikipedia.org/wiki/Latent_variable
samthebest
1
@JackTwain la analogía correcta de PCA es que las características latentes son los vectores propios. Los componentes principales son los pesos asignados a cada observación para los vectores propios principales. En otros modelos de factorización matricial, las características latentes desempeñan el papel de los vectores propios. Esto puede sonar pedante, pero el error no crea confusión para las personas.
conjeturas
3

En el contexto del Método de Factorización, las características latentes generalmente están destinadas a caracterizar elementos a lo largo de cada dimensión. Déjame explicarte con el ejemplo.

RRtuyopagtuTqyopagtutuqyoyo

pagtuqyo

Artem Sobolev
fuente
He leído documentos donde las características latentes (digamos el "vector de usuario") se usan para predecir algunas variables objetivo, usemos el género como ejemplo. "Funciona" porque un modelo predictivo se puede construir de esta manera. Mi pregunta es ¿cuál es la diferencia entre el "vector de usuario" y, por ejemplo, promediar los "vectores de elementos" para todos los elementos que un usuario ha "visitado"? IOW, ¿esperaría que el modelo predictivo mencionado anteriormente sea mejor o peor con uno frente al otro? Gracias (si alguna vez ves esto).
thecity2
@ thecity2, puede promediar los elementos del usuario, y esto en realidad podría ser útil cuando se trata de recién llegados para los que no tiene vectores de usuario precalculados (aunque debería ser difícil ejecutar algunas iteraciones de optimización para calcularlo). También hay un problema con el promedio simple: cuantos más elementos haya consumido el usuario, es probable que sea más cercano a cero su vector promedio de elementos (debido al regularizador L2 típico y tal vez otras propiedades desagradables de los espacios de alta dimensión). Finalmente, tener un vector separado es más flexible: su modelo puede aprender tal promedio.
Artem Sobolev
Dicho esto, hay intentos de usar el historial del usuario para modelar el vector del usuario. Por ejemplo, vea el documento "Cree su propio recomendación musical modelando transmisiones de radio por Internet"
Artem Sobolev
0

Diría que los factores son más representativos que los componentes principales para obtener una percepción de 'latencia' / ocultamiento de una variable. La latencia es una de las razones por las cuales los científicos del comportamiento miden construcciones perceptivas como el sentimiento, la tristeza en términos de múltiples elementos / medidas y derivan un número para tales variables ocultas que no se pueden medir directamente.

KarthikS
fuente
0

Aquí sus datos son calificaciones otorgadas por varios usuarios a varias películas. Como otros han señalado, latente significa no directamente observable.

Para una película, sus características latentes determinan la cantidad de acción, romance, argumento, un actor famoso, etc. Del mismo modo, para otro conjunto de datos que consta de dígitos escritos a mano, las variables latentes pueden ser ángulo de bordes, sesgo, etc.

explorador
fuente