Intentaré responder a esta pregunta mediante regresión logística , uno de los clasificadores lineales más simples.
El caso más simple de regresión logística es si tenemos una tarea de clasificación binaria ( y solo una característica de entrada ( ). En este caso, el resultado de la regresión logística sería:y∈ { 0 , 1 } )x ∈ R
y^= σ ( w ⋅ x + b )
donde
w y
si son ambos
escalares . La salida del modelo
y^∈ [ 0 , 1 ] corresponde a la probabilidad de que
X sea de la clase
1 .
Trataremos de dividir la frase "los clasificadores lineales no comparten parámetros entre entidades y clases" en dos partes. Examinaremos los casos de múltiples características y múltiples clases por separado para ver si la regresión logística comparte parámetros para esas tareas:
¿Los clasificadores lineales comparten parámetros entre las características?
En este caso, para cada ejemplo, y es un escalar que toma valores binarios (como antes), mientras que X es un vector de longitud norte (donde norte es el número de características). Aquí, la salida es una combinación lineal de las características de entrada (es decir, una suma ponderada de estas características más los sesgos).
x w N x ⋅ w w i x i
y^= σ ( ∑yonorte( wyo⋅ xyo) +b )o rσ ( w ⋅ x +b)
donde y son vectores de longitud . El producto produce un escalar. Como puede ver desde arriba, hay un
peso separado para cada característica de entrada y estos pesos son
independientes por todos los medios. De esto podemos concluir que no
hay intercambio de parámetros entre las características .
Xwnortex ⋅ w wixi
¿Los clasificadores lineales comparten parámetros entre clases?
En este caso, es un escalar, sin embargo, es un vector de longitud (donde es el número de clases). Para abordar esto, la regresión logística esencialmente produce una salida separada para cada una de las clasesCada salida es un escalar y corresponde a la probabilidad de que pertenezca a la clase .y M M y j M y j ∈ [ 0 , 1 ] x jxyMMyjMyj∈[0,1]xj
y^=w⋅x+b,wherey^=y^1,y^2,...,yM
La forma más fácil de pensar en esto es como simples regresiones logísticas independientes, cada una con una salida de:M
y^j=σ(wj⋅x+bj)
De lo anterior es obvio que no se comparten pesos entre las diferentes clases .
Multi-característica y multi-clase :
Al combinar los dos casos anteriores, finalmente podemos llegar al caso más general de múltiples características y múltiples clases:
y MxNbMW(N×M)
y^=σ(W⋅x+b)
donde es un vector con un tamaño de , es un vector con un tamaño de , es un vector con un tamaño de y es una matriz con un tamaño de .
y^MxNbMW(N×M)
En cualquier caso, los clasificadores lineales no comparten ningún parámetro entre entidades o clases .
Para responder a su segunda pregunta, los clasificadores lineales tienen una suposición subyacente de que las características deben ser independientes , sin embargo, esto no es lo que el autor del artículo pretendía decir.