He visto el otro hilo aquí, pero no creo que la respuesta haya satisfecho la pregunta real. Lo que he leído continuamente es que Naive Bayes es un clasificador lineal (por ejemplo, aquí ) (de modo que dibuja un límite de decisión lineal) utilizando la demostración de probabilidades de registro.
Sin embargo, simulé dos nubes gaussianas y ajusté un límite de decisión y obtuve los resultados como tales (biblioteca e1071 en r, usando naiveBayes ())
Como podemos ver, el límite de decisión no es lineal. ¿Intenta decir que los parámetros (probabilidades condicionales) son una combinación lineal en el espacio logarítmico en lugar de decir que el clasificador mismo separa los datos linealmente?
classification
naive-bayes
Kevin Pei
fuente
fuente
Respuestas:
En general, el clasificador ingenuo de Bayes no es lineal, pero si los factores de probabilidad provienen de familias exponenciales , el clasificador ingenuo de Bayes corresponde a un clasificador lineal en un espacio de características particular. Aquí está cómo ver esto.p ( xyo∣ c )
Puedes escribir cualquier clasificador ingenuo de Bayes como *
donde es la función logística . Si es de una familia exponencial, podemos escribirlo comop ( x i ∣ c )σ p(xi∣c)
y por lo tanto
dónde
Tenga en cuenta que esto es similar a la regresión logística , un clasificador lineal, en el espacio de características definido por . Para más de dos clases, de forma análoga obtenemos regresión logística multinomial (o softmax) .ϕi
Si es gaussiano, entonces y deberíamos tener ϕ i ( x i ) = ( x i , x 2 i ) w i 1p(xi∣c) ϕi(xi)=(xi,x2i)
suponiendo que .p(c=1)=p(c=0)=12
* Aquí es cómo derivar este resultado:
fuente
Es lineal solo si las matrices de varianza condicional de clase son las mismas para ambas clases. Para ver esto, escriba la relación de los registros posteriores y solo obtendrá una función lineal si las variaciones correspondientes son las mismas. De lo contrario, es cuadrático.
fuente
Me gustaría agregar un punto adicional: la razón de parte de la confusión se basa en lo que significa realizar la "clasificación Naive Bayes".
Bajo el amplio tema del "Análisis discriminante gaussiano (GDA)" hay varias técnicas: QDA, LDA, GNB y DLDA (DA cuadrática, DA lineal, bayas ingenuas gaussianas, LDA diagonal). [ACTUALIZADO] LDA y DLDA deben ser lineales en el espacio de los predictores dados. (Ver, por ejemplo, Murphy , 4.2, pág. 101 para DA y pág. 82 para NB. Nota: GNB no es necesariamente lineal. NB discreto (que usa una distribución multinomial debajo del capó) es lineal. También puede consultar Duda , Hart & Stork sección 2.6). QDA es cuadrático como lo han señalado otras respuestas (y creo que es lo que está sucediendo en su gráfico, vea a continuación).
Estas técnicas forman una red con un buen conjunto de restricciones en las "matrices de covarianza de clase" :Σc
Si bien los documentos para e1071 afirman que está asumiendo independencia condicional de clase (es decir, GNB), sospecho que en realidad está haciendo QDA. Algunas personas combinan "ingenuos Bayes" (haciendo suposiciones de independencia) con "una simple regla de clasificación bayesiana". Todos los métodos GDA se derivan de lo posterior; pero solo GNB y DLDA usan el primero.
Una gran advertencia, no he leído el código fuente e1071 para confirmar lo que está haciendo.
fuente