Permítame hacer una pregunta básica. Entiendo la mecánica de Naive Bayes para variables discretas, y puedo rehacer los cálculos "a mano". (código de HouseVotes84 hasta el final por debajo).
Sin embargo, me cuesta ver cómo funcionan los mecanismos para las variables continuas (código de ejemplo a continuación). ¿Cómo calcula el paquete las probabilidades condicionales [, 1]
y [, 2]
en la tabla a continuación? Como cualquier valor X individual es único, crea un rango alrededor de cada punto y calcula las frecuencias relativas dentro de estos rangos (por ejemplo, si el punto es +0.311, evalúa la incidencia de puntos azules y naranjas en, por ejemplo, un rango de 0.1 y +0.5?) Esta podría ser una pregunta básica: disculpas si es así.
Mesa
A-priori probabilities:
Y
blue orange
0.5 0.5
Conditional probabilities:
values
Y [,1] [,2]
blue 0.08703793 0.9238799
orange 1.33486433 0.9988389
Código
blue=rep("blue",50); orange=rep("orange",50); colour=c(blue,orange); values1=rnorm(50,0,1); values2=rnorm(50,1,1); values=c(values1,values2)
df=data.frame(colour,values)
(model <- naiveBayes(colour ~ ., data = df))
(predict(model, df[1:10,]))
(predict(model, df[1:10,], type = "raw"))
(pred <- predict(model, df))
table(pred, df$colour)
## Categorical data only:
library(e1071)
data(HouseVotes84, package = "mlbench")
HouseVotes84=HouseVotes84[,1:3]
(model <- naiveBayes(Class ~ ., data = HouseVotes84))
(predict(model, HouseVotes84[1:10,]))
(predict(model, HouseVotes84[1:10,], type = "raw"))
(pred <- predict(model, HouseVotes84))
table(pred, HouseVotes84$Class)
fuente