Como otras respuestas indican correctamente, las probabilidades reportadas de modelos como la regresión logística y la ingenua Bayes son estimaciones de la probabilidad de clase. Si el modelo fuera verdadero, la probabilidad sería la probabilidad de una clasificación correcta.
Sin embargo, es bastante importante comprender que esto podría ser engañoso porque el modelo se estima y, por lo tanto, no es un modelo correcto. Hay al menos tres problemas.
- Incertidumbre de las estimaciones.
- Modelo de especificación errónea.
- Parcialidad.
La incertidumbre es solo el hecho presente en todas partes de que la probabilidad es solo una estimación. Un intervalo de confianza de la probabilidad de clase estimada podría proporcionar alguna idea sobre la incertidumbre (de la probabilidad de clase, no de la clasificación).
--
Si el procedimiento de estimación (intencionalmente) proporciona una estimación sesgada , las probabilidades de la clase son incorrectas. Esto es algo que veo con métodos de regularización como lazo y cresta para la regresión logística. Si bien una elección de validación cruzada de la regularización conduce a un modelo con buen rendimiento en términos de clasificación, las probabilidades de clase resultantes se subestiman claramente (demasiado cerca de 0.5) en los casos de prueba. Esto no es necesariamente malo, pero es importante tenerlo en cuenta.