¿Se puede usar el error cuadrático medio para la clasificación?

13

Sé la fórmula del error cuadrático medio y cómo calcularlo. Cuando hablamos de una regresión podemos calcular el error cuadrático medio. Sin embargo, ¿podemos hablar sobre un MSE para un problema de clasificación y cómo calcularlo?

classification error kamaci
fuente

12

Muchos clasificadores pueden predecir puntajes continuos. A menudo, los puntajes continuos son resultados intermedios que solo se convierten en etiquetas de clase (generalmente por umbral) como el último paso de la clasificación. En otros casos, por ejemplo, se pueden calcular las probabilidades posteriores para la pertenencia a la clase (por ejemplo, análisis discriminante, regresión logística). Puede calcular el MSE utilizando estos puntajes continuos en lugar de las etiquetas de clase. La ventaja de esto es que evita la pérdida de información debido a la dicotomización.
Cuando el puntaje continuo es una probabilidad, la métrica MSE se llama puntaje de Brier.

Sin embargo, también hay problemas de clasificación que son más bien problemas de regresión disfrazados. En mi campo, eso podría, por ejemplo, clasificar casos según si la concentración de alguna sustancia excede o no un límite legal (que es un problema binario / discriminatorio de dos clases). Aquí, MSE es una opción natural debido a la naturaleza de regresión subyacente de la tarea.

En este artículo lo explicamos como parte de un marco más general: C. Beleites, R. Salzer y V. Sergo:
Validación de modelos de clasificación blanda utilizando membresías de clase parcial: un concepto extendido de sensibilidad y Co. aplicado a la clasificación de los tejidos de astrocitoma
Chemom Intell. Laboratorio. Syst., 122 (2013), 12-22.

Cómo calcularlo: si trabaja en R, una implementación está en el paquete "softclassval", http: /softclassval.r-forge.r-project.org.

cbeleites descontentos con SX
fuente

@ seanv507: muchas gracias!

Cbeleites descontento con SX

1

No entiendo cómo ... la clasificación exitosa es una variable binaria (correcta o no), por lo que es difícil ver qué cuadrarías.

En general, las clasificaciones se miden en indicadores como el porcentaje correcto, cuando una clasificación que se ha estimado a partir de un conjunto de entrenamiento, se aplica a un conjunto de pruebas que se dejó de lado anteriormente.

El error cuadrático medio ciertamente puede calcularse (y se calcula) para pronósticos o valores pronosticados de variables continuas, pero creo que no para clasificaciones.

Peter Ellis
fuente

0

Para las estimaciones de probabilidad , desearía calcular no MSE sino la probabilidad: $\hat{\pi}$

$L=\prod_i \hat{\pi}_i^{y_i} (1-\hat{\pi}_i)^{1-y_i}$

Esta probabilidad es para una respuesta binaria, que se supone que tiene una distribución de Bernoulli.

$L$

usuario0
fuente

0

Técnicamente puede, pero la función MSE no es convexa para la clasificación binaria. Por lo tanto, si un modelo de clasificación binaria se entrena con la función Costo MSE, no se garantiza que minimice la función Costo . Además, el uso de MSE como función de costo supone la distribución gaussiana, que no es el caso de la clasificación binaria.

Mostafa Nakhaei
fuente

1

¿Por qué MSE asumiría la distribución gaussiana? (A diferencia de, por ejemplo, la regresión de mínimos cuadrados usa MSE como pérdida, y podemos demostrar que es óptima para problemas de regresión con residuos distribuidos normalmente)

cbeleites descontento con SX

No es óptimo para la clasificación binaria, pero es óptimo para la regresión. La pregunta era para binario.

Mostafa Nakhaei

La pregunta no dice clasificación binaria . Ni siquiera dice clasificación discriminativa. Y no pregunta sobre la optimización (para lo cual necesitaría ser aún más específico sobre la situación incluso que decir binario o discriminatorio con 2 clases), solo si se puede usar MSE. Además, el puntaje de Brier es una regla de puntaje estrictamente adecuada para el pronóstico, por lo que una explicación más detallada de la falta de optimización sin duda sería útil (y posiblemente muy esclarecedora sobre cuándo se aplica esta no optimización).

Cbeleites descontento con SX

¿Se puede usar el error cuadrático medio para la clasificación?

Respuestas: