Problema
En la regresión, generalmente se calcula el error cuadrado medio (MSE) para una muestra:
En este momento estoy trabajando en un problema de regresión en el que el objetivo es predecir el precio que los clientes están dispuestos a pagar por un producto dada una serie de características numéricas. Si el precio previsto es demasiado alto, ningún cliente comprará el producto, pero la pérdida monetaria es baja porque el precio simplemente puede disminuirse. Por supuesto, no debe ser demasiado alto, ya que es posible que el producto no se compre por mucho tiempo. Por otro lado, si el precio previsto es demasiado bajo, el producto se comprará rápidamente sin la posibilidad de ajustar el precio.
En otras palabras, el algoritmo de aprendizaje debe predecir precios ligeramente más altos que se pueden disminuir si es necesario en lugar de subestimar el precio real, lo que resultará en una pérdida monetaria inmediata.
Pregunta
¿Cómo diseñaría una métrica de error incorporando esta asimetría de costos?
Solución posible
Una forma de definir una función de pérdida asimétrica sería simplemente multiplicar por un peso: conalpha∈(0,1)siendo el parámetro podemos ajustar para cambiar el grado de asimetría. Lo he encontradoaqui
fuente
Respuestas:
Como se mencionó en los comentarios anteriores, la regresión cuantil utiliza una función de pérdida asimétrica (lineal pero con diferentes pendientes para errores positivos y negativos). El análogo cuadrático (pérdida cuadrática) de la regresión cuantil es la regresión esperable.
Puede buscar en Google la regresión cuantil para las referencias. Para la regresión de los proyectiles, consulte el paquete R expectreg y las referencias en el manual de referencia.
fuente
Este tipo de ponderación desigual a menudo se realiza en problemas de clasificación con dos clases. La regla de Bayes se puede modificar usando una función de pérdida que pondera la pérdida más alto para un error que para el otro. Esto conducirá a una regla que produce tasas de error desiguales.
En la regresión, sin duda sería posible construir una función de ponderación, como una suma ponderada de cuadrados que otorgará cierta ponderación a los errores negativos y una ponderación mayor a los positivos. Esto sería similar al mínimo cuadrado ponderado pero un poco diferente porque los mínimos cuadrados ponderados están destinados a problemas en los que la varianza del error no es constante en el espacio de valores posibles para las variables predictoras. En ese caso, los pesos son más altos para los puntos donde se sabe que la varianza del error es pequeña y más alta donde se sabe que la varianza del error es grande. Por supuesto, esto conducirá a valores para los parámetros de regresión que son diferentes de lo que OLS le daría.
fuente