Funciones de pérdida de percentil

11

La solución al problema:

minmE[|mX|]

se sabe que es la mediana de X , pero ¿cómo se ve la función de pérdida para otros percentiles? Ej: el percentil 25 de X es la solución para:

minmE[L(m,X)]

¿Qué es L en este caso?

Cam.Davidson.Pilon
fuente

Respuestas:

12

Deje que I sea ​​la función del indicador: es igual a 1 para argumentos verdaderos y 0 caso contrario. Elija 0<α<1 y establezca

Λα(x)=αxI(x0)(1α)xI(x<0).

Figura

Esta figura traza Λ1/5 . Utiliza una relación de aspecto precisa para ayudarlo a medir las pendientes, que equivalen a 4/5 en el lado izquierdo y +1/5 a la derecha. En este caso, las excursiones por encima de 0 tienen un peso muy bajo en comparación con las excursiones por debajo de 0 .

Es una función natural para probar porque pondera valores que exceden diferente que que son menores que . Calculemos la pérdida asociada y luego la optimicemos.0 x 0x0x0

Escribir para la función de distribución de y configurar , calcularX L α ( m , x ) = Λ α ( x - m )FXLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

Figura 2

Como varía en esta ilustración con la distribución Normal estándar , se traza el área ponderada por probabilidad total de . (La curva es la gráfica de .) La gráfica de la derecha para muestra más claramente el efecto de la disminución de los valores positivos, ya que sin esta disminución la gráfica ser simétrico sobre el origen. La gráfica central muestra el óptimo, donde la cantidad total de tinta azul (que representa ) es lo más pequeña posible.F Λ 1 / 5 Λ 1 / 5 ( x - m ) d F ( x ) m = 0 E F ( L 1 / 5 ( m , X ) )mFΛ1/5Λ1/5(xm)dF(x)m=0EF(L1/5(m,X)) 

Esta función es diferenciable y, por lo tanto, sus extremos se pueden encontrar inspeccionando los puntos críticos. La aplicación de la regla de la cadena y el teorema fundamental del cálculo para obtener la derivada con respecto a dam

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

Para distribuciones continuas esto siempre tiene una solución que, por definición, es cualquier cuantil de . Para distribuciones no continuos esto podría no tiene una solución, pero habrá al menos un para la que para todos y para todos : esto también (por definición) es un cuantil de .α X m F ( x ) - α < 0 x < m F ( x ) - α 0 x m α XmαXmF(x)α<0x<mF(x)α0xmαX

Finalmente, debido a que y , está claro que ni ni minimizarán esta pérdida. Eso agota la inspección de los puntos críticos, mostrando que ajusta a la factura.α 1 m - m Λ αα0α1mmΛα

Como caso especial, es la pérdida exhibida en el pregunta.EF(2L1/2(m,X))=EF(|mx|)

whuber
fuente
Aprecio el esfuerzo que pones en mostrar que la pérdida esperada se minimiza en el punto correcto . Me preguntaba cómo hacerlo por mi propia respuesta, pero su explicación es buena. (+1)m
2
Has demostrado que las imágenes valen 1000 palabras. Gracias @whuber =)
Cam.Davidson.Pilon
8

Este artículo tiene tu respuesta. Para ser específico, La función de pérdida puede interpretarse como 'equilibrar' las diferentes regiones de masa de probabilidad alrededor de través de la resta . Para la mediana, estas regiones de masa son iguales: haciendo que la función de pérdida sea proporcional (en la expectativa la constante es insignificante) a que da la conclusión deseada para la mediana.0.25 0.25 - 1 { X > m } L 0.5 ( m , X ) = | ( X - m ) ( 0.5 - 1 { X > m } ) |

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}| X - m | ,
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

fuente
(+1) ¡Bien hecho! - no era obvio dónde buscar ese artículo de Wikipedia; tenías que pensar en la regresión cuantil.
whuber
Gracias, @Matthew, este es un gran hallazgo. Me gusta equilibrar la interpretación
Cam.Davidson.Pilon
Todavía no entiendo. ¿De donde viene esto? Si X está por encima del cuantil, se pondera 0.75, de lo contrario 0.25? ¿Solo esto? ( X - m )|(0.25)1X>m)|(Xm)
IcannotFixThis