¿Existe una definición aceptada para la mediana de una muestra en el plano o espacios ordenados más altos?

Respuestas:

19

No estoy seguro de que haya una definición aceptada para una mediana multivariada. Con el que estoy familiarizado es con el punto medio de Oja , que minimiza la suma de volúmenes de simplices formados sobre subconjuntos de puntos. (Consulte el enlace para obtener una definición técnica).

Actualización: El sitio al que se hace referencia para la definición de Oja anterior también tiene un buen artículo que cubre una serie de definiciones de una mediana multivariada:

ars
fuente
1
Buena referencia: gracias. Cubre exhaustivamente todo lo mencionado aquí.
whuber
El mismo sitio web también contiene una descripción general nivelada
Aditya
15

Como @Ars dijo que no hay una definición aceptada (y este es un buen punto). Existen familias de alternativas generales de formas de generalizar cuantiles en , creo que las más significativas son:Rd

  • Generalizar el proceso cuantil Seala medida empírica (= la proporción de observaciones en). Luego, conun subconjunto bien elegido de los conjuntos de Borel enyuna medida de valor real, puede definir la función de cuantil empírica:A A R d λPn(A)AARdλ

    Un(t)=inf(λ(A):Pn(A)tAA)

    Suponga que puede encontrar un que le da el mínimo. Entonces el conjunto (o un elemento del conjunto) le da la mediana cuando se hace lo suficientemente pequeño. La definición de la mediana se recupera cuando se usa y . La respuesta de Ars cae en ese marco, supongo ... la ubicación del medio espacio de tukey se puede obtener usando y (con , ).AtA1/2ϵA1/2+ϵϵA=(],x]xR)λ(],x])=xA(a)=(Hx=(tRd:a,tx)λ(Hx)=xxRaRd

  • definición variacional y estimación M La idea aquí es que la -quantilede una variable aleatoriaense puede definir a través de una igualdad variacional.αQαYR

    • La definición más común es usar la función de regresión cuantil (también conocida como pérdida de pinball, ¿adivina por qué?) . El caso day puede generalizar eso a una dimensión más alta usando distancias como se hace en @Srikant Answer . Esta es una mediana teórica pero le da una mediana empírica si reemplaza la expectativa por la expectativa empírica (media).ραQα=arginfxRE[ρα(Yx)]α=1/2ρ1/2(y)=|y|l1

    • Pero Kolshinskii propone utilizar la transformación Legendre-Fenchel: desde donde para . Él da muchas razones profundas para eso (ver el documento;)). Generalizar esto a dimensiones más altas requiere trabajar con un y reemplazar por pero puede tomar .Qα=Argsups(sαf(s))f(s)=12E[|sY||Y|+s]sRαsαs,αα=(1/2,,1/2)

  • Ordenamiento parcial Puede generalizar la definición de cuantiles entan pronto como pueda crear un orden parcial (con clases de equivalencia).Rd

Obviamente hay puentes entre las diferentes formulaciones. No todos son obvios ...

robin girard
fuente
Buena respuesta, Robin!
ars
12

Hay distintas formas de generalizar el concepto de mediana a dimensiones superiores. Una que aún no se menciona, pero que se propuso hace mucho tiempo, es construir un casco convexo, despegarlo e iterar todo el tiempo que pueda: lo que queda en el último casco es un conjunto de puntos que todos son candidatos a ser " medianas ".

"Golpearse la cabeza" es otro intento más reciente (c. 1980) de construir un centro robusto en una nube de puntos 2D. (El enlace es a documentación y software disponible en el Instituto Nacional del Cáncer de EE. UU.)

La razón principal por la que hay múltiples generalizaciones distintas y ninguna solución obvia es que R1 se puede ordenar pero R2, R3, ... no se pueden ordenar.

whuber
fuente
Cualquier medida que coincida con la mediana habitual cuando se restringe a R1 es una generalización candidata. Debe haber muchos de ellos.
phv3773
phv:> se puede pedir 'la' generalización para preservar (en dimensiones superiores) algunas de las propiedades interesantes de la mediana. Esto limita severamente el número de candidatos (vea los comentarios después de la respuesta de Srikant a continuación)
user603
@Whuber:> entonces la noción de orden se puede generalizar a R ^ n para distribuciones unimodales (ver mi respuesta a continuación).
user603
@kwak: ¿podrías elaborar un poco? La definición matemática habitual de un ordenamiento de un espacio es independiente de cualquier tipo de distribución de probabilidad, por lo que debe tener implícitamente algunas suposiciones adicionales en mente.
whuber
1
@Whuber:> Usted dice: "R1 se puede ordenar pero R2, R3, ... no se puede". R2, .., R3 se pueden ordenar de muchas maneras al mapear de Rn a R. Una de esas formas es la profundidad del tukey. Tiene muchas propiedades importantes (robustez hasta cierto punto, no paramétricas, invariancia, ...) pero estas solo son válidas para el caso de distribuciones unimodales. Avísame si quieres más detalles.
user603
6

La mediana del espacio medio de Tukey se puede extender a> 2 dimensiones usando DEEPLOC, un algoritmo debido a Struyf y Rousseeuw; ver aquí para más detalles.

El algoritmo se utiliza para aproximar el punto de mayor profundidad de manera eficiente; Los métodos ingenuos que intentan determinar exactamente esto generalmente están en conflicto con (la versión computacional de) "la maldición de la dimensionalidad", donde el tiempo de ejecución requerido para calcular una estadística crece exponencialmente con el número de dimensiones del espacio.

Gary Campbell
fuente
0

No sé si existe tal definición, pero intentaré extender la definición estándar de la mediana a . Usaré la siguiente notación:R2

X , : las variables aleatorias asociadas con las dos dimensiones.Y

mx , : las medianas correspondientes.my

f(x,y) : el pdf conjunto para nuestras variables aleatorias

Para extender la definición de la mediana a , elegimos y para minimizar lo siguiente:R2mxmy

E(|(x,y)(mx,my)|

El problema ahora es que necesitamos una definición de lo que queremos decir con:

|(x,y)(mx,my)|

Lo anterior es, en cierto sentido, una métrica de distancia y son posibles varias definiciones posibles.

Eucliedan Metric

|(x,y)(mx,my)|=(xmx)2+(ymy)2

Calcular la mediana bajo la métrica euclidiana requerirá calcular la expectativa de lo anterior con respecto a la densidad articular .f(x,y)

Taxicab Metric

|(x,y)(mx,my)|=|xmx|+|ymy|

Calcular la mediana en el caso de la métrica del taxi implica calcular la mediana de e separado, ya que la métrica es separable en e .XYxy


fuente
Srikant:> No. La definición tiene que tener dos características importantes de la mediana univariante. a) Transformación invariable a monótona de los datos, b) robusta a la contaminación por valores atípicos. Ninguna de las extensiones que propone tiene estos. La profundidad de Tukey tiene estas cualidades.
user603
@kwak Lo que dices tiene sentido.
@Srikant:> Consulte el documento de R&S citado por Gary Campbell arriba; Best,
user603
@kwak Al pensar un poco más, la métrica del taxi tiene las características que mencionaste, ya que básicamente se reduce a medianas univariantes. ¿no?
2
@Srikant:> no hay una respuesta incorrecta a las preguntas de phv porque tampoco hay 'buenas respuestas'; Esta área de investigación todavía está en desarrollo. Simplemente quería señalar por qué sigue siendo un problema abierto.
user603