Generalización de la distribución y clasificación normal multivariante.

8

Estoy interesado en una familia de distribuciones multivariadas que puede verse como una generalización de la distribución normal multivariada, en la medida en que se definen por un valor de expectativa y una matriz de covarianza , más una función monótonamente decreciente tal que la densidad es donde es la distancia de Mahalanobis. La normal multivariada es, por supuesto, recuperada por .μΣg(d)

p(x)g(Δ(x,μ))
Δ(a,b)=(ab)TΣ1(ab)
g(d)=exp(12d2)

Mi primera pregunta es: ¿Cuál es el nombre de esta familia de distribuciones?

Es simple para mostrar que para la clasificación de un punto de datos dado a uno de dos o más clases, cada uno de los cuales se describe por una densidad de este tipo con diferentes pero idénticos y , los límites de clasificación óptimos son lineales a trozos (hiperplanar).μΣg(d)

Mi segunda pregunta es: ¿Es este un resultado estándar y, en caso afirmativo, cuál es la referencia de la literatura estándar (libro de texto)?

A. Donda
fuente
55
Que yo sepa, hay dos familias de distribuciones relacionadas con su descripción: 1. Distribuciones elípticas y 2. Distribuciones esféricas .
Hola @Procrastinator, me parece extraño que alguien más edite la publicación, pero entiendo tu punto. - En cuanto a su comentario, creo que las distribuciones elípticas es exactamente lo que quiero decir, y las distribuciones esféricas son un caso especial. Por lo tanto, creo que lo que escribiste no es un comentario sino una respuesta. ¡Muchas gracias! - Usando la nueva terminología, una búsqueda de su uso en la clasificación todavía no resultó nada, por lo que mi segunda pregunta aún está abierta.
A. Donda

Respuestas:

2

La respuesta a la primera pregunta fue dada por el Procrastinator en un comentario: la familia se llama Distribuciones elípticas . La referencia estándar del libro de texto parece ser

Fang, K., Kotz, S., Ng, KW, 1990. Distribuciones simétricas multivariadas y relacionadas. Chapman y Hall.

Con respecto a la segunda pregunta , parece que la mayoría de la literatura sobre clasificación considera distribuciones normales multivariadas o procedimientos completamente no paramétricos. Sin embargo, encontré una publicación que compara algoritmos de clasificación basados ​​en diferentes estimadores de y , y lo hace en el contexto de distribuciones elípticas:μΣ

Hartikainen, A., Oja, H., 2006. Sobre algunas reglas de discriminación paramétricas, no paramétricas y semiparamétricas, en: Profundidad de datos: análisis multivariado robusto, geometría computacional y aplicaciones. American Mathematical Society, págs. 61–70.

A. Donda
fuente