¿Cuándo usar la distancia euclidiana ponderada y cómo determinar los pesos a usar?

16

Tengo un conjunto de datos donde cada dato consiste en n medidas diferentes. Para cada medida, tengo un valor de referencia. Me gustaría saber qué tan cerca está cada dato del valor de referencia.

Pensé en usar la distancia euclidiana ponderada de esta manera:

reX,si=(yo=1nortewyo(Xyo-siyo)2))1/ /2

dónde

Xyo es el valor de la i-ésima medida para los datos particulares

bi es el valor de referencia correspondiente para esa medida.

wi es el valor del peso entre el que adjuntaré a la i-ésima medida sujeto a lo siguiente:

0 0<wyo<1 yyo=1norte1

Sin embargo, en base a este documento, descubrí que el peso a usar es el recíproco de la varianza de la i-ésima medida. No creo que este tipo de ponderación explique la importancia que otorgaré a cada medida.

Por lo tanto:

  1. ¿Existen métodos para llegar a un conjunto de pesos que refleje la importancia relativa del observador de una medida o puede el observador asignar valores arbitrarios para los pesos?

  2. ¿Es apropiado usar la distancia euclidiana ponderada para resolver este problema?

Sara
fuente

Respuestas:

16

Pesos para estandarización

w

Pesos por importancia

Puede poner todo lo que quiera como pesos, incluidas las medidas de 'importancia' (aunque es posible que desee estandarizar antes de la ponderación de importancia si las unidades de medida difieren).

xbiwibipodría ser la posición de status quo en alguna dimensión, desde la cual difieren las posiciones de varios actores. En esta aplicación, uno preferiría medir en lugar de afirmar tanto la importancia como la posición. De cualquier manera, los pesos grandes harán que las diferencias en cuestiones no importantes tengan menos efecto en la distancia general entre los actores si se calculan de acuerdo con su primera ecuación. Observe también que en esta versión implícitamente no asumimos ninguna covarianza relevante entre las posiciones, lo cual es una afirmación bastante fuerte.

Centrándonos ahora en la pregunta 2: en la aplicación, acabo de describir la justificación de los fundamentos de ponderación y distancias en los supuestos teóricos del juego sobre estructuras de preferencia transitivas y similares. En última instancia, estas son las únicas razones por las que es 'apropiado' calcular las distancias de esta manera. Sin ellos, tenemos un montón de números que obedecen a la desigualdad del triángulo.

Pesos como medida implícita

En el tema de la covarianza, podría ser útil pensar en su problema como una identificación del subespacio relevante dentro del cual las distancias tienen sentido sustantivo, suponiendo que muchas de las mediciones que usted tiene realmente miden cosas similares. Un modelo de medición, por ejemplo, análisis factorial, proyectaría todo mediante una combinación ponderada en un espacio común en el que podrían calcularse las distancias. Pero, nuevamente, tendríamos que conocer el contexto de su investigación para decir si eso tendría sentido.

conjugadoprior
fuente
Gracias por la valiosa información. pero tengo dudas acerca de cómo calcular los pesos?