¿Qué son los datos vinculados en el contexto de un coeficiente de correlación de rango?

16

No estoy en el campo de las estadísticas.

He visto la palabra "datos vinculados" al leer acerca de los coeficientes de correlación de rango.

  • ¿Qué son los datos vinculados?
  • ¿Cuál es un ejemplo de datos vinculados?
BB01
fuente

Respuestas:

5

Significa datos que tienen el mismo valor; por ejemplo, si tiene 1,2,3,3,4 como conjunto de datos, los dos 3 son datos vinculados. Si tiene 1,2,3,4,5,5,5,6,7,7 como conjunto de datos, los 5 y los 7 son datos vinculados.

quarkdown27
fuente
14

Los "datos vinculados" aparecen en el contexto de pruebas estadísticas no paramétricas basadas en rangos.

Pruebas no paramétricas : pruebas que no asumen una distribución de probabilidad particular, por ejemplo, no asume una curva en forma de campana.

basado en el rango : una gran clase de pruebas no paramétricas comienza convirtiendo los números (por ejemplo, "3 días", "5 días" y "4 días") en rangos (por ejemplo, "duración más corta (3º)", "duración más larga" (1º) "," segunda duración más larga (2º) "). Luego se aplica un método de prueba paramétrico tradicional a estos rangos.

Los datos vinculados son un problema ya que los números que son idénticos ahora deben convertirse en rango. A veces, los rangos se asignan al azar, a veces se usa un rango promedio. Lo más importante es que se debe describir un protocolo para romper los rangos empatados para la reproducibilidad del resultado.

Ming K
fuente
5

Son simplemente dos valores de datos idénticos, como observar 7 dos veces en el mismo conjunto de datos.

Esto surge en el contexto de los métodos estadísticos que suponen que los datos tienen una continuidad y, por lo tanto, las mediciones idénticas son imposibles (o técnicamente, los valores idénticos de probabilidad son cero). Las complicaciones prácticas surgen cuando estos métodos se aplican a datos redondeados o recortados, de modo que las mediciones idénticas no solo son posibles sino bastante comunes.

John D. Cook
fuente
1
No estoy de acuerdo con este razonamiento ya que no puede decirlo debido a su probabilidad cero de que este evento nunca ocurra. Este no es un buen razonamiento.
Henry.L
2

La pregunta es de fundamental importancia:

¿Qué es una observación / datos / par atado?

T+

(Por lo tanto, no creo que la respuesta de @ Ming-Chih Kao sea correcta al introducir primero las pruebas no paramétricas. Pero como el título es '¿Qué son datos vinculados en el contexto de un coeficiente de correlación de rango?', Lo compraré).

Zi=XiYi

(Xi,Yi)

Zi

Zi

|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

Probemos la manera más fácil de hacerlo, clasificamos de izquierda a derecha y damos:

Ri

|Zi|

Ri

|Zi|

Ri

|Zi|=1|Zi|=2

1++77=48+92=8.5

Ri

Esto modificó las clasificaciones y hace que cada observación vinculada tenga la misma influencia en el cálculo de las estadísticas clasificadas, por lo tanto, en la prueba de clasificación.

¿Cuáles son las soluciones para la observación / datos / par vinculados?

(1) Asignar el rango promedio. Esto es justo lo que hicimos arriba. Al asignar el mismo rango a los datos vinculados en el mismo grupo, hacemos su influencia en la prueba clasificada de la misma manera y, por lo tanto, eliminamos la posible imprecisión causada por las observaciones vinculadas.

MaxRankfirstgroup<MinRanksecondgroup since if MaxRankfirstgroup>MinRanksecondgroup, that breaks the ranking law; if MaxRankfirstgroup=MinRanksecondgroup, then we have to merge two tied groups into one.

(3)Perturbation of data. This requires very careful consideration about the nature of the data. This works only if the data is not categorical(discrete). In the above example, we can just make a This will put different weights manually to each of the elements in the tied group. For a continuous distribution, for example, it makes little difference if you perturb it in ϵ manner.

(@John D. Cook 's answer is a bit misleading in this way. A better way of saying this point is that when the distribution is continuous, PX=x=0. However, we shall observe ties since our measurement is of limited accuracy, i.e. any sample space in reality is actually finite.) (@quarkdown27 's answer is simple but correct in each word.)

Henry.L
fuente