Al estudiar dos medias de muestras independientes, se nos dice que estamos viendo la "diferencia de dos medias". Esto significa que tomamos la media de la población 1 ( ) y le restamos la media de la población 2 ( ). Entonces, nuestra "diferencia de dos medias" es ( - ).
Cuando estudiamos medias de muestras pareadas, se nos dice que estamos viendo la "diferencia de medias", . Esto se calcula tomando la diferencia entre cada par y luego tomando la media de todas esas diferencias.
Mi pregunta es: ¿obtenemos lo mismo ( - ) en comparación con su si los calculamos a partir de dos columnas de datos, y la primera vez lo consideramos dos muestras independientes, y la segunda vez lo consideró emparejado ¿datos? He jugado con dos columnas de datos, ¡y parece que los valores son los mismos! En ese caso, ¿se puede decir que los diferentes nombres se usan solo por razones no cuantitativas?
fuente
Respuestas:
(Supongo que quiere decir "muestra" y no "población" en su primer párrafo).
La equivalencia es fácil de mostrar matemáticamente. Comience con dos muestras de igual tamaño, y . Luego defina{x1,…,xn} {y1,…,yn}
Luego tiene:
fuente
La distribución de la diferencia de medias debe ser más estrecha que la distribución de la diferencia de medias. Vea esto con un ejemplo sencillo: la media en la muestra 1: 1 10 100 1000 la media en la muestra 2: 2 11 102 1000 la diferencia de medias es 1 1 2 0 (a diferencia de las muestras en sí) tiene un estándar pequeño.
fuente