¿Cuál es la diferencia entre tener algo estadísticamente significativo (como una diferencia entre dos muestras) y establecer si un grupo de números es independiente o dependiente?
fuente
¿Cuál es la diferencia entre tener algo estadísticamente significativo (como una diferencia entre dos muestras) y establecer si un grupo de números es independiente o dependiente?
La importancia en una prueba t de muestras independientes solo significa que la probabilidad (si el valor nulo fuera verdadero) de muestrear una diferencia de medias tan extrema como la diferencia de medias que usted realmente muestreó es menor que 0.05.
Esto no tiene ninguna relación con dependiente / independiente. "Dependiente" significa que la distribución de algunas observaciones individuales está relacionada con la distribución de otras, por ejemplo, A) son la misma persona que realiza la misma prueba por segunda vez, B) las personas de cada grupo se corresponden con alguna variable previa a la prueba, C) las personas en los dos grupos están relacionadas (es decir, la familia). "Independiente" significa que no existe tal conexión.
¿Por qué parar en -tests?t
Se puede pensar en dos variables que son no correlacionados como dos vectores ortogonales, exactamente igual que el y los ejes en un sistema de coordenadas tridimensional cartesiana dos.yX y
Cuando cualquiera de los dos vectores, digamos y está correlacionado con el otro, habrá una cierta parte de x que se puede proyectar en y y viceversa. Con eso en mente, es bastante fácil ver que desde entonces,yx y
Donde es el coeficiente de correlación de Pearson y es el producto interno de los argumentos. Cuando aprendí esto, me quedé totalmente impresionado por lo geométricamente simple que es la idea de correlación. Y esta definitivamente no es la única forma de medir la correlación entre dos (o más) variables.⟨ ⋅ , ⋅ ⟩r ⟨⋅,⋅⟩
La prueba de significación es un juego de pelota diferente. A menudo queremos saber cuánto difieren dos (o más) grupos en alguna variable de resultado como resultado de alguna manipulación que se realizó en dichos grupos. Como dijo Brian, desea saber si los dos grupos provienen de la misma distribución, por lo tanto, calcula la probabilidad de muestrear la diferencia de medias (escalada por el error estándar de la media) que obtuvo de su experimento, dado que la hipótesis nula (no hay diferencia significativa en los medios) es cierto. En la investigación del comportamiento (y a menudo en otros lugares) si esta probabilidad es menor a 0.05, puede concluir que la diferencia en los dos (o más) medios probablemente se deba a su manipulación.
EDITAR : Dilip Sarwate señaló que dos variables no correlacionadas pueden ser estadísticamente dependientes, así que saqué la primera parte. Gracias por eso.
fuente