t.test devuelve un error "los datos son esencialmente constantes"

12
R version 3.1.1 (2014-07-10) -- "Sock it to Me"
> bl <- c(140, 138, 150, 148, 135)
> fu <- c(138, 136, 148, 146, 133)
> t.test(fu, bl, alternative = "two.sided", paired = TRUE)
Error in t.test.default(fu, bl, alternative = "two.sided", paired = TRUE) : 
data are essentially constant

Luego cambio solo un carácter en mi conjunto de datos fu:

> fu <- c(138, 136, 148, 146, 132)

y corre ...

> t.test(fu, bl, alternative = "two.sided", paired = TRUE)

    Paired t-test

¿Que me estoy perdiendo aqui?

ihadanny
fuente
55
Tipo bl-fu. Ahora sd(bl-fu). Si no es obvio, sin embargo, hacer esto: dif=bl-fua continuación, n=length(dif)entonces mean(dif)/(sd(dif)/sqrt(n))... ¿ves ahora?
Glen_b -Reinstale a Monica el
whoops, gracias :) de acuerdo conmigo en que el mensaje de error podría haber sido más amigable para los novatos. Entonces, esto significa que, en lo que respecta a las estadísticas, no hay necesidad de un t.test elegante y es una certeza de que para cada sujeto habría una reducción de -2 en el fu en comparación con el bl.
ihadanny

Respuestas:

9

Como se mencionó en los comentarios, el problema era que las diferencias eran todas 2 (o -2, dependiendo de la forma en que escriba los pares).


Respondiendo a la pregunta en los comentarios:

Entonces, esto significa que, en lo que respecta a las estadísticas, no hay necesidad de un t.test elegante y es una certeza de que para cada sujeto habría una reducción de -2 en el fu en comparación con el bl.

Bueno eso depende.

Si la distribución de las diferencias fuera realmente normal, esa sería la conclusión, pero podría ser que la suposición de normalidad es incorrecta y que la distribución de las diferencias en las mediciones es realmente discreta (tal vez en la población a la que desea hacer una inferencia sobre esto es generalmente -2). pero ocasionalmente diferente de -2).

De hecho, al ver que todos los números son enteros, parece que la discreción es probablemente el caso.

... en cuyo caso no existe la certeza de que todas las diferencias serán -2 en la población; es más, hay una falta de evidencia en la muestra de que una diferencia en la población signifique algo diferente de -2.

(Por ejemplo, si el 87% de las diferencias de población fueron -2, existe una probabilidad de 50-50 de que cualquiera de las 5 diferencias de la muestra sea diferente a -2. Por lo tanto, la muestra es bastante consistente con una variación de -2 en la población)

Pero también se lo llevaría a cuestionar la idoneidad de los supuestos para la prueba t, especialmente en una muestra tan pequeña.

Glen_b -Reinstate a Monica
fuente
son presiones sanguíneas en mmHg en una línea de base y controles de seguimiento, así que estoy bastante relajado sobre asumir la normalidad y, por supuesto, la no discreción. Fue solo un ejercicio que me mostró cuánto más poderoso es la prueba t emparejada (cuando está disponible) en comparación con la no emparejada.
ihadanny