¿Existe una prueba estadística para comparar dos muestras de tamaño 1 y 3?

Para un proyecto de ecología, mi grupo de laboratorio agregó vinagre a 4 tanques que contenían volúmenes iguales de agua de estanque, 1 control sin elodea (una planta acuática) y 3 tratamientos con la misma cantidad de elodea en cada uno. El propósito de agregar el vinagre era reducir el pH. La hipótesis era que los tanques con elodea volverían a su pH normal más rápido. Este fue de hecho el caso. Medimos el pH de cada tanque diariamente durante aproximadamente dos semanas. Todos los tanques finalmente volvieron a su pH natural, pero el tiempo que esto tomó fue mucho más corto para los tanques con elodea.

Cuando le contamos a nuestro profesor sobre nuestro diseño experimental, dijo que no existe una prueba estadística que pueda realizarse en los datos para comparar el control con el tratamiento. Que debido a que no hubo una réplica para el control (solo usamos un tanque de control) no podemos calcular la varianza y, por lo tanto, no podemos comparar las medias de muestra del control y el tratamiento. Entonces mi pregunta es, ¿es esto cierto? Definitivamente entiendo lo que quiere decir. Por ejemplo, si tomaste la altura de un hombre y una mujer, no puedes sacar conclusiones sobre sus respectivas poblaciones. Pero hicimos 3 tratamientos, y la varianza fue pequeña. ¿Parece razonable suponer que la varianza sería similar en el control?

Actualizar:

Gracias por la excelente respuesta. Obtuvimos más agua y elodea del humedal y decidimos volver a realizar el experimento con tanques más pequeños, pero esta vez con 5 controles y 5 tratamientos. Íbamos a combinar esto con nuestros datos originales, pero el pH inicial de los tanques fue lo suficientemente diferente que no parece válido considerar que el nuevo experimento se muestreará de la misma población que el experimento original.

Consideramos agregar diferentes cantidades de elodea y tratar de correlacionar la velocidad de remediación del pH (medida como el tiempo transcurrido hasta que el pH volvió a su valor original) con la cantidad de elodea, pero decidimos que no era necesario. Nuestro objetivo es solo mostrar que el elodea hace una diferencia positiva, no construir algún tipo de modelo predictivo para saber exactamente cómo responde el pH a diferentes cantidades de elodea. Sería interesante determinar la cantidad óptima de elodea, pero esa es probablemente la cantidad máxima que puede sobrevivir. Intentar ajustar una curva de regresión a los datos no sería especialmente esclarecedor debido a los diversos cambios complicados que ocurren en la comunidad al agregar una gran cantidad. La elodea muere, se descompone, nuevos organismos comienzan a dominar, y así sucesivamente.

hypothesis-testing t-test sample-size Simon Hunt
fuente

¿Agregó la misma cantidad de Elodea a cada uno de los 3 tanques de 'tratamiento'?

gung - Restablece a Monica

Sí, agregamos la misma cantidad de Elodea a cada tratamiento.

Simon Hunt

Respuestas:

Note la pregunta de Gung; importa. Asumiré que el tratamiento fue el mismo para todos los tanques del grupo de tratamiento.

Si puede argumentar que la varianza sería igual para los dos grupos (que normalmente supondría para una prueba t de dos muestras de todos modos), puede hacer una prueba. Simplemente no puede verificar esa suposición, sin importar cuán gravemente violada pueda ser.

Las preocupaciones expresadas en esta respuesta a una pregunta relacionada son aún más relevantes para su situación, pero hay menos que pueda hacer al respecto.

[Usted pregunta si es razonable asumir que las variaciones son iguales. No podemos responder eso por usted, eso es algo que tendría que convencer a los expertos en la materia (es decir, ecologistas) era una suposición razonable. ¿Existen otros estudios en los que dichos niveles se hayan medido tanto bajo tratamiento como control? Otros donde se han realizado pruebas similares (pruebas t o anova especialmente , apuesto a que puede encontrar un mejor precedente) o se han hecho suposiciones similares. ¿Alguna forma de razonamiento general que puede ver para aplicar?]

Si es la media muestral del tratamiento y es la media del control, y ambos provienen de distribuciones normales con varianza , entonces tendrá una media y una varianza independientemente de si una de las es 1. $\bar{x}$ $\bar{y}$ $\sigma^2$ $\bar{x}-\bar{y}$ $\mu_x - \mu_y$ $\sigma^2 (1/n_x + 1/n_y)$ $n$

Entonces, cuando es 1, $n_y$

\frac{(\bar{X} - \bar{y})}{s_{X} \sqrt{1 / / {norte}_{X} + 1}}

$\frac{(\bar{x}-\bar{y})}{s_x\sqrt{1/n_x+1}}$

(donde es la desviación estándar calculada a partir de los tratamientos) se distribuirá en (con grados de libertad) debajo del valor nulo. $s_x$ $t$ $n_x - 1$

Puede observar que con la mejor estimación disponible de , utilizada para , esto es exactamente como la fórmula de prueba t de dos muestras ordinaria con establecido en 1. $\sigma$ $s_x$ $s_p$ $n_y$

Editar:

Aquí hay una curva de potencia simulada para esta prueba. El tamaño de la muestra en el nulo fue de 10000, en los otros puntos fue de 1000. Como puede ver, la tasa de rechazo en el nulo es de 0.05, y la curva de potencia, aunque requiere una gran diferencia en la población significa tener un poder decente, tiene el forma correcta Es decir, esta prueba hace lo que se supone que debe hacer.

curva de potencia

(Fin de edición)

Sin embargo, con tamaños de muestra tan pequeños, esto será algo sensible a los supuestos de distribución.

Si está preparado para hacer suposiciones diferentes, o si desea probar la igualdad de alguna otra cantidad de población, aún puede ser posible realizar alguna prueba.

Entonces, no todo está perdido ... pero cuando sea posible, generalmente es mejor tener al menos alguna replicación en ambos grupos.

Glen_b -Reinstate a Monica
fuente

Tenga en cuenta que deberá seguir las fórmulas descritas en @Glen_b. Tanto Excel como Minitab no calcularán esto.

zbicyclist

(+1) Un enfoque equivalente (usando la misma fórmula), y por lo tanto más municiones para justificar esta respuesta, es que puede calcular un intervalo de predicción para un valor futuro del grupo de tratamiento. Si el valor de control no cae dentro de ese intervalo de predicción, tiene evidencia significativa de una diferencia entre los dos grupos. La diferencia podría ser una combinación de una diferencia en la media o una diferencia en las variaciones, pero hay (probablemente) una diferencia.

whuber

σ

$\sigma$

\frac{(\bar{x} - 12)}{s_{x} \sqrt{1 / n_{x}}}

$\frac{(\bar{x}-12)}{s_x\sqrt{1/n_x}}$

t

$t$

@Glen_b: No estoy seguro de si esto ha cambiado en noviembre pasado, pero R 3.0 realizará una prueba t agrupada cuando uno de los tamaños de muestra es uno y da la misma respuesta que un anova.

Aaron - Restablece a Mónica el

Para cualquiera que quiera probarlo en R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - parece que esto funciona tanto en R2.15.2 como en R3.0.0 (las dos únicas versiones que tengo a mano).

Glen_b -Reinstala a Mónica el