Digamos que tenemos las estadísticas que figuran a continuación.
gender mean sd n
f 1.666667 0.5773503 3
m 4.500000 0.5773503 4
¿Cómo se realiza una prueba t de dos muestras (para ver si hay una diferencia significativa entre las medias de hombres y mujeres en alguna variable) usando estadísticas como esta en lugar de datos reales?
No pude encontrar en ningún lugar de Internet cómo hacer esto. La mayoría de los tutoriales e incluso el manual tratan la prueba solo con el conjunto de datos real.
?pt
), vea especialmentept()
, tiene toda la información que necesitaría para hacerlo usted mismo. Y aprenderás mucho sobre estadísticas y R si haces eso.tsum.test
función en el paquete BSDA , que implementa una prueba t (dos muestras; Welch o varianza igual y también una muestra) a partir de los datos de resumen que proporcione. Básicamente funciona como la prueba t en vainilla R pero en la información de resumen.tsum.test()
laBSDA library
indicada por @Nick Cox. Hace exactamente lo mismo que escribió @macro en líneas de código. Si se formula la pregunta, ¿cuál es la comprensión del cálculo de fondo para calcular el estadístico de la prueba t en R, entonces Marco sería una respuesta más apropiada? Tenga en cuenta que no estoy tratando de ofender a nadie, solo declaro mi opinión personal relacionada con mi experiencia profesional. Y @marco que es una codificación ordenada :)Respuestas:
Puede escribir su propia función en función de lo que sabemos sobre la mecánica de la prueba dos muestrast . Por ejemplo, esto hará el trabajo:
fuente
t.test
fue rechazada, así que aquí hay un código para confirmar:(tt2 <- t.test2(mean(x1), mean(x2), sd(x1), sd(x2), length(x1), length(x2))); (tt <- t.test(x1, x2)); tt$statistic == tt2[["t"]]; tt$p.value == tt2[["p-value"]]
Simplemente calcule a mano:
La diferencia esperada es probablemente cero.
Si desea el valor p simplemente use la
pt()
función:Por lo tanto, poniendo el código juntos:
Esto supone variaciones iguales, lo cual es obvio porque tienen la misma desviación estándar.
fuente
R
"? ¿Cuál es la distribución del estadístico de prueba (es decir, cómo se pasa de esto a los valores )?Puede hacer los cálculos basados en la fórmula del libro (en la página web), o puede generar datos aleatorios que tengan las propiedades indicadas (ver la
mvrnorm
función en elMASS
paquete) y usar lat.test
función regular en los datos simulados.fuente
mvrnorm
función en elMASS
paquete (debe establecer el argumento empírico en VERDADERO).La pregunta se refiere a R, pero el problema puede surgir con cualquier otro software estadístico. Stata, por ejemplo, tiene varios llamados comandos inmediatos, que permiten realizar cálculos únicamente a partir de estadísticas resumidas. Consulte http://www.stata.com/manuals13/rttest.pdf para ver el caso particular del
ttesti
comando, que se aplica aquí.fuente