Digamos que tenemos las estadísticas que figuran a continuación.
gender mean sd n
f 1.666667 0.5773503 3
m 4.500000 0.5773503 4
¿Cómo se realiza una prueba t de dos muestras (para ver si hay una diferencia significativa entre las medias de hombres y mujeres en alguna variable) usando estadísticas como esta en lugar de datos reales?
No pude encontrar en ningún lugar de Internet cómo hacer esto. La mayoría de los tutoriales e incluso el manual tratan la prueba solo con el conjunto de datos real.

?pt), vea especialmentept(), tiene toda la información que necesitaría para hacerlo usted mismo. Y aprenderás mucho sobre estadísticas y R si haces eso.tsum.testfunción en el paquete BSDA , que implementa una prueba t (dos muestras; Welch o varianza igual y también una muestra) a partir de los datos de resumen que proporcione. Básicamente funciona como la prueba t en vainilla R pero en la información de resumen.tsum.test()laBSDA libraryindicada por @Nick Cox. Hace exactamente lo mismo que escribió @macro en líneas de código. Si se formula la pregunta, ¿cuál es la comprensión del cálculo de fondo para calcular el estadístico de la prueba t en R, entonces Marco sería una respuesta más apropiada? Tenga en cuenta que no estoy tratando de ofender a nadie, solo declaro mi opinión personal relacionada con mi experiencia profesional. Y @marco que es una codificación ordenada :)Respuestas:
Puede escribir su propia función en función de lo que sabemos sobre la mecánica de la prueba dos muestrast . Por ejemplo, esto hará el trabajo:
fuente
t.testfue rechazada, así que aquí hay un código para confirmar:(tt2 <- t.test2(mean(x1), mean(x2), sd(x1), sd(x2), length(x1), length(x2))); (tt <- t.test(x1, x2)); tt$statistic == tt2[["t"]]; tt$p.value == tt2[["p-value"]]Simplemente calcule a mano:
La diferencia esperada es probablemente cero.
Si desea el valor p simplemente use la
pt()función:Por lo tanto, poniendo el código juntos:
Esto supone variaciones iguales, lo cual es obvio porque tienen la misma desviación estándar.
fuente
R"? ¿Cuál es la distribución del estadístico de prueba (es decir, cómo se pasa de esto a los valores )?Puede hacer los cálculos basados en la fórmula del libro (en la página web), o puede generar datos aleatorios que tengan las propiedades indicadas (ver la
mvrnormfunción en elMASSpaquete) y usar lat.testfunción regular en los datos simulados.fuente
mvrnormfunción en elMASSpaquete (debe establecer el argumento empírico en VERDADERO).La pregunta se refiere a R, pero el problema puede surgir con cualquier otro software estadístico. Stata, por ejemplo, tiene varios llamados comandos inmediatos, que permiten realizar cálculos únicamente a partir de estadísticas resumidas. Consulte http://www.stata.com/manuals13/rttest.pdf para ver el caso particular del
ttesticomando, que se aplica aquí.fuente