Estoy tratando de entender el cálculo de potencia para el caso de la prueba t de dos muestras independientes (no suponiendo variaciones iguales, entonces utilicé Satterthwaite).
Aquí hay un diagrama que encontré para ayudar a comprender el proceso:
Así que supuse que dado lo siguiente sobre las dos poblaciones y los tamaños de muestra:
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
Podría calcular el valor crítico bajo el valor nulo relacionado con tener 0.05 de probabilidad de cola superior:
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df) #equals 1.730018
y luego calcule la hipótesis alternativa (que para este caso aprendí es una "distribución t no central"). Calculé beta en el diagrama anterior usando la distribución no central y el valor crítico encontrado anteriormente. Aquí está el script completo en R:
#under alternative
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
#Under null
Sp<-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2))
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df)
#under alternative
diff<-mu1-mu2
t<-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2))
ncp<-(diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
#power
1-pt(t, df, ncp)
Esto da un valor de potencia de 0.4935132.
¿Es este el enfoque correcto? Me parece que si uso otro software de cálculo de potencia (como SAS, que creo que he configurado de manera equivalente a mi problema a continuación) obtengo otra respuesta (de SAS es 0.33).
CÓDIGO SAS:
proc power;
twosamplemeans test=diff_satt
meandiff = 1
groupstddevs = 3 | 2
groupweights = (1 1)
ntotal = 40
power = .
sides=1;
run;
En última instancia, me gustaría obtener una comprensión que me permitiera ver simulaciones para procedimientos más complicados.
EDITAR: Encontré mi error. debería haber sido
1 pt (CV, df, ncp) NO 1 pt (t, df, ncp)
fuente
Si está interesado principalmente en calcular el poder (en lugar de aprender haciéndolo a mano) y ya está utilizando R, mire el
pwr
paquete y las funcionespwr.t.test
opwr.t2n.test
. (estos pueden ser buenos para verificar sus resultados, incluso si lo hace a mano para aprender).fuente