¿Fórmula de tamaño de muestra para una prueba F?

12

Me pregunto si hay una fórmula de tamaño de muestra como la fórmula de Lehr que se aplica a una prueba F. La fórmula de Lehr para las pruebas t es n=16/Δ2 , donde Δ es el tamaño del efecto ( por ejemplo, Δ=(μ1μ2)/σ ). Esto se puede generalizar a n=c/Δ2 donde c es una constante que depende de la tasa de tipo I, la potencia deseada y si se está realizando una prueba unilateral o bilateral.

Estoy buscando una fórmula similar para una prueba F. Mi estadística de prueba se distribuye, bajo la alternativa, como una F no central con k,n grados de libertad y parámetro de no centralidad nλ , donde λ depende solo de los parámetros de la población, que son desconocidos pero que se postula para tomar algún valor. El parámetro k lo fija el experimento, n es el tamaño de la muestra. Idealmente, estoy buscando una fórmula (preferiblemente conocida) de la forma

n=cg(k,λ)
dondecdepende solo de la tasa de tipo I y la potencia.

El tamaño de la muestra debe satisfacer donde F ( x ; k , n , δ ) es el CDF de un F central con k , n dof y parámetro de no centralidad δ , y α , β son las tasas de tipo I y tipo II. Podemos asumir

F(F1(1α;k,n,0);k,n,nλ)=β,
F(x;k,n,δ)k,nδα,β ,es decir, n necesita ser 'suficientemente grande'.kn n

Mis intentos de jugar con esto en R no han sido fructíferos. He visto sugiere k + 1, pero los ajustes no se han visto muy bien.g(k,λ)=λ/k+1

editar: originalmente había declarado vagamente que el parámetro de no centralidad 'depende' del tamaño de la muestra. Pensándolo bien, lo encontré demasiado confuso, por lo que la relación quedó clara.

Además, puedo calcular el valor de exactamente resolviendo la ecuación implícita a través de un buscador de raíz ( por ejemplo, el método de Brent). Estoy buscando una ecuación para guiar mi intuición y para usar como regla general.n

shabbychef
fuente
1
Para aclarar, ¿es correcto que ya pueda obtener el requerido , pero está buscando una fórmula general? Me sorprendería mucho si hay una fórmula general útil. n
mark999

Respuestas:

1

Me pregunto si hay una fórmula de tamaño de muestra como la fórmula de Lehr que se aplica a una prueba F.

La página web " Herramientas eléctricas para epidemiólogos " explica:

  • Diferencia entre dos medias (Lehr):

    Digamos, por ejemplo, que desea demostrar una diferencia de 10 puntos en el coeficiente intelectual entre dos grupos, uno de los cuales está expuesto a una toxina potencial y el otro no. Usando un coeficiente intelectual de población promedio de 100 y una desviación estándar de 20:

    ngroup=16(10090/20)2

    ngroup=16(.5)2=64
  • Cambio porcentual en medias

    Los investigadores clínicos pueden sentirse más cómodos pensando en términos de cambios porcentuales en lugar de diferencias en los medios y la variabilidad. Por ejemplo, alguien podría estar interesado en una diferencia del 20% entre dos grupos de datos con una variabilidad de aproximadamente el 30%. El profesor van Belle presenta un enfoque ordenado para este tipo de números que utiliza el coeficiente de variación (cv) 4 y traduce el cambio porcentual en una relación de medias.

    La variación en la escala logarítmica (ver capítulo 5 en van Belle) es aproximadamente igual al coeficiente de variación en la escala original, por lo que la fórmula de Lehr se puede traducir a una versión que use cv

    ngroup=16(c.v.)2(ln(μ0)ln(μ1))2

    Entonces podemos usar el cambio porcentual como la razón de medias, donde

    r.m.=μ0μ1μ0=1μ1μ0

    para formular una regla de oro:

    ngroup=16(c.v.)2(ln(r.m.))2

    En el ejemplo anterior, un cambio del 20% se traduce en una relación de medias de 1 − .20 = .80. (Un cambio del 5% daría como resultado una relación de medias de 1 − .05 = .95; un cambio del 35% 1 − .35 = .65, y así sucesivamente). Entonces, el tamaño de la muestra para un estudio que busca demostrar un 20% de cambio en los medios con datos que varían aproximadamente 30% alrededor de los medios

    ngroup=16(.3)2(ln(.8))2=29

An R function based on this rule would be:

1   nPC<-function(cv, pc){
2       x<-16*(cv)^2/((log((1-pc)))^2)
3       print(x)
4   }

Say you were interested in a 15% change from one group to another, but were uncertain about how the data varied. You could look at a range of values for the coefficient of variation:

1   a<-c(.05,.10,.15,.20,.30,.40,.50,.75,1)
2   nPC(a,.15)

You could use this to graphically display your results:

1   plot(a,nPC(a,.15),  ylab="Number in Each Group", 
2   xlab="By Varying Coefficent of Variation", 
3   main="Sample Size Estimate for a 15% Difference")

Consulte también: iSixSigma " Cómo determinar el tamaño de la muestra " y RaoSoft " Calculadora en línea del tamaño de la muestra ".

Robar
fuente