¿Qué haces si tus grados de libertad superan el final de tus mesas?

11

Los grados de libertad en mi tabla F no aumentan lo suficiente para mi gran muestra.

Por ejemplo, si tengo una F con 5 y 6744 grados de libertad, ¿cómo encuentro el valor crítico del 5% para un ANOVA?

¿Qué pasa si estaba haciendo una prueba de chi-cuadrado con grandes grados de libertad?

[Una pregunta como esta se publicó hace un tiempo, pero el OP cometió un error y en realidad tenía un df más pequeño, reduciéndolo a un duplicado, pero la pregunta de df grande original debería tener una respuesta en algún lugar del sitio]

Glen_b -Reinstate a Monica
fuente
1
¿Conseguir una mesa más grande?
Federico Poloni

Respuestas:

16

Tablas F :

  1. La forma más fácil de todas, si puede, es usar un paquete de estadísticas u otro programa para darle el valor crítico. Entonces, por ejemplo, en R, podemos hacer esto:

     qf(.95,5,6744)
    [1] 2.215425
    

    (pero puede calcular fácilmente un valor p exacto para su F).

  2. Por lo general, las tablas F vienen con un grado de libertad "infinito" al final de la tabla, pero algunas no. Si tiene un df realmente grande (por ejemplo, 6744 es realmente grande), puede usar la entrada infinito ( ) en su lugar.

    Por lo tanto, puede tener tablas para que dan 120 df y df:ν1=5

          ...    5      ...
     ⁞
    120        2.2899   
     ∞         2.2141
    

    La fila df allí funcionará para cualquier realmente grande (denominador df). Si usamos eso, tenemos 2.2141 en lugar del 2.2154 exacto, pero eso no es tan malo.nu 2ν2

  3. Si no tiene una entrada de infinitos grados de libertad, puede calcular uno desde una tabla de chi-cuadrado, utilizando el valor crítico para el numerador df dividido por esos df

    Entonces, por ejemplo, para un valor crítico , tome un valor crítico y divídalo entre . El valor crítico del 5% para a es . Si dividimos entre es que es la fila de la tabla anterior. χ 2 5 5 χ 2 5 11.0705 5 2.2141 F5,χ525χ5211.070552.2141

  4. Si sus grados de libertad pueden ser demasiado pequeños para usar la entrada "infinito" (pero aún más grande que 120 o lo que sea que su tabla suba) puede usar la interpolación inversa entre el df finito más alto y la entrada infinita. Digamos que queremos calcular un valor crítico para dfF5,674

       F       df     120/df    
     ------   ----    -------
     2.2899    120      1     
       C       674    0.17804
     2.2141     ∞       0    
    

    Luego calculamos el valor crítico desconocido, comoC

    C2.2141+(2.28992.2141)×(0.178040)/(10)2.2276

    (El valor exacto es , por lo que funciona bastante bien).2.2274

    Se proporcionan más detalles sobre la interpolación y la interpolación inversa en esa publicación vinculada.


Mesas Chi-cuadrado :

Si su df chi-cuadrado es realmente grande, puede usar tablas normales para obtener una aproximación.

Para df grande, la distribución de chi-cuadrado es aproximadamente normal con media y varianza . Para obtener el valor superior del 5%, tome el valor crítico del 5% de una cola para un estándar normal ( ) y multiplíquelo por y agregue .ν 2 ν 1.645 νν2ν1.645 ν2νν

Por ejemplo, imagine que necesitamos un valor crítico superior del 5% para un .χ67442

Calcularíamos . La respuesta exacta (a cifras significativas) es .1.645×2×6744+6744693556936.2

Si los grados de libertad son menores, podemos usar el hecho de que si es entonces .Xχν22X˙N(2ν1,1)

Entonces, por ejemplo, si tuviéramos df, podríamos usar esta aproximación. El valor crítico superior exacto del 5% para un chi-cuadrado con 674 df es (a 5 cifras) . Con esta aproximación, calcularíamos lo siguiente:674735.51

Tome el valor crítico superior (una cola) del 5% para un estándar normal (1.645), agregue , cuadre el total y divida entre 2. En este caso:2ν1

(1.645+2×6741)2/2735.2 .

Como vemos, esto está bastante cerca.

Para grados de libertad considerablemente menores, se podría usar la transformación Wilson-Hilferty, que funciona bien solo con unos pocos grados de libertad, pero las tablas deberían cubrir eso. Esta aproximación es que .(Xν)13˙N(129ν,29ν)

Glen_b -Reinstate a Monica
fuente
2
+1 La idea se puede mejorar. Use el hecho de que limita a una función racional de una medida que su segundo parámetro crece. En , por ejemplo, lo calcularías como . Obtendrá , con una precisión de tres cifras significativas. Tenga en cuenta que el parámetro es un número entero pequeño, lo que indica que probablemente estará en la tabla y estará disponible sin interpolación. F χ 2 2.2177 χ 2χ2Fχ2Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))2.2177χ2
Whuber
Supongo que me he perdido algo aquí: he intentado varias veces averiguar qué ventaja quiere decir en esta mejora sobre lo que hice en el ítem 3 (que ya lo trata como una función simple de un chi-cuadrado con un número entero pequeño df, como sugeriría el teorema de Slutsky como df2 ). En el ejemplo en cuestión, mi aproximación es más simple de realizar y más precisa (por ejemplo, tiene aproximadamente el 57% del error absoluto). ¿Es esta sugerencia mejor en otros valores de los dos df, o mejor porque es conservador en lugar de anticonservador, ...
Glen_b -Reinstate a Monica el
... o es la intención de que los errores de los dos enfoques sean opuestos en dirección (¿sugiriendo quizás combinar los dos?).
Glen_b -Reinstate a Monica el
Recuerdo que me refería al artículo 4.
whuber
Ah, eso podría tener más sentido. Perdón por ser denso. Lo intentaré de nuevo.
Glen_b -Reinstate a Monica el