Los grados de libertad en mi tabla F no aumentan lo suficiente para mi gran muestra.
Por ejemplo, si tengo una F con 5 y 6744 grados de libertad, ¿cómo encuentro el valor crítico del 5% para un ANOVA?
¿Qué pasa si estaba haciendo una prueba de chi-cuadrado con grandes grados de libertad?
[Una pregunta como esta se publicó hace un tiempo, pero el OP cometió un error y en realidad tenía un df más pequeño, reduciéndolo a un duplicado, pero la pregunta de df grande original debería tener una respuesta en algún lugar del sitio]
chi-squared
degrees-of-freedom
f-distribution
tables
Glen_b -Reinstate a Monica
fuente
fuente
Respuestas:
Tablas F :
La forma más fácil de todas, si puede, es usar un paquete de estadísticas u otro programa para darle el valor crítico. Entonces, por ejemplo, en R, podemos hacer esto:
(pero puede calcular fácilmente un valor p exacto para su F).
Por lo general, las tablas F vienen con un grado de libertad "infinito" al final de la tabla, pero algunas no. Si tiene un df realmente grande (por ejemplo, 6744 es realmente grande), puede usar la entrada infinito ( ) en su lugar.∞
Por lo tanto, puede tener tablas para que dan 120 df y df:∞ν1= 5 ∞
La fila df allí funcionará para cualquier realmente grande (denominador df). Si usamos eso, tenemos 2.2141 en lugar del 2.2154 exacto, pero eso no es tan malo.nu 2∞ ν2
Si no tiene una entrada de infinitos grados de libertad, puede calcular uno desde una tabla de chi-cuadrado, utilizando el valor crítico para el numerador df dividido por esos df
Entonces, por ejemplo, para un valor crítico , tome un valor crítico y divídalo entre . El valor crítico del 5% para a es . Si dividimos entre es que es la fila de la tabla anterior. χ 2 5 5 χ 2 5 11.0705 5 2.2141 ∞F5,∞ χ25 5 χ25 11.0705 5 2.2141 ∞
Si sus grados de libertad pueden ser demasiado pequeños para usar la entrada "infinito" (pero aún más grande que 120 o lo que sea que su tabla suba) puede usar la interpolación inversa entre el df finito más alto y la entrada infinita. Digamos que queremos calcular un valor crítico para dfF5,674
Luego calculamos el valor crítico desconocido, comoC
(El valor exacto es , por lo que funciona bastante bien).2.2274
Se proporcionan más detalles sobre la interpolación y la interpolación inversa en esa publicación vinculada.
Mesas Chi-cuadrado :
Si su df chi-cuadrado es realmente grande, puede usar tablas normales para obtener una aproximación.
Para df grande, la distribución de chi-cuadrado es aproximadamente normal con media y varianza . Para obtener el valor superior del 5%, tome el valor crítico del 5% de una cola para un estándar normal ( ) y multiplíquelo por y agregue .ν 2 ν 1.645 √ν ν 2ν 1.645 ν2ν−−√ ν
Por ejemplo, imagine que necesitamos un valor crítico superior del 5% para un .χ26744
Calcularíamos . La respuesta exacta (a cifras significativas) es .1.645×2×6744−−−−−−−√+6744≈6935 5 6936.2
Si los grados de libertad son menores, podemos usar el hecho de que si es entonces .X χ2ν 2X−−−√∼˙N(2ν−1−−−−−√,1)
Entonces, por ejemplo, si tuviéramos df, podríamos usar esta aproximación. El valor crítico superior exacto del 5% para un chi-cuadrado con 674 df es (a 5 cifras) . Con esta aproximación, calcularíamos lo siguiente:674 735.51
Tome el valor crítico superior (una cola) del 5% para un estándar normal (1.645), agregue , cuadre el total y divida entre 2. En este caso:2ν−1−−−−−√
Como vemos, esto está bastante cerca.
Para grados de libertad considerablemente menores, se podría usar la transformación Wilson-Hilferty, que funciona bien solo con unos pocos grados de libertad, pero las tablas deberían cubrir eso. Esta aproximación es que .(Xν)13∼˙N(1−29ν,29ν)
fuente
R
df2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))