Cuando n aumenta, el valor t aumenta en una prueba de hipótesis, pero la tabla t es todo lo contrario. ¿Por qué?

La fórmula para en una prueba de hipótesis viene dada por: $t$

t = \frac{\bar{X} - μ}{\hat{σ} / \sqrt{n}} .

$t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}.$

Cuando aumenta, el valor aumenta de acuerdo con la fórmula anterior. Pero, ¿por qué disminuye el valor crítico en la tabla cuando (que es una función de ) aumenta? $n$ $t$ $t$ $t$ $\text{df}$ $n$

hypothesis-testing self-study statistical-significance t-test t-distribution leviatán
fuente

Respuestas:

Estos son dos fenómenos diferentes:

$t$ -estadística

Manteniendo todo lo demás constante, si $N$ aumenta la $t$ -valor debe aumentar como una simple cuestión de aritmética. Considere la fracción en el denominador, $\hat\sigma/\sqrt{n}$ , Si $n$ se hace más grande, entonces $\sqrt n$ también se hará más grande (aunque más lentamente), porque la raíz cuadrada es una transformación monotónica. Desde la raíz cuadrada de $n$ es el denominador de esa fracción, a medida que se hace más grande, la fracción se hará más pequeña. Sin embargo, esta fracción es, a su vez, un denominador. Como resultado, a medida que ese denominador se hace más pequeño, la segunda fracción se hace más grande. Por lo tanto, la $t$ -valor se hará más grande a medida que $n$ se hace más grande. (Suponiendo, de nuevo, que $\hat\sigma$ y $(\bar x - \mu_{\rm null})$ permanece igual.)

¿Qué significa esto conceptualmente? Bueno, cuantos más datos tengamos / cuanto más se acerque el tamaño de la muestra al tamaño de la población, menos lejos la media de la muestra tenderá a variar de la media de la población debido a un error de muestreo (cf. la ley de los grandes números ). Con una población pequeña y finita, esto es fácil de ver, pero aunque no sea tan intuitivo, lo mismo ocurre si la población es infinita. Dado que la media de la muestra ( $\bar x$ ) no debería fluctuar muy lejos del valor de referencia (nulo), podemos estar más seguros de que la distancia observada entre la media de la muestra y la nula se debe a que el valor nulo no es en realidad la media de la población de la que se extrajo la muestra . Más exactamente, es cada vez menos probable haber encontrado una media muestral muy lejos o más lejos del valor nulo, si el valor nulo realmente fuera la media de la población de la cual se extrajo la muestra.
$t$ -distribución

Cuando miras un $t$ -table (digamos, en la parte posterior de un libro de estadísticas), lo que realmente está viendo es una tabla de valores críticos . Es decir, el valor que observaron $t$ la estadística debe ser mayor que para que la prueba sea "significativa" en ese alfa. (Por lo general, estos se enumeran para un pequeño número de posibles alfa: $\alpha=\{.10,\ .05,\ .01,\ .001\}$ .) Sospecho que si miras detenidamente estas tablas, en realidad están pensando en términos de los grados de libertad asociados con el $t$ estadística en cuestión. Tenga en cuenta que los grados de libertad para el $t$ -estadística es una función de $n$ , siendo $df = n-2$ para un grupo dos $t$ -test o $df = n-1$ para un grupo $t$ -test (su ejemplo parece ser el último). Esto tiene que ver con el hecho de que el $t$ -distribución convergerá a una distribución normal estándar a medida que los grados de libertad se aproximen al infinito.

La manera de entender esto conceptualmente es pensar por qué necesita usar el $t$ -distribución en primer lugar. Usted sabe cuál es el valor medio de referencia que le interesa y la muestra significa que observó. Si la población de la que se extrajeron las muestras se distribuyó normalmente (lo que la gente suele suponer implícitamente), entonces sabemos que la distribución muestral de la media también se distribuirá normalmente. Entonces, ¿por qué molestarse con el $t$ -¿distribución? La respuesta es que no estamos seguros de cuál es la desviación estándar de la población. (Si estuviéramos seguros, realmente usaríamos la distribución normal, es decir, la $z$ -prueba en lugar de la $t$ -test.) Así que usamos nuestra desviación estándar de muestra, $\hat\sigma$ , como proxy del valor de población desconocido. Sin embargo, cuantos más datos tengamos, más seguros podemos estar de que $\hat\sigma$ es de hecho aproximadamente el valor correcto. Como $n$ se acerca al tamaño de la población (y / o infinito), podemos estar seguros de que $\hat\sigma$ de hecho es exactamente el valor correcto. Por lo tanto, la $t$ -distribución se convierte en la distribución normal .

gung - Restablece a Monica
fuente

Esa es una gran respuesta larga. ¿Por qué no moverlo de los comentarios para ser la respuesta?

Harvey Motulsky

Gracias, @HarveyMotulsky. ¿Qué quieres decir con la última oración? Se publica como una respuesta, no como un comentario.

gung - Restablece a Monica

O algo cambió en el último minuto, o lo vi mal. Es una gran respuesta, y publicado como tal.

Harvey Motulsky

¿Significa esto que el n que hemos usado en la fórmula del valor t no tiene nada que ver con la fórmula que se usa para generar los valores t críticos? Lo que me confunde es con que cuando df (que es una función de n) aumenta en la tabla t, los valores t críticos disminuyen mientras que no es el caso en el valor t de la fórmula en la pregunta original. Aunque vemos la misma n en ambos lugares (tabla y fórmula), sin embargo, actúan de manera diferente.

Leviatán el

(Por cierto, creo que mi respuesta está dirigida a su pregunta tal como está editada. Avíseme si todavía hay alguna falta de claridad).

Gung - Restablezca a Monica

Bueno, la respuesta corta es que eso es lo que cae de las matemáticas. La respuesta larga sería hacer los cálculos. $^3$ . En cambio, trataré de reformular la explicación de Gung de que estas son dos cosas diferentes (aunque relacionadas).

Has recogido una muestra $X_1...X_n$ que normalmente se distribuye con varianza desconocida $^4$ y quiero saber si su promedio es diferente de algún valor especificado $\mu$ . La forma de hacerlo es calcular un valor que represente cuán "diferentes" son sus observaciones del supuesto de que $\bar{x}=\mu$ . Así, la fórmula para el $t$ -estadística $^1$ usted presentó Probablemente la forma más intuitiva de pensar por qué esto aumenta con $n$ es que tienes más "confianza" de que las cosas son diferentes cuando tienes más muestras.

Continuando, este valor sigue un $t$ -distribución $^2$ con $n-1$ grados de libertad. La forma de pensar en esto es que el $t$ -la distribución es ligeramente diferente según el tamaño de la muestra. Puede ver gráficos de esta distribución con 2, 3, 5 y 20 df a continuación. distribución t, df = 2,3,5,20 Notarás que una df más alta tiene más masa en el centro y menos en las colas de la distribución (no tengo un razonamiento intuitivo de por qué las distribuciones se comportan de esta manera, lo siento). El critico $t$ -value es la ubicación x donde el área debajo de la curva es igual a un valor algo arbitrario de su elección (tradicionalmente 0.05). Estos valores están marcados en el gráfico como puntos. Entonces, para la curva verde (df = 5), el área debajo de la curva a la izquierda del punto verde izquierdo = 0.025, y el área debajo de la curva a la derecha del punto verde derecho = 0.025, para un total de 0.05.

Esta es la razón por la crítica $t$ -los valores disminuyen con el aumento de los grados de libertad: a medida que aumenta df, los valores críticos deben acercarse a cero para mantener la misma área debajo de la curva. Y como mencionó Gung, como df va a $\infty$ , la curva y los valores críticos se acercarán a los de una distribución normal estándar.

Así que ahora tienes tu valor crítico y tu $t$ -estadística, y puede realizar el $t$ -prueba. Si tu $t$ -estadística es mayor que el valor crítico, entonces puede hacer la declaración de que si $\bar{x}=\mu$ realmente era cierto, entonces habría observado su muestra menos del 5% (o cualquier porcentaje arbitrario que eligió para calcular el valor crítico) del tiempo.

$^1$ ¿Por qué calculamos este valor en particular a partir de los muchos valores arbitrarios que podríamos calcular? Bueno, esto es lo que cae de un cálculo de una prueba de razón de probabilidad $^3$ .
Si conocía la varianza de las muestras de antemano, el $z$ -estadística (siguiendo una distribución normal) mencionada por gung quedaría fuera de este cálculo en su lugar, y realizaría un $z$ -prueba
$^2$ De nuevo, esto es lo que cae de las matemáticas. $^3$
$^3$ Primer buen resultado de google: http://math.arizona.edu/~jwatkins/ttest.pdf
$^4$ Resulta que la prueba t funciona incluso si ese supuesto no se cumple, pero eso es una digresión

Afín
fuente