Para las pruebas t, según la mayoría de los textos, se supone que los datos de la población se distribuyen normalmente. No veo por qué es eso. ¿Una prueba t solo requiere que la distribución muestral de las medias muestrales se distribuya normalmente y no la población?
Si es el caso de que la prueba t solo requiere finalmente normalidad en la distribución de muestreo, la población puede verse como cualquier distribución, ¿verdad? Siempre que haya un tamaño de muestra razonable. ¿No es eso lo que dice el teorema del límite central?
(Me refiero aquí a pruebas t de una muestra o muestras independientes)
Respuestas:
El estadístico t consiste en una relación de dos cantidades, ambas variables aleatorias. No solo consiste en un numerador.
Para que la estadística t tenga la distribución t, no solo necesita que la media muestral tenga una distribución normal. También necesitas:
que la en el denominador sea tal que *s s2/σ2∼χ2d
que el numerador y el denominador sean independientes.
* (el valor de depende de qué prueba, en la muestra tenemos )d t d=n−1
Para que esas tres cosas sean realmente ciertas, necesita que los datos originales se distribuyan normalmente.
Tomemos iid como se da por un momento. Para que el CLT mantenga la población tiene que ajustarse a las condiciones ... - la población debe tener una distribución a la que se aplica el CLT. Entonces no, ya que hay distribuciones de población para las cuales el CLT no se aplica.
No, el CLT en realidad no dice una palabra sobre "tamaño de muestra razonable".
En realidad, no dice nada sobre lo que sucede en cualquier tamaño de muestra finito.
Estoy pensando en una distribución específica en este momento. Es uno al que ciertamente se aplica el CLT . Pero en , la distribución de la media muestral es claramente no normal. Sin embargo, dudo que alguna muestra en la historia de la humanidad haya tenido tantos valores en ella. Entonces, fuera de la tautología, ¿qué significa ' razonable '?n=1015 n
Entonces tienes problemas gemelos:
R. El efecto que las personas suelen atribuir a la CLT (el enfoque cada vez más cercano a la normalidad de las distribuciones de las medias de muestra a tamaños de muestra pequeños / moderados) no se menciona realmente en la CLT **.
B. "Algo no muy lejos de lo normal en el numerador" no es suficiente para que la estadística tenga una distribución t
** (Algo así como el teorema de Berry-Esseen te hace ver más como lo que la gente está viendo cuando observan el efecto de aumentar el tamaño de la muestra en la distribución de las medias muestrales).
El CLT y el teorema de Slutsky juntos le dan (siempre y cuando se cumplan todos sus supuestos) que, como , la distribución del estadístico t se aproxima a la normal estándar. No dice si un determinado finito podría ser suficiente para algún propósito.n→∞ n
fuente