¿La distribución de muestreo para muestras pequeñas de una población normal es normal o está distribuida? [cerrado]

8

Si sé que la población está normalmente distribuida, y luego tomo pequeñas muestras de esta población, ¿es más correcto afirmar que la distribución de muestreo es normal o en su lugar sigue la distribución t ?

Entiendo que las muestras pequeñas tienden a estar distribuidas, pero ¿esto solo se aplica cuando se desconoce la distribución de la población subyacente?

¡Gracias!

stattheory
fuente
Creo (pero no estoy seguro de que) el wiki de etiqueta de distribución t podría responder esto ya ...
Nick Stauner
77
La distribución muestral de qué estadística?
Glen_b -Reinstate Monica
stattheory: si desea que su pregunta se vuelva a abrir (lo que permitirá respuestas adicionales), debe editar su pregunta para tratar de aclararla, por ejemplo, abordando cualquier problema que surja en los comentarios.
Glen_b -Reinstalar Monica

Respuestas:

9

1) un conjunto de observaciones aleatorias de una población con distribución son muestras de esa distribución. Entonces, incluso los valores individuales muestreados de una población normal se distribuyen normalmente. (Bueno, hablando un poco más estrictamente, la variable aleatoria que representa el sorteo único es lo que normalmente se distribuye).F

2) Si las observaciones son dibujos independientes de una distribución normal, las medias muestrales son normales. (Si son dependientes, importa cuál sea la estructura de dependencia).

3) Aquí hay algo que se distribuirá en t, si los datos se obtienen de una población normal: estadísticas t. (Obtenemos algo diferente a lo normal porque hay un numerador y un denominador)

Entiendo que las muestras pequeñas tienden a distribuirse

Este es un entendimiento equivocado. ¿En qué se basa esta comprensión?

[Esto parece ser un malentendido tan común que solo puedo suponer que está en algún libro popular o alguna vez popular en alguna parte. Si encuentra un libro así, publique los detalles en su pregunta o en un comentario, porque me encantaría saber de dónde proviene.]

Glen_b -Reinstate a Monica
fuente
Es común, por ejemplo: statisticshowto.com/when-to-use-at-score-vs-z-score
petrelharp
@petrelharp, ¿puede señalar dónde dice eso que las muestras pequeñas están distribuidas en t? Debo haberlo perdido en un escaneo rápido.
Glen_b -Reinstala a Monica el
Quizás no sea común, el diagrama de flujo en esa página, un éxito de Google, tiene un "tamaño de muestra menor a 30" que lleva a "usar el puntaje t", lo que creo que significa "usar la distribución t". Pero, además de estar equivocado, esa página en realidad no dice lo que significa.
petrelharp
Eso implica que una estadística t calculada en una muestra pequeña tendría una distribución t, no que la muestra en sí tendría una distribución t.
Glen_b -Reinstate a Monica el
No es la forma en que imagino que los estudiantes lo interpretan ... pero ya está mal de otras maneras.
petrelharp
6

Si tiene la intención de tomar un valor de una población distribuida normalmente, ese valor tiene la misma función de densidad de probabilidad que la de la población. Entonces cualquier empateXyo de una población Xnorte(μ,σ2) se extraerá de la misma distribución de la población norte(μ,σ2)

Eso significa que las muestras pequeñas todavía se distribuyen Normal, ¿verdad? Bueno, claro, si cada sorteo es de una distribución Normal, tendrá una distribución Normal (antes de que tomemos el sorteo, al menos).

Parece que estás preguntando sobre X¯, ya que estamos hablando de muestras, distribuciones t y similares. X¯ no es sigue siendo normal para muestras pequeñas, aunque porque cada observación XyoTiene una distribución normal. ¿Por qué? ¡Porque es solo una suma de otras variables aleatorias normales!

Glen_b hizo una buena captura donde combiné X¯ y el t-estadística. Es importante tener en cuenta que mientrasX¯ sigue siendo Normal para cualquier tamaño de muestra (si la población de la que se toma la muestra es Normal), tLas estadísticas construidas a partir de una muestra Normal no son normales para tamaños de muestra pequeños. ¿Por qué?

Bueno, tenemos dos casos distintos aquí. Es posible que la distribución ya sea conocida, en cuyo caso sabemos el verdadero valor deσ2. También es posible queσ2 no se conoce, en cuyo caso tendremos que estimarlo.

1: sabemos σ2. Esto significa que podemos usar unz estadística calculada directamente del parámetro de población σ2.

Si estamos seguros del verdadero valor de σ2, entonces podemos realizar, por ejemplo, pruebas de hipótesis en X¯ usando una distribución norte(μ,σ2norte). En particular, podemos estandarizarlo, transformándolo en un valorZ, para lo cual la distribución es norte(0 0,1) Y si conocemos el valor de σ2, entonces podemos usar la distribución Normal estándar para nuestros cálculos. ¡Es normal, no importa cuán grande o pequeña sea nuestra muestra!

2: no sabemos σ2, y así lo estimamos por s2.

Si no sabemos σ2, entonces debemos sustituir el valor calculado de un estimador por el valor real de la población. Por lo general, eso serás2, la varianza muestral. ¡Pero la varianza muestral también tiene su propia distribución! Por lo tanto, no estamos seguros de su valor. Y si nuestro tamaño de muestra es pequeño, entonces la 'varianza de la varianza de la muestra' es lo suficientemente significativa como para afectar la formaX¯esta distribuido. Entonces cuando estandarizamosX¯, ya no se distribuye normalmente, aunque todos los Xyo que entró en el cálculo se distribuyen Normal.

Para obtener más información, lea acerca de la definición de la distribución t y la distribución de la varianza muestral .

Mate
fuente
Es una respuesta realmente buena que explica muchas más cosas sobre las muestras pequeñas versus las grandes.
Subhash C. Davar
Matt, si los datos son independientes de la normalidad, X¯ es (demostrablemente) normal, hastanorte=1 y norte=2, si conocemos o no la varianza. ¿Hay alguna base para su afirmación de lo contrario?
Glen_b -Reinstate Monica
De hecho, hay varias pruebas de que la distribución de la suma de dos rvs normales independientes es normal aquí ; que el promedio también debe ser normal es sencillo.
Glen_b -Reinstate Monica
¡Uy! Cometí un error al combinarX¯y la estadística t. Buena captura, tienes mucha razón.
Matt
Creo que lo he arreglado. tX¯¿hm?
Matt