Si sé que la población está normalmente distribuida, y luego tomo pequeñas muestras de esta población, ¿es más correcto afirmar que la distribución de muestreo es normal o en su lugar sigue la distribución t ?
Entiendo que las muestras pequeñas tienden a estar distribuidas, pero ¿esto solo se aplica cuando se desconoce la distribución de la población subyacente?
¡Gracias!
Respuestas:
1) un conjunto de observaciones aleatorias de una población con distribución son muestras de esa distribución. Entonces, incluso los valores individuales muestreados de una población normal se distribuyen normalmente. (Bueno, hablando un poco más estrictamente, la variable aleatoria que representa el sorteo único es lo que normalmente se distribuye).F
2) Si las observaciones son dibujos independientes de una distribución normal, las medias muestrales son normales. (Si son dependientes, importa cuál sea la estructura de dependencia).
3) Aquí hay algo que se distribuirá en t, si los datos se obtienen de una población normal: estadísticas t. (Obtenemos algo diferente a lo normal porque hay un numerador y un denominador)
Este es un entendimiento equivocado. ¿En qué se basa esta comprensión?
[Esto parece ser un malentendido tan común que solo puedo suponer que está en algún libro popular o alguna vez popular en alguna parte. Si encuentra un libro así, publique los detalles en su pregunta o en un comentario, porque me encantaría saber de dónde proviene.]
fuente
Si tiene la intención de tomar un valor de una población distribuida normalmente, ese valor tiene la misma función de densidad de probabilidad que la de la población. Entonces cualquier empateXyo de una población X∼ N( μ ,σ2) se extraerá de la misma distribución de la población norte( μ ,σ2)
Eso significa que las muestras pequeñas todavía se distribuyen Normal, ¿verdad? Bueno, claro, si cada sorteo es de una distribución Normal, tendrá una distribución Normal (antes de que tomemos el sorteo, al menos).
Parece que estás preguntando sobreX¯ , ya que estamos hablando de muestras, distribuciones t y similares. X¯ Xyo Tiene una distribución normal. ¿Por qué? ¡Porque es solo una suma de otras variables aleatorias normales!
no essigue siendo normal para muestras pequeñas,aunqueporque cada observaciónGlen_b hizo una buena captura donde combinéX¯ y el t -estadística. Es importante tener en cuenta que mientrasX¯ sigue siendo Normal para cualquier tamaño de muestra (si la población de la que se toma la muestra es Normal), t Las estadísticas construidas a partir de una muestra Normal no son normales para tamaños de muestra pequeños. ¿Por qué?
Bueno, tenemos dos casos distintos aquí. Es posible que la distribución ya sea conocida, en cuyo caso sabemos el verdadero valor deσ2 . También es posible queσ2 no se conoce, en cuyo caso tendremos que estimarlo.
1: sabemosσ2 . Esto significa que podemos usar unz estadística calculada directamente del parámetro de población σ2 .
Si estamos seguros del verdadero valor deσ2 , entonces podemos realizar, por ejemplo, pruebas de hipótesis en X¯ usando una distribución norte( μ ,σ2norte√) . En particular, podemos estandarizarlo, transformándolo en un valorZ , para lo cual la distribución es norte( 0 , 1 ) Y si conocemos el valor de σ2 , entonces podemos usar la distribución Normal estándar para nuestros cálculos. ¡Es normal, no importa cuán grande o pequeña sea nuestra muestra!
2: no sabemosσ2 , y así lo estimamos por s2 .
Si no sabemosσ2 , entonces debemos sustituir el valor calculado de un estimador por el valor real de la población. Por lo general, eso serás2 , la varianza muestral. ¡Pero la varianza muestral también tiene su propia distribución! Por lo tanto, no estamos seguros de su valor. Y si nuestro tamaño de muestra es pequeño, entonces la 'varianza de la varianza de la muestra' es lo suficientemente significativa como para afectar la formaX¯ esta distribuido. Entonces cuando estandarizamosX¯ , ya no se distribuye normalmente, aunque todos los Xyo que entró en el cálculo se distribuyen Normal.
Para obtener más información, lea acerca de la definición de la distribución t y la distribución de la varianza muestral .
fuente