Recientemente comencé a leer Gelman y Hill, "Análisis de datos usando regresión y modelos jerárquicos y multinivel" y la pregunta se basa en eso:
La muestra contiene 6 observaciones sobre proporciones:
Cada tiene significado y varianza , dónde es el número de observaciones utilizadas para calcular la proporción .
La estadística de prueba es Desviación estándar de muestra de estas proporciones.
El libro dice que el valor esperado de la varianza muestral de las seis proporciones, , es . Entiendo todo esto.
Lo que quiero saber es la distribución de y su varianza? Agradecería que alguien me hiciera saber de qué se trata o me guíe a un libro o artículo que contenga esta información.
Gracias una tonelada.
distributions
binomial
standard-deviation
Curious2learn
fuente
fuente
Respuestas:
Las distribuciones exactas para las proporciones sonpi ~ Bin(ni,πi)/ni , y las proporciones pueden tomar valores pi=0,1ni,2ni,...,ni−1ni,1 . La distribución resultante de la desviación estándar de la muestra.T Es una distribución discreta complicada. Dejandop≡(p1,p2,...,p6) , se puede escribir en su forma más trivial como:
donde es el conjunto de todos los vectores de proporción que conducen a una varianza muestral no mayor que . Realmente no hay forma de simplificar esto en el caso general. Obtener una probabilidad exacta de esta distribución requeriría enumerar los vectores de proporción que producen una varianza muestral en el rango de interés, y luego sumar los productos binomiales sobre ese rango enumerado. Sería un ejercicio de cálculo oneroso incluso para valores moderadamente grandes de .P(t)≡{p|T⩽t} t n1,...,n6
Ahora, obviamente, la distribución anterior no es una forma muy útil. Todo lo que realmente le dice es que necesita enumerar los resultados de interés y luego sumar sus probabilidades. Es por eso que sería inusual calcular probabilidades exactas en este caso, y es mucho más fácil recurrir a una forma asintótica para la distribución de la varianza de la muestra.
fuente