Error estándar de muestra desviación estándar de proporciones

8

Recientemente comencé a leer Gelman y Hill, "Análisis de datos usando regresión y modelos jerárquicos y multinivel" y la pregunta se basa en eso:

La muestra contiene 6 observaciones sobre proporciones: p1,p2,,p6

Cada pi tiene significado πi y varianza πi(1πi)ni, dónde ni es el número de observaciones utilizadas para calcular la proporción pi.

La estadística de prueba es Ti= Desviación estándar de muestra de estas proporciones.

El libro dice que el valor esperado de la varianza muestral de las seis proporciones, p1,p2,,p6, es (1/6)i=16πi(1πi)/ni. Entiendo todo esto.

Lo que quiero saber es la distribución de Tiy su varianza? Agradecería que alguien me hiciera saber de qué se trata o me guíe a un libro o artículo que contenga esta información.

Gracias una tonelada.

Curious2learn
fuente
No tengo el libro para verificar, pero la declaración sobre el valor esperado de la varianza de la muestra me parece extraña. Seguramente debería depender de la variabilidad deπitambién.
Aniko
Una estadística de prueba es un valor de búsqueda para una distribución como t de Student, distribución normal, distribución F, etc. Busque en el libro y encuentre el nombre de la distribución para esa estadística. La varianza debería estar relacionada de manera similar con eso.
Carl
Nadie querría saber la distribución de Tiprecisamente porque es muy desagradable. Eso es porque las proporciones en sí mismas son discretas.pi solo puede tomar los valores 0/ni,1/ni,,ni/ni--y por lo tanto T(no debe haber ningún subíndice) también es discreto: pero sus posibles valores, que son numerosos, no se encuentran dentro de una serie de intervalos uniformemente espaciados. Su variación no es demasiado difícil de resolver porque es una función de los primeros cuatro momentos de cada uno de lospiy esos son relativamente simples de escribir.
whuber
@Carl es cierto, y aunque no es una respuesta directa a la pregunta de OP, vale la pena considerarla. Sin embargo, a veces se pueden derivar distribuciones exactas para las estadísticas de prueba, y estas pueden proporcionar mejores propiedades de muestra pequeña de las pruebas correspondientes. No espero que sea así.
AdamO

Respuestas:

1

Las distribuciones exactas para las proporciones son pi ~ Bin(ni,πi)/ni, y las proporciones pueden tomar valores pi=0,1ni,2ni,...,ni1ni,1. La distribución resultante de la desviación estándar de la muestra.TEs una distribución discreta complicada. Dejandop(p1,p2,...,p6), se puede escribir en su forma más trivial como:

FT(t)P(Tt)=pP(t)i=16Bin(nipi|ni,πi),

donde es el conjunto de todos los vectores de proporción que conducen a una varianza muestral no mayor que . Realmente no hay forma de simplificar esto en el caso general. Obtener una probabilidad exacta de esta distribución requeriría enumerar los vectores de proporción que producen una varianza muestral en el rango de interés, y luego sumar los productos binomiales sobre ese rango enumerado. Sería un ejercicio de cálculo oneroso incluso para valores moderadamente grandes de .P(t){p|Tt}tn1,...,n6

Ahora, obviamente, la distribución anterior no es una forma muy útil. Todo lo que realmente le dice es que necesita enumerar los resultados de interés y luego sumar sus probabilidades. Es por eso que sería inusual calcular probabilidades exactas en este caso, y es mucho más fácil recurrir a una forma asintótica para la distribución de la varianza de la muestra.

Ben - Restablece a Monica
fuente