Supongamos que yo estoy corriendo un experimento que puede tener 2 resultados, y estoy suponiendo que el subyacente "verdadera" distribución de los resultados 2 es una distribución binomial con parámetros y : .
Puedo calcular el error estándar, , a partir de la forma de la varianza de : donde . Entonces, . Para el error estándar obtengo: , pero he visto en algún lugar que . ¿Qué hice mal?
binomial
standard-error
Franco
fuente
fuente
Respuestas:
Parece que está usando dos veces de dos maneras diferentes, tanto como el tamaño de la muestra como el número de ensayos de Bernoulli que comprenden la variable aleatoria Binomial; Para eliminar cualquier ambigüedad, voy a usar para referirme a este último.knorte k
Si tiene muestras independientes de una distribución , la varianza de su media muestral esB i n o m i a l ( k , p )norte B i n o m i a l (k,p)
donde y es la misma media. Esto sigue desde¯ Xq= 1 - p X¯¯¯¯
(1) , para cualquier variable aleatoria, y cualquier constante .v a r (cX) = c2v a r (X) cX do
(2) la varianza de una suma de variables aleatorias independientes es igual a la suma de las varianzas .
El error estándar de es la raíz cuadrada de la varianza: . Por lo tanto, √X¯¯¯¯ k p qnorte---√
Cuando , obtiene la fórmula que señaló:√k = n p q--√
Cuando , y las variables binomiales son solo ensayos de Bernoulli , obtienes la fórmula que has visto en otra parte:√k = 1 p qnorte--√
fuente
Es fácil confundir dos distribuciones binomiales:
npq es el número de éxitos, mientras que npq / n = pq es la proporción de éxitos. Esto da como resultado diferentes fórmulas de error estándar.
fuente
Podemos ver esto de la siguiente manera:
Supongamos que estamos haciendo un experimento donde necesitamos lanzar una moneda imparcial veces. El resultado general del experimento es que es la suma de los lanzamientos individuales (por ejemplo, cabeza como 1 y cola como 0). Entonces, para este experimento, , donde son resultados de lanzamientos individuales.Y Y = ∑ n i = 1 X i X inorte Y Y= ∑nortei = 1Xyo Xyo
Aquí, el resultado de cada lanzamiento, , sigue una distribución de Bernoulli y el resultado general sigue una distribución binomial. YXyo Y
El experimento completo puede pensarse como una sola muestra. Por lo tanto, si repetimos el experimento, podemos obtener otro valor de , que formará otra muestra. Todos los valores posibles de constituirán la población completa.YY Y
Volviendo al lanzamiento de una moneda, que sigue una distribución de Bernoulli, la varianza viene dada por , donde es la probabilidad de cara (éxito) y .pp q pags q= 1 - p
Ahora, si miramos la varianza de , . Pero, para todos los experimentos individuales de Bernoulli, . Como hay lanzamientos o pruebas de Bernoulli en el experimento, . Esto implica que tiene varianza .V ( Y ) = V ( ∑ X iY V ( X i ) = p q n V ( Y ) = ∑ V ( X i ) = n p q Y n p qV( Y) = V( ∑ Xyo) = ∑ V( Xyo) V( Xyo) = p q norte V( Y) = ∑ V( Xyo) = n p q Y n p q
Ahora, la proporción de la muestra viene dada por , que da la 'proporción de éxito o cabezas'. Aquí, es una constante ya que planeamos tomar el mismo número de monedas para todos los experimentos en la población. npags^= Ynorte norte
Entonces, .V( Ynorte) = ( 1norte2) V( Y) = ( 1norte2) ( n p q) = p q/ n
Entonces, el error estándar para (una estadística de muestra) es √pags^ p q/ n----√
fuente
$x$
da .Creo que también hay cierta confusión en la publicación inicial entre error estándar y desviación estándar. La desviación estándar es el sqrt de la varianza de una distribución; El error estándar es la desviación estándar de la media estimada de una muestra de esa distribución, es decir, la extensión de las medias que observaría si hiciera esa muestra infinitas veces. El primero es una propiedad intrínseca de la distribución; este último es una medida de la calidad de su estimación de una propiedad (la media) de la distribución. Cuando realiza un experimento de N ensayos de Bernouilli para estimar la probabilidad desconocida de éxito, la incertidumbre de su p = k / N estimado después de ver k éxitos es un error estándar de la proporción estimada, sqrt (pq / N) donde q = 1 -pags. La distribución verdadera se caracteriza por un parámetro P, la verdadera probabilidad de éxito.
fuente