Independencia de la media muestral y la varianza muestral en la distribución binomial

9

Deje . Sabemos que y . ¿Esto implica que la media de la muestra y la varianza de la muestra son dependientes entre sí? ¿O simplemente significa que la varianza de la población se puede escribir en función de la media de la población ?Xsiyonorteometroyounal(norte,pags)mi[X]=nortepagsVunar[X]=nortepags(1-pags)X¯s2

usuario6874652
fuente

Respuestas:

14

X¯ y son variables aleatorias. Podemos resolver su distribución conjunta. Probemos el caso no trivial más simple posible, el de una muestra de tamaño de una distribución Binomial . Solo hay cuatro posibilidades para esa muestra, que se tabulan junto con sus probabilidades (calculadas a partir de la independencia de los dos elementos de la muestra):s22(1,pags)

First value | Second value | Mean | Variance | Probability
          0 |            0 |    0 |        0 | (1-p)^2
          0 |            1 |  1/2 |      1/2 | (1-p)p
          1 |            0 |  1/2 |      1/2 | p(1-p)
          1 |            1 |    1 |        0 | p^2

La media predice perfectamente la varianza en este ejemplo. Por lo tanto, siempre que todas las probabilidades sean distintas de cero (es decir, no es ni ni ), la media muestral y la varianza muestral no son independientes.pags0 01

Una pregunta interesante es si, en una familia de distribuciones, la media determina la varianza, la media muestral y la varianza muestral pueden ser independientes. La respuesta es sí: tome cualquier familia de distribuciones normales en la que la varianza depende de la media, como el conjunto de todas las distribuciones normales . No importa cuál de estas distribuciones rija la muestra, la media muestral y la varianza muestral serán independientes, porque ese es el caso de cualquier distribución Normal.(μ,μ2)

Este análisis sugiere que las preguntas sobre la estructura de una familia de distribuciones (que conciernen a , , , etc.) no tienen relación con las cuestiones de independencia de las estadísticas de las muestras de cualquier elemento de la familia.npμ

whuber
fuente
Pero tal vez sea porque la distribución normal es un caso "especial". Quiero decir, se sabe que, para cualquier distribución normal, es cierto que la media muestral es independiente de la varianza muestral. Pero, ¿qué sucede si estamos tratando con una distribución que no es una distribución normal?
user6874652
1
Típicamente, la media muestral y la varianza muestral no son independientes. No importa de qué familia de distribuciones pueda formar parte la distribución.
whuber
@whuber: Excepto que con norte(μ,σ2)la media muestral y la varianza muestral son independientes.
Michael Hardy
@Michael Gracias. Ya lo noté en el cuerpo de la respuesta.
whuber
@whuber: gracias por el análisis. ¿Podría también revelar el Rcódigo? Muchas gracias.
Maximiliano
8

La propiedad de que, para una muestra iid, la media muestral y la varianza muestral son independientes, es una caracterización de la distribución normal: para ninguna otra distribución, dicha propiedad es válida.

Ver Patel, JK, & Read, CB (1982). Manual de la distribución normal , p. 81 en la primera edición de 1982, en el capítulo "Caracterizaciones" (puede haber cambiado de página en la segunda edición de 1996).

Entonces, para cualquier otra distribución, la media muestral y la varianza muestral son estadísticamente dependientes.

El resultado general con respecto a la media muestral y la varianza muestral de una muestra iid de cualquier distribución que tenga momentos hasta el 3d, es el siguiente (usando el estimador imparcial para la varianza):

Cov(X¯,s2)=mi(X¯s2)-mi(X)Var(X)=1nortemi[X-mi(X)]3

En palabras, la covarianza entre la media muestral y la varianza muestral es igual al tercer momento central, dividido por norte. Consecuencias:

1) A medida que aumenta el tamaño de la muestra, los dos tienden a no estar correlacionados.

2) Para cualquier distribución que tenga el tercer momento central igual a cero, no están correlacionadas (aunque siguen siendo dependientes, para todas las distribuciones excepto la normal). Por supuesto, esto incluye todas las distribuciones simétricas sobre su media, pero también otras distribuciones que no son simétricas sobre su media, pero aún así, tienen el tercer momento central igual a cero , vea este hilo .

Alecos Papadopoulos
fuente
(+1) El hipervínculo está muerto para mí.
COOLSerdash
@COOLSerdash Funciona para mí. Se vincula a una página de Amazon, ¿tal vez eso está bloqueado para usted?
Graipher
@COOLSerdash Gracias. Como se mencionó, el hipervínculo parece válido. Simplemente busque "Manual de distribución normal Patel Read".
Alecos Papadopoulos
(+1) Sospeché que este podría ser el caso, pero nunca he visto una declaración formal de este hecho. ¿Existen distribuciones no normales para las cuales la media muestral y la varianza muestral no están correlacionadas?
John Coleman
1
@AlecosPapadopoulos Sí, por supuesto. Si es así, sería un ejemplo interesante de cuando no correlacionado no implica independiente. No he resuelto todos los detalles, pero U(0,1)parece funcionar.
John Coleman
3

Un caso extremo es Bernoulli(pags)=Binomio(1,pags). Considere una muestra de tamaño (capital) norte:

nortes2=k=1norte(Xk-X¯)2=(kXk2)-(2X¯yoXk)+(norteX¯2)=(kXk)-2X¯kXk+(norteX¯2)ya que Xk=0 0 o 1, entonces Xk2=Xk=norteX¯-2norteX¯2+norteX¯2=norteX¯(1-X¯),entonces s2=X¯(1-X¯).
Así cuando (minúscula) norte es 1,entonces la media muestral determina la varianza muestral, por lo que están lejos de ser independientes. Pero la varianza muestral no determina completamente la media muestral, ya que hay dos valores deX¯ que producen el mismo valor de X¯(1-X¯).

Cuando ambos nortepags y norte(1-pags) son grandes, entonces espero que la media de la muestra y la varianza de la muestra sean casi independientes ya que la distribución es casi normal.

Michael Hardy
fuente