¿Por qué funciona la corrección de continuidad (por ejemplo, la aproximación normal a la distribución binomial)?

24

Deseo comprender mejor cómo se obtuvo la corrección de continuidad de la distribución binomial para la aproximación normal.

¿Qué método se utilizó para decidir que debemos agregar 1/2 (¿por qué no otro número?). Cualquier explicación (o un enlace a la lectura sugerida, aparte de esto , sería apreciada).

Tal Galili
fuente

Respuestas:

29
  1. De hecho, no siempre "funciona" (en el sentido de mejorar siempre la aproximación del cdf binomial por lo normal en cualquier x ). Si el binomio p es 0.5, creo que siempre ayuda, excepto quizás por la cola más extrema. Si p no está demasiado lejos de 0.5, para razonablemente grande n, generalmente funciona muy bien, excepto en la cola lejana, pero si p está cerca de 0 o 1, podría no ayudar en absoluto (ver punto 6. a continuación)

  2. Una cosa a tener en cuenta (a pesar de las ilustraciones que casi siempre involucran pmfs y pdfs) es que lo que estamos tratando de aproximar es el cdf. Puede ser útil reflexionar sobre lo que está sucediendo con el cdf del binomio y la normalización aproximada (por ejemplo, aquí hay ):n=20,p=0.5

    ingrese la descripción de la imagen aquí

    En el límite, el cdf de un binomio estandarizado irá a un estándar normal (tenga en cuenta que la estandarización afecta la escala en el eje x pero no en el eje y); en el camino cada vez más grande a saltos de la FCD binomio tienden a horcajadas de manera más uniforme la función de distribución normal.n

    Acerquémonos y veamos esto en el ejemplo simple anterior:

    ingrese la descripción de la imagen aquí

    Tenga en cuenta que dado que la aproximación normal pasa cerca de la mitad de los saltos verticales *, mientras que en el límite, el cdf normal es localmente aproximadamente lineal y (como lo es la progresión del cdf binomial en la parte superior de cada salto); como resultado, el cdf tiende a cruzar los pasos horizontales cerca de . Si desea aproximar el valor del cdf binomial,F(x)en el enterox, el cdf normal alcanza esa altura cercana ax+1x+12F(x)x .x+12

    * Si aplicamos Berry-Esseen a las variables de Bernoulli con corrección de la media, los límites de Berry-Esseen permiten muy poco margen de maniobra cuando está cerca de 1p yxes alrededor deμ- la cdf normal debe pasar razonablemente cerca de la mitad de los saltos allí porque de lo contrario la diferencia absoluta en cdfs excederá la mejor Berry-Essen unido en un lado o el otro. Esto a su vez se refiere a qué tan lejos dex+112xμ el cdf normal puede cruzar la parte horizontal de la función de paso del cdf binomial.x+12

  3. P(X=k)n=20,p=0.5,k=9N(10,(5)2)

ingrese la descripción de la imagen aquí

  1. p(x)xp(x)

    ! [ingrese la descripción de la imagen aquí

    x12x+1212

    Uno puede motivar este enfoque algebraicamente usando una derivación [a lo largo de las líneas de De Moivre - vea aquí o aquí, por ejemplo] para derivar la aproximación normal (aunque se puede realizar algo más directamente que el enfoque de De Moivre).

    (nx)log(1+x)xx2/2

    P(X=x)12πnp(1p)exp((xnp)22np(1p))

    μ=npσ2=np(1p)xx

    YN(np,np(1p))F(y+12)F(y12)=y12y+12fY(u)dufY(y)fY(x)P(X=x)P(X=x)F(x+12)F(x12)

    [Se puede usar una aproximación de tipo de "regla de punto medio" similar para motivar otras aproximaciones similares de pmfs continuas mediante densidades utilizando una corrección de continuidad, pero siempre se debe tener cuidado de prestar atención a dónde tiene sentido invocar esa aproximación]

  2. Nota histórica: la corrección de continuidad parece haberse originado con Augustus de Morgan en 1838 como una mejora de la aproximación de De Moivre. Ver, por ejemplo, Hald (2007) [1]. A partir de la descripción de Hald, su razonamiento estaba en la línea del ítem 4 anterior (es decir, esencialmente en términos de tratar de aproximar el pmf reemplazando el pico de probabilidad con un "bloque" de ancho 1 centrado en el valor x).

  3. Una ilustración de una situación en la que la corrección de continuidad no ayuda:

    ingrese la descripción de la imagen aquí

    XYFX(x)FY(x+12)p(x)FY(x+12)FY(x12)FX(x)FY(x)p(x)FY(x)FY(x1)

    [1]: Hald, Anders (2007),
    "Una historia de inferencia estadística paramétrica de Bernoulli a Fisher, 1713-1935",
    Fuentes y estudios en la historia de las matemáticas y las ciencias físicas,
    Springer-Verlag Nueva York

Glen_b -Reinstate a Monica
fuente
1

Creo que el factor surge del hecho de que estamos comparando una distribución continua con una discreta. Por lo tanto, necesitamos traducir lo que significa cada valor discreto en la distribución continua. Podríamos elegir otro valor, sin embargo, esto estaría desequilibrado con respecto a un número entero dado. (es decir, pesaría la probabilidad de estar en 6 más hacia 7 que 5.)

Encontré un enlace útil aquí: enlace

Kitter Catter
fuente