¿Qué hace que la media de algunas distribuciones sea indefinida?

21

Muchos archivos PDF varían de menos a infinito positivo, sin embargo, algunos medios están definidos y otros no. ¿Qué rasgo común hace que algunos sean computables?

Kevin Nowaczyk
fuente
14
Integrales convergentes.
Sycorax dice Reinstate Monica
1
Estas distribuciones son abstracciones matemáticas. Si la integral no converge, entonces la media no está definida. Sin embargo, lo que no se menciona en las respuestas a continuación es que los archivos PDF con menos infinito a más infinito no pueden modelar fuentes de datos reales. No existe tal proceso físico para generar tales datos en la vida real. En mi opinión, todas las fuentes de datos reales estarán limitadas y podrá aproximar la media.
Cagdas Ozgenc
3
@Cagdas Ese comentario no parece ser correcto. Hay muchos procesos de cola pesada. Sus expectativas divergentes se manifiestan como una variabilidad extrema en los promedios a largo plazo. Para una aplicación convincente de un modelo Cauchy, por ejemplo, vea la publicación de Douglas Zare en stats.stackexchange.com/a/36037/919 .
whuber
2
@CagdasOzgenc: Deberías leer Black Swan de Taleb para ver cuán equivocado es ese razonamiento. Si bien heurísticamente puede no haber un proceso que genere perfectamente una distribución con una media indefinida o media infinita, hay muchos ejemplos en los que las personas subestiman cuán gruesas son las colas de su distribución y proceden a calcular las medias, mientras que la distribución verdadera tiene un significa que es completamente diferente y generalmente sesgado a la derecha. Este tipo de razonamiento incorrecto condujo a muchos gafs de evaluación de riesgos en finanzas donde el riesgo se subestima en muchos órdenes de magnitud.
Alex R.
1
@Cagdas Ozgenc: Para una discusión sobre por qué su argumento es incorrecto, consulte stats.stackexchange.com/questions/94402/…
kjetil b halvorsen el

Respuestas:

23

La media de una distribución se define en términos de una integral (la escribiré como si fuera una distribución continua, como una integral de Riemann, por ejemplo), pero el problema se aplica de manera más general; podemos proceder a la integración de Stieltjes o Lebesgue para tratar estos correctamente y todo a la vez):

E(X)=xf(x)dx

Pero ¿qué significa eso? Efectivamente es una abreviatura para

a,blimabxf(x)dx

o

alima0xf(x)dx+blim0bxf(x)dx

(aunque podría romperlo en cualquier lugar, no solo en 0)

El problema surge cuando los límites de esas integrales no son finitos.

Entonces, por ejemplo, considere la densidad estándar de Cauchy, que es proporcional a ... tenga en cuenta que11+x2

blim0bx1+x2dx

sea , entonces d u = 2 xu=1+x2du=2xdx

=blim1211+b21udu

=blim12ln(u)|11+b2

=blim12ln(1+b2)

que no es finito El límite en la mitad inferior tampoco es finito; la expectativa es por lo tanto indefinida.

O si tuviéramos como nuestra variable aleatoria el valor absoluto de un Cauchy estándar, toda su expectativa sería proporcional al límite que acabamos de observar (es decir, ).blim12ln(1+b2)

Por otro lado, algunas otras densidades continúan "hasta el infinito" pero su integral tiene un límite.

Glen_b -Reinstate a Monica
fuente
1
También puede (por supuesto) ver lo mismo en distribuciones de probabilidad discretas similares. Tome una distribución donde la probabilidad de que ocurra , para el entero , es proporcional a . La suma de probabilidades es finita (lo cual es igual ya que necesita tener el límite 1: en realidad nuestra constante debe ser o lo que sea), pero desde la suma de diverge no tiene significado. Mientras que si elegimos una probabilidad proporcional a , la media implica una suma de y estamos bien, eso es "lo suficientemente pequeño" como para que converja. nn>01n26π21n1n31n2
Steve Jessop
1
Sí, es la constante de escala para eso (para que sume 1). 6π2
Glen_b -Reinstale a Monica el
8

Las otras respuestas son buenas, pero podrían no convencer a todos, especialmente a las personas que echan un vistazo a la distribución de Cauchy (con ) y dicen que todavía es intuitivamente obvio que la media debería ser cero.x0=0

La razón por la cual la respuesta intuitiva no es correcta desde la perspectiva matemática se debe al teorema de reordenamiento de Riemann (video) .

Efectivamente, lo que está haciendo cuando mira a un Cauchy y dice que la media "debería ser cero" es que está dividiendo el "centro" en cero, y luego reclama los momentos del equilibrio de dos tamaños. O, en otras palabras, implícitamente estás haciendo una suma infinita con "la mitad" de los términos positivos (los momentos en cada punto a la derecha) y "la mitad" de los términos negativos (los momentos en cada punto a la izquierda) y reclamarlo sumas a cero. (Para personas con mentalidad técnica: )0f(x0+r)rdr0f(x0r)rdr=0

El teorema de reordenamiento de Riemann dice que este tipo de suma infinita (una con términos positivos y negativos) solo es consistente si las dos series (términos positivos solamente y términos negativos solamente) son convergentes cuando se toman independientemente. Si ambos lados (positivo y negativo) son divergentes por sí mismos, entonces puede llegar a un orden de suma de los términos de tal manera que sume cualquier número. (Video de arriba, a partir de las 6:50)

Entonces, sí, si haces la suma de manera equilibrada desde 0 hacia afuera, los primeros momentos de la distribución de Cauchy se cancelan. Sin embargo, la definición (estándar) de media no impone este orden de suma. Debería poder sumar los momentos en cualquier orden y hacer que sea igualmente válido. Por lo tanto, la media de la distribución de Cauchy no está definida: al elegir juiciosamente cómo se suman los momentos, puede hacer que se "equilibren" (o no) prácticamente en cualquier momento.

Entonces, para definir la media de una distribución, las integrales de dos momentos deben ser cada una independientemente convergentes (finitas) alrededor de la media propuesta (que, cuando haces las matemáticas, es realmente solo otra forma de decir que la integral completa ( ) necesita ser convergente). Si las colas son lo suficientemente "gordas" como para que el momento de un lado sea infinito, ya está. No puedes equilibrarlo con un momento infinito en el otro lado.f(x)xdx


Debo mencionar que el comportamiento "contra intuitivo" de cosas como la distribución de Cauchy se debe completamente a problemas al pensar en el infinito. Tome la distribución de Cauchy y corte las colas, incluso arbitrariamente lejos, como más / menos el número xkcd , y (una vez normalizado) de repente obtiene algo que se comporta bien y tiene una media definida. No son las colas gruesas en sí mismas las que son un problema, es cómo se comportan esas colas cuando te acercas al infinito.

RM
fuente
Agradable. Me pregunto si es posible dar un "orden de suma" explícito que conduzca a, digamos, dos.
Matthew Drury
@MatthewDrury: p_i y n_i denotan números positivos y negativos. Encuentre sucesivamente p_i y n_i para que la integral sobre [n_i, p_i] sea 2+ (1 / i) y la integral sobre [n_ {i + 1}, p_i] sea 2- (1 / i). Uno podría hacer esto explícitamente usando R, matlab o Mathica, pero solo para un número finito de términos.
David Epstein
7

El general Abrial y Glen_b tuvieron respuestas perfectas. Solo quiero agregar una pequeña demostración para mostrarle que la media de la distribución de Cauchy no existe / no converge.

En el siguiente experimento, verá, incluso si obtiene una muestra grande y calcula la media empírica de la muestra, los números son bastante diferentes de un experimento a otro.

set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))

ingrese la descripción de la imagen aquí

Puede observar que tenemos experimentos, y en cada experimento, tomamos muestras de 1 × 10 5 puntos de dos distribuciones, con un tamaño de muestra tan grande, la media empírica en diferentes experimentos debería estar bastante cerca de la media real. Los resultados muestran que la distribución de Cauchy no tiene una media convergente, pero la distribución normal sí.1001×105

EDITAR:

Como @ mark999 mencionó en el chat, deberíamos argumentar que las dos distribuciones utilizadas en el experimento tienen una "varianza" similar (la razón por la que uso la cita es porque la varianza de distribución de Cauchy también está indefinida). Aquí está la justificación: sus PDF son similares.

0

curve(dnorm, -8,8)
curve(dcauchy, -8,8)

ingrese la descripción de la imagen aquí

Haitao Du
fuente
44
No creo que esto muestre que la distribución de Cauchy no tiene significado. Podría obtener resultados similares si reemplazara la distribución de Cauchy por una distribución normal con una varianza adecuadamente grande.
mark999
buen punto @ mark999, editaré mi respuesta para abordar este problema.
Haitao Du
¿Es posible deducir del PDF de la distribución de Cauchy que no tiene ningún medio, probablemente mirando sus colas gruesas?
ks1322
¿Quizás tenías algo como esto en mente? stats.stackexchange.com/questions/90531/…
Sycorax dice Reinstate Monica el
2

dθ/2πθAS1length(A)/2πU(π,π)ππεπ+ε (=π+εmod2π)πU(π,π)ε/2π

Como la distribución en el círculo es rotacionalmente simétrica, no puede haber una media, mediana o moda en el círculo. Del mismo modo, los momentos superiores, como la varianza, no pueden tener sentido. Esta distribución surge naturalmente en muchos contextos. Por ejemplo, mi proyecto actual involucra imágenes de microscopio de tejido canceroso. Los numerosos objetos en la imagen no son simétricos y se puede asignar una "dirección" a cada uno. La hipótesis nula obvia es que estas direcciones están distribuidas uniformemente.

S1p=(0,1)S1xθpxx=tan(θ/2)dθ/2=dx/(1+x2)dθπ(1+x2)

S1{p}ppS1pp=(0,1)0R

David Epstein
fuente
2
La distribución de Cauchy tiene una mediana y una moda.
jkabrg
Muy bien. Me dejé llevar un poco. Pero el argumento de la inexistencia de la media es correcto. Editaré mi respuesta.
David Epstein
θU(π,π)X=tan(θ/2)E[θ]=0
@jkabrg: Espero que las nuevas ediciones hagan esto más comprensible
David Epstein