¿Hay algo significativo acerca de una media geométrica y una media aritmética que se acerquen mucho, digamos ~ 0.1%? ¿Qué conjeturas se pueden hacer sobre ese conjunto de datos?
He estado trabajando en el análisis de un conjunto de datos, y noto que, irónicamente, los valores están muy, muy cerca. No es exacto, pero cercano. Además, una comprobación rápida de la cordura de la desigualdad media aritmética media-geométrica, así como una revisión de la adquisición de datos, revelan que no hay nada sospechoso sobre la integridad de mi conjunto de datos en términos de cómo se me ocurrieron los valores.
descriptive-statistics
mean
geometric-mean
usuario12289
fuente
fuente
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
[1] 3.383363
Respuestas:
La media aritmética está relacionada con la media geométrica a través de la desigualdad Aritmética-Media-Geométrica-Media (AMGM) que establece que:
donde se logra la igualdad si f . Por lo tanto, probablemente sus puntos de datos estén muy cerca uno del otro.X1= x2= ⋯ = xnorte
fuente
Desarrollando la respuesta de @Alex R, una forma de ver la desigualdad AMGM es como un efecto de desigualdad de Jensen. Por la desigualdad de Jensen : Luego tome la exponencial de ambos lados: 1
El lado derecho es la media geométrica ya que( x1⋅ x2⋅ ... ⋅ xnorte)1 / n= exp( 1norte∑yoIniciar sesiónXyo)
¿Cuándo se mantiene la desigualdad AMGM con casi igualdad? Cuando el efecto de desigualdad de Jensen es pequeño. Lo que impulsa el efecto de desigualdad de Jensen aquí es la concavidad, la curvatura del logaritmo. Si sus datos se extienden por un área donde el logaritmo tiene curvatura, el efecto será grande. Si sus datos se extienden por una región donde el logaritmo es básicamente afín, el efecto será pequeño.
Por ejemplo, si los datos tienen poca variación, se agrupan en un vecindario lo suficientemente pequeño, entonces el logaritmo se verá como una función afín en esa región (un tema de cálculo es que si hace un acercamiento suficiente en una función suave y continua, eso se verá como una línea). Para datos suficientemente cercanos, la media aritmética de los datos estará cerca de la media geométrica.
fuente
Investiguemos el rango de dado que su media aritmética (AM) es un pequeño múltiplo de su media geométrica (GM) (con ). En la pregunta, pero no sabemos . 1 + δ δ ≥ 0 δ ≈ 0.001 nX1≤ x2≤ ⋯ ≤ xnorte 1 + δ δ≥ 0 δ≈ 0.001 norte
Dado que la proporción de estos medios no cambia cuando se cambian las unidades de medida, elija una unidad para la cual el GM sea . Por lo tanto, buscamos maximizar sujeto a la restricción de que y .x n x 1 + x 2 + ⋯ + x n = n ( 1 + δ )1 Xnorte X1+ x2+ ⋯ + xnorte= n ( 1 + δ) X1⋅ x2⋯ xnorte= 1
Esto se hará haciendo , digamos, y . Asíx n = z ≥ xX1= x2= ⋯ = xn - 1= x Xnorte= z≥ x
y
La solución es una raíz entre y deX 0 0 1
Se encuentra fácilmente de forma iterativa. Aquí están las gráficas de la y óptima en función de para , de izquierda a derecha:X z δ n = 6 , 20 , 50 , 150
Tan pronto como alcanza un tamaño apreciable, incluso una pequeña proporción de es consistente con una gran periférica (las curvas rojas superiores) y un grupo de fuertemente agrupadas (las curvas azules inferiores).norte 1.001 Xnorte Xyo
En el otro extremo, supongamos que es par (por simplicidad). El rango mínimo se alcanza cuando la mitad de igual a un valor y la otra mitad es igual a otro valor . Ahora la solución (que se verifica fácilmente) esn = 2 k Xyo x ≤ 1 z≥ 1
Para la pequeña , podemos ignorar la como una aproximación y también aproximar la raíz al primer orden, dandoδ δ2 kth
El rango es aproximadamente .32 δ---√/ n
De esta manera, hemos obtenido límites superior e inferior en el rango posible de los datos. Hemos aprendido que dependen en gran medida de la cantidad de datos . El límite superior muestra que el rango puede ser apreciable incluso para un pequeño , mejorando así nuestra sensación de cuán cerca uno del otro realmente deben estar los puntos de datos, y también colocando un límite inferior en su rango.norte δ
Análisis similares, que se pueden llevar a cabo fácilmente, pueden informarle, cuantitativamente, de cuán estrechamente agrupada puede estar la en términos de cualquier otra medida de propagación, como su varianza o coeficiente de variación.Xyo
fuente