Valor máximo del coeficiente de variación para el conjunto de datos acotado

17

En la discusión que siguió a una pregunta reciente sobre si la desviación estándar puede exceder la media, se planteó una pregunta brevemente pero nunca se respondió por completo. Entonces lo estoy preguntando aquí.

Considere un conjunto de n números no negativos xi donde 0xic para 1in . No es necesario que sea ​​distinto, es decir, el conjunto podría ser un conjunto múltiple. La media y la varianza del conjunto se definen como y la desviación estándar es . Tenga en cuenta que el conjunto de números no esxi

x¯=1ni=1nxi,  σx2=1ni=1n(xix¯)2=(1ni=1nxi2)x¯2
σxuna muestra de una población y no estamos estimando una media poblacional o una varianza poblacional. La pregunta entonces es:

¿Cuál es el valor máximo de , el coeficiente de variación, sobre todas las opciones de las 's en el intervalo ?σxx¯xi[0,c]

El valor máximo que puedo encontrar para σxx¯ es n1 que se logra cuando n1 de xi tiene el valor 0 y el resto (atípico) xi tiene valor c , dando

x¯=cn,  1nxi2=c2nσx=c2nc2n2=cnn1.
Pero esto no depende de c en absoluto, y me pregunto si se pueden lograr valores mayores, posiblemente dependientes de n y c .

¿Algunas ideas? Estoy seguro de que esta pregunta se ha estudiado anteriormente en la literatura estadística, por lo que las referencias, si no los resultados reales, serían muy apreciadas.

Dilip Sarwate
fuente
Creo que tienes razón acerca de que ese es el mayor valor posible, y también me sorprende que no importe. Frio. c
Peter Flom - Restablece a Monica
77
no debería afectar el resultado como σ xc no cambia si todos los valores se multiplican por cualquier constante positivak. σxx¯k
Henry

Respuestas:

15

La geometría proporciona información y las desigualdades clásicas permiten un fácil acceso al rigor.

Solución geométrica

Sabemos, por la geometría de los mínimos cuadrados , que es la proyección ortogonal del vector de datos x = ( x 1 , x 2 , ... , x n ) sobre El subespacio lineal generado por el vector constante ( 1 , 1 , ... , 1 ) y que σ xx¯=(x¯,x¯,,x¯)x=(x1,x2,,xn)(1,1,,1)σxes directamente proporcional a la distancia (euclidiana) entre y ˉ x . Las restricciones de no negatividad son lineales y la distancia es una función convexa, por lo que los extremos de la distancia deben alcanzarse en los bordes del cono determinados por las restricciones. Este cono es el orante positivo en R n y sus bordes son los ejes de coordenadas, de donde se deduce inmediatamente que todos menos uno de los x i deben ser cero en las distancias máximas. Para tal conjunto de datos, un cálculo directo (simple) muestra σ x / ˉ x = xx¯.Rnxiσx/x¯=n.

Solución que explota las desigualdades clásicas

se optimiza simultáneamente con cualquier transformación monotónica de los mismos. A la luz de esto, maximicemosσx/x¯

x12+x22++xn2(x1+x2++xn)2=1n(n1n(σxx¯)2+1)=f(σxx¯).

(La fórmula para puede parecer misteriosa hasta que se dé cuenta de que solo registra los pasos que se tomarían al manipular algebraicamente σ x / ˉ x para obtener una forma de aspecto simple, que es el lado izquierdo).fσx/x¯

Una manera fácil comienza con la desigualdad de Holder ,

x12+x22++xn2(x1+x2++xn)max({xi}).

(Esto no necesita una prueba especial en este contexto simple: simplemente reemplace un factor de cada término por el componente máximo max ( { x i } ) : obviamente la suma de los cuadrados no disminuirá. el término común max ( { x i } ) produce el lado derecho de la desigualdad).xi2=xi×ximax({xi})max({xi})

Debido a que no son todos 0 (eso dejaría σ x / ˉ x indefinido), la división por el cuadrado de su suma es válida y da la desigualdad equivalentexi0σx/x¯

x12+x22++xn2(x1+x2++xn)2max({xi})x1+x2++xn.

Debido a que el denominador no puede ser menor que el numerador (que en sí mismo es solo uno de los términos en el denominador), el lado derecho está dominado por el valor , que se logra solo cuando todos menos uno de x i son iguales a 0 . De dónde1xi0

σxx¯f1(1)=(1×(n1))nn1=n.

Enfoque alternativo

Dado que no es negativo y no puede sumar 0 , los valores p ( i ) = x i / ( x 1 + x 2 + + x n ) determinan una distribución de probabilidad F en { 1 , 2 , , n } . Escribiendo s para la suma de x i , reconocemosxi0p(i)=xi/(x1+x2++xn)F{1,2,,n}sxi

x12+x22++xn2(x1+x2++xn)2=x12+x22++xn2s2=(x1s)(x1s)+(x2s)(x2s)++(xns)(xns)=p1p1+p2p2++pnpn=EF[p].

El hecho axiomático de que ninguna probabilidad puede exceder implica que esta expectativa tampoco puede exceder 1 , pero es fácil hacerlo igual a 1 estableciendo que todos menos uno de los p i sean iguales a 0 y, por lo tanto, exactamente uno de los x i no es cero. Calcule el coeficiente de variación como en la última línea de la solución geométrica anterior.111pi0xi

whuber
fuente
¡Gracias por una respuesta detallada de la que he aprendido mucho! Supongo que la diferencia entre el en tu respuesta y eln que obtuve (y Henry confirmó) se debe al hecho de que está usandoσx=n1como la definición deσxmientras usabaσx=
σx=1n1i=1n(xix¯)2
σx
σx=1ni=1n(xix¯)2?
Dilip Sarwate
1
Sí Dilip, eso es correcto. Perdón por la discrepancia con la pregunta; Debería haber comprobado primero y debería haber definido (que tenía la intención de hacer, pero olvidé). σx
whuber
10

Algunas referencias, como pequeñas velas en los pasteles de otros:

Katsnelson y Kotz (1957) demostraron que mientras todos , entonces el coeficiente de variación no puede exceder xi0 . Este resultado fue mencionado anteriormente por Longley (1952). Cramér (1946, p.357) demostró un resultado menos agudo, y Kirby (1974) demostró un resultado menos general.n1

Cramér, H. 1946. Métodos matemáticos de estadística . Princeton, NJ: Princeton University Press.

Katsnelson, J. y S. Kotz. 1957. En los límites superiores de algunas medidas de variabilidad. Archiv für Meteorologie, Geophysik und Bioklimatologie , Serie B 8: 103-107.

Kirby, W. 1974. Límite algebraico de estadísticas de muestra. Water Resources Research 10: 220–222.

Longley, RW 1952. Medidas de la variabilidad de la precipitación. Monthly Weather Review 80: 111–117.

Encontré estos papeles trabajando en

Cox, NJ 2010. Los límites de la asimetría de la muestra y la curtosis. Stata Journal 10: 482-495.

que analiza límites ampliamente similares en asimetría y curtosis basadas en momentos.

Nick Cox
fuente
8

With two numbers xixj, some δ>0 and any μ:

(xi+δμ)2+(xjδμ)2(xiμ)2(xjμ)2=2δ(xixj+δ)>0.

Applying this to n non-negative datapoints, this means that unless all but one of the n numbers are zero and so cannot be reduced further, it is possible to increase the variance and standard deviation by widening the gap between any pair of the data points while retaining the same mean, thus increasing the coefficient of variation. So the maximum coefficient of variation for the data set is as you suggest: n1.

c should not affect the result as σxx¯ does not change if all the values are multiplied by any positive constant k (as I said in my comment).

Henry
fuente