Un revisor mío pregunta por una razón por la que he usado datos no ponderados, en lugar de datos ponderados. He discutido el problema con un estadístico y su respuesta fue similar a la de
Si tiene observaciones independientes y toma la media general, su varianza siempre es menor que la varianza de una media ponderada como el estimador. ... ¡Entonces los intervalos de confianza se ampliarán!
Desde entonces he encontrado la siguiente pregunta en este sitio web y, según tengo entendido, sugieren que la variación debería ser la misma. Entonces, ¿puede alguien, por favor, con una mente más dotada estadísticamente que la mía, por favor confirme la respuesta del estadístico y explique en términos simples la teoría, o con un ejemplo trabajado.
variance
weighted-mean
weighted-data
user08041991
fuente
fuente
Respuestas:
Su pregunta vinculada es abordar el uso de pesos como un atajo para lidiar con la varianza igualmente ponderada por punto de datos en la que algunos puntos de datos ocurren más de una vez.
@whuber ha abordado en un comentario la situación en la que las variaciones de todos los puntos de datos son iguales. Así que abordaré la situación en la que no son iguales. En esta situación, la media ponderada óptima produce una varianza menor que la media no ponderada, es decir, igualmente ponderada.
La media ponderada, usando pesaswyo , es igual Σnortei = 1wyoXyo y tiene varianza = Σnortei = 1w2yoVa r (Xyo) . Entonces deseamos minimizarΣnortei = 1w2yoVa r (Xyo) , sujeto a Σnortei = 1wyo= 1 y wyo≥ 0 por todo lo i.
Las condiciones de Karush-Kuhn-Tucker, que son necesarias y suficientes para un mínimo global para este problema, dado que es un problema de programación cuadrática convexo, dan como resultado una solución de forma cerrada, a saber:
Lo óptimowyo= [ 1 / Va r (Xyo) ] /Σnortej = 1[ 1 / Va r (Xj) ] para 1 = 1 .. n.
La varianza de la media ponderada óptima correspondiente =1 /Σnortei = 1[ 1 / Va r (Xyo) ] .
Por el contrario, igual ponderación significawyo=1norte para todo i, donde n es el número de puntos de datos. Como señaló Whuber, los pesos iguales son óptimos si todas las variaciones de puntos de datos son iguales, lo que se puede ver en la fórmula anterior para un óptimowyo . Sin embargo, como es evidente por esa fórmula, los pesos iguales no son óptimos si las variaciones de los puntos de datos no son todas iguales, y de hecho resultan en una varianza mayor (de la media ponderada) que los pesos óptimos. La varianza de la media ponderada por igual, es decir, la varianza de la media ponderada usando pesos iguales =1norte2Σnortei = 1Va r (Xyo) .
Aquí hay algunos ejemplos de resultados numéricos:
Por supuesto, es posible que la media ponderada tenga una mayor varianza que la media no ponderada, si las ponderaciones se eligen de manera deficiente. Al elegir el peso de 1 en el punto de datos con la mayor varianza, y 0 para todos los demás puntos de datos, la media ponderada tendría varianza = la mayor varianza de cualquier punto de datos. Este ejemplo extremo sería el resultado de maximizar en lugar de minimizar en el problema de optimización que expuse.
fuente
Aquí hay un ejemplo simple usando el1norte∑yo(Xyo-1norte∑jXj)2 y 1∑kwk∑yowyo(Xyo-1∑kwk∑jwjXj)2 formas de la varianza:
Supongamos que su población tiene medidas20 , 30 , 40 , 50 .
Este ejemplo es consistente con mi comentario de que es probable que la cita de su estadístico sea cierta para una población con una distribución unimodal, aunque no es necesario que sea cierta en general.
Supongo que el punto es que si cita la media ponderada, probablemente debería asociarla con la varianza ponderada. Si de hecho su media es el resultado de la muestra, el error estándar de la media muestral ponderada es un cálculo más complicado.
fuente