Tengo un promedio mensual para un valor y una desviación estándar correspondiente a ese promedio. Ahora estoy calculando el promedio anual como la suma de los promedios mensuales, ¿cómo puedo representar la desviación estándar para el promedio sumado?
Por ejemplo, considerando la producción de un parque eólico:
Month MWh StdDev
January 927 333
February 1234 250
March 1032 301
April 876 204
May 865 165
June 750 263
July 780 280
August 690 98
September 730 76
October 821 240
November 803 178
December 850 250
Podemos decir que en el año promedio el parque eólico produce 10,358 MWh, pero ¿cuál es la desviación estándar correspondiente a esta cifra?
[ASK QUESTION]
en la parte superior y pregúntela allí, entonces podemos ayudarlo adecuadamente. Como eres nuevo aquí, es posible que desees realizar nuestro recorrido , que contiene información para nuevos usuarios.Respuestas:
Respuesta corta: promedias las variaciones ; entonces puedes sacar raíz cuadrada para obtener la desviación estándar promedio .
Ejemplo
Y luego la desviación estándar promedio es
sqrt(53,964) = 232
De la suma de variables aleatorias distribuidas normalmente :
Y de la distribución de suma normal de Wolfram Alpha :
Para sus datos:
10,358 MWh
647,564
804.71 ( sqrt(647564) )
Entonces para responder a su pregunta:
Los sumas cuadráticamente:
Conceptualmente sumas las variaciones, luego sacas la raíz cuadrada para obtener la desviación estándar.
Como tenía curiosidad, quería saber la potencia media mensual promedio y su desviación estándar . A través de la inducción, necesitamos 12 distribuciones normales que:
10,358
647,564
Eso sería 12 distribuciones mensuales promedio de:
10,358/12 = 863.16
647,564/12 = 53,963.6
sqrt(53963.6) = 232.3
Podemos verificar nuestras distribuciones promedio mensuales al sumarlas 12 veces, para ver que son iguales a la distribución anual:
863.16*12 = 10358 = 10,358
( correcta )53963.6*12 = 647564 = 647,564
( correcta )Editar : moví el corto, al punto, respondo arriba. Porque necesitaba volver a hacer esto hoy, pero quería verificar que promediara las variaciones .
fuente
Esta es una vieja pregunta, pero la respuesta aceptada no es correcta o completa. El usuario desea calcular la desviación estándar en datos de 12 meses donde la media y la desviación estándar ya se calculan cada mes. Suponiendo que el número de muestras en cada mes es el mismo, entonces es posible calcular la media y la varianza de la muestra a lo largo del año a partir de los datos de cada mes. Por simplicidad, supongamos que tenemos dos conjuntos de datos:
con valores conocidos de media muestral y varianza muestral, , , , .μx μy σ2x σ2y
Ahora queremos calcular las mismas estimaciones para
Tenga en cuenta que , se calculan como:μx σ2x
Para estimar la media y la varianza sobre el conjunto total necesitamos calcular:
Entonces, si tiene la varianza sobre cada subconjunto y desea la varianza sobre todo el conjunto, puede promediar las varianzas de cada subconjunto si todas tienen la misma media. De lo contrario, debe agregar la varianza de la media de cada subconjunto.
Digamos que durante la primera mitad del año producimos exactamente 1000 MWh por día y en la segunda mitad, producimos 2000 MWh por día. Entonces, la media y la varianza de la producción de energía en la primera y segunda mitad son 1000 y 2000 para la media y la varianza es 0 para ambas mitades. Ahora hay dos cosas diferentes que nos pueden interesar:
1- Queremos calcular la variación de la producción de energía durante todo el año : luego, promediando las dos variaciones llegamos a cero, lo cual no es correcto ya que la energía por día durante todo el año no es constante. En este caso, necesitamos agregar la varianza de todas las medias de cada subconjunto. Matemáticamente, en este caso, la variable aleatoria de interés es la producción de energía por día. Tenemos estadísticas de muestra sobre subconjuntos y queremos calcular las estadísticas de muestra durante un tiempo más largo.
2- Queremos calcular la variación de la producción de energía por año: en otras palabras, estamos interesados en cuánto cambia la producción de energía de un año a otro. En este caso, promediar la varianza conduce a la respuesta correcta, que es 0, ya que en cada año estamos produciendo exactamente 1500 MHW en promedio. Matemáticamente, en este caso, la variable aleatoria de interés es el promedio de producción de energía por día, donde el promedio se realiza durante todo el año.
fuente
Sin embargo, creo que lo que realmente le puede interesar es el error estándar en lugar de la desviación estándar.
El error estándar de la media (SEM) es la desviación estándar de la estimación de la media de la muestra de una media poblacional, y eso le dará una medida de cuán buena es su estimación anual de MWh.
Es muy fácil de calcular: si usó muestras para obtener sus promedios mensuales de MWh y desviaciones estándar, simplemente calcularía la desviación estándar como sugirió @IanBoyd y la normalizaría según el tamaño total de su muestra. Es decir,s = √n
fuente
Me gustaría enfatizar nuevamente la incorrección en parte de la respuesta aceptada. La redacción de la pregunta conduce a la confusión.
La pregunta tiene Promedio y StdDev de cada mes, pero no está claro qué tipo de subconjunto se usa. ¿Es el promedio de 1 turbina eólica de toda la granja o el promedio diario de toda la granja? Si es el promedio diario de cada mes, no puede sumar el promedio mensual para obtener el promedio anual porque no tienen el mismo denominador. Si es el promedio de la unidad, la pregunta debe indicar
En lugar de
Además, la desviación estándar o la varianza es la comparación con el promedio propio del conjunto. NO contiene ninguna información sobre el promedio de todo el conjunto.
La imagen no es necesariamente muy correcta pero transmite la idea general. Imaginemos la salida de 1 parque eólico como en la imagen. Como puede ver, la variación "local" no tiene nada que ver con la variación "global", sin importar cómo las agregue o multiplique. No puede predecir la varianza del año utilizando la varianza de 2 medio año. Entonces, en la respuesta aceptada, aunque el cálculo de la suma es correcto, la división por 12 para obtener el número mensual no significa nada. . De las tres secciones, la primera y la última sección son incorrectas, la segunda es correcta.
Nuevamente, es una aplicación muy incorrecta, no la sigas o te metería en problemas. Simplemente calculado para todo, utilizando la producción total anual / mensual de cada unidad como puntos de datos dependiendo de si desea un número anual o mensual, esa debería ser la respuesta correcta. Probablemente quieras algo como esto. Estos son mis números generados al azar. Si tiene los datos, el resultado en la celda O2 debería ser su respuesta.
fuente