Comprensión conceptual del error cuadrático medio y la desviación del sesgo medio

13

Me gustaría obtener una comprensión conceptual del error cuadrático medio (RMSE) y la desviación media del sesgo (MBD). Después de calcular estas medidas para mis propias comparaciones de datos, a menudo me he quedado perplejo al descubrir que el RMSE es alto (por ejemplo, 100 kg), mientras que el MBD es bajo (por ejemplo, menos del 1%).

Más específicamente, estoy buscando una referencia (no en línea) que enumere y discuta las matemáticas de estas medidas. ¿Cuál es la forma normalmente aceptada de calcular estas dos medidas y cómo debo informarlas en un artículo de revista?

Sería realmente útil en el contexto de esta publicación tener un conjunto de datos de "juguete" que pueda usarse para describir el cálculo de estas dos medidas.

Por ejemplo, supongamos que debo encontrar la masa (en kg) de 200 widgets producidos por una línea de ensamblaje. También tengo un modelo matemático que intentará predecir la masa de estos widgets. El modelo no tiene que ser empírico, y puede estar basado físicamente. Calculo el RMSE y el MBD entre las mediciones reales y el modelo, encontrando que el RMSE es de 100 kg y el MBD es del 1%. ¿Qué significa esto conceptualmente y cómo interpretaría este resultado?

Ahora suponga que, a partir del resultado de este experimento, encuentro que el RMSE es de 10 kg y el MBD es del 80%. ¿Qué significa esto y qué puedo decir sobre este experimento?

¿Cuál es el significado de estas medidas y qué implican las dos (en conjunto)? ¿Qué información adicional proporciona el MBD cuando se considera con el RMSE?

Nicholas Kinar
fuente
2
¿Has mirado alrededor de nuestro sitio, Nicholas? Considere comenzar en stats.stackexchange.com/a/17545 y luego explore algunas de las etiquetas que he agregado a su pregunta.
whuber
@whuber: ¡Gracias whuber !. He echado un vistazo al sitio, pero para mí todavía me resulta un poco difícil entender lo que realmente significa en el contexto de mi propia investigación.
Nicholas Kinar

Respuestas:

21

Creo que estos conceptos son fáciles de explicar. Prefiero describirlo aquí. Estoy seguro de que muchos libros de estadísticas elementales cubren esto, incluido mi libro "Los fundamentos de la bioestadística para médicos, enfermeras y médicos".

Piense en un objetivo con una diana en el medio. El error cuadrático medio representa la distancia cuadrática promedio desde una flecha disparada al objetivo y al centro. Ahora, si sus flechas se dispersan uniformemente alrededor del centro, entonces el tirador no tiene sesgo de puntería y el error cuadrado medio es el mismo que la varianza.

Pero, en general, las flechas pueden dispersarse alrededor de un punto lejos del objetivo. La distancia cuadrada promedio de las flechas desde el centro de las flechas es la varianza. Este centro podría verse como el punto de puntería de los tiradores. La distancia desde este centro de tiro o punto de puntería al centro del objetivo es el valor absoluto del sesgo.

Pensando en un triángulo rectángulo donde el cuadrado de la hipotenusa es la suma de los cuadrados de los dos lados. Entonces, una distancia al cuadrado desde la flecha hasta el objetivo es el cuadrado de la distancia desde la flecha hasta el punto objetivo y el cuadrado de la distancia entre el centro del objetivo y el punto objetivo. Al promediar todas estas distancias cuadradas se obtiene el error cuadrático medio como la suma del sesgo al cuadrado y la varianza.

Michael R. Chernick
fuente
Gracias; Esto es muy apreciado. Todavía me resulta un poco difícil entender cuál es la diferencia entre RMSE y MBD. Según tengo entendido, RMSE cuantifica qué tan cerca está un modelo de los datos experimentales, pero ¿cuál es el papel de MBD? Tal vez mi malentendido solo está asociado con la terminología.
Nicholas Kinar
1
La desviación de sesgo media como la llamas es el término de sesgo que describí. Mide qué tan lejos está el punto objetivo del objetivo. El sesgo contribuye a que la inyección sea inexacta.
Michael R. Chernick
Gracias de nuevo, Michael. Entonces, ¿un alto RMSE y un bajo MBD implica que es un buen modelo?
Nicholas Kinar
No hay un RMSE alto y un MBD bajo solo dice que el modelo es pobre debido a una gran variación en lugar de un gran sesgo. El RMSE es el número que decide qué tan bueno es el modelo.
Michael R. Chernick
1
@bbadyalina: son piezas de información independientes, de la misma manera que arriba / abajo e izquierda / derecha son independientes. Su pregunta es como preguntar "si un punto está centrado verticalmente y muy a la izquierda, ¿está en el medio?" , o "Si un punto está arriba, pero horizontalmente en el centro, ¿está en el medio?"
naught101
1

RMSE es una forma de medir qué tan bueno es nuestro modelo predictivo sobre los datos reales, mientras que el RMSE más pequeño es la mejor forma de comportamiento del modelo, es decir, si lo probamos en un nuevo conjunto de datos (no en nuestro conjunto de entrenamiento) pero luego nuevamente un RMSE de 0.37 en un rango de 0 a 1, explica muchos errores en comparación con tener un RMSE de 0.01 como un mejor modelo. BIAS es para sobreestimar o subestimar.

Albert Anthony Dominguez Gavin
fuente
¿Podría por favor proporcionar más detalles y un ejemplo resuelto? El OP está buscando una explicación intuitiva del significado de un RMSE de, digamos, 100, contra su problema de estimación.
Xi'an
Esto no parece ofrecer mucha intuición. ¿Puedes explicarme mas?
Glen_b -Reinstalar Monica
0

Hasta donde puedo entender, un RMSE da un valor más preciso del error entre el modelo y el observado, sin embargo, el BIAS, además de dar un valor del error (menos preciso que el RMSE), también puede determinar si el modelo es sesgo positivo o sesgo negativo, si el modelo está subestimando o sobreestimando los valores observados.

e_serrano
fuente
No. Puede pensar en RMSE como la "precisión" de un modelo, por ejemplo, cuánta dispersión existe en los errores de sus predicciones (nota: la precisión es la inversa de la varianza: alta varianza = baja precisión). Y puede pensar en el sesgo como el error sistemático en el modelo, por ejemplo, el valor promedio de todos los errores. La "precisión" del trabajo es una combinación vaga de ambos, y por lo tanto causa mucha confusión.
naught101