Cuando usas el promedio, estás diciendo dos cosas:
- Los valores atípicos no son un gran problema (de lo contrario, usaría la mediana o al menos filtraría algunos valores atípicos antes de tomar el promedio)
- Cada predicción tiene el mismo peso (de lo contrario, tendrá en cuenta los pesos)
No debe esperar que haya grandes valores atípicos, ya que puede hacer que el tamaño de la muestra sea lo suficientemente grande como para que importen menos en el promedio y ya que esperaría un mínimo de estabilidad de las predicciones de los árboles individuales.
No hay razón para pensar que algunos árboles deberían tener más peso predictivo que otros, ni una forma de determinar tales pesos.
Realmente no puedes usar el modo ya que las predicciones están en una escala continua. Por ejemplo, si tuviera las predicciones 80 80 100 101 99 98 97 102 103 104 96, el modo predeciría 80. Eso no puede ser lo que desea. Si todos los valores tienen decimales distintos, el modo no sabría cómo decidir.
Existen otros promedios que la media aritmética, como la media geométrica y la media armónica. Están diseñados para reducir el promedio si hay algunos valores bajos en la serie de datos. Eso tampoco es lo que quieres aquí.