Los datos: he trabajado recientemente en el análisis de las propiedades estocásticas de un campo espacio-temporal de errores de pronóstico de producción de energía eólica. Formalmente, se puede decir que es un proceso indexados dos veces en el tiempo (con y ) y una vez en el espacio ( ) con siendo el número de tiempos de anticipación (es igual a algo alrededor , muestreados regularmente), es el número de "tiempos de pronóstico" (es decir, tiempos en los que se emite el pronóstico, alrededor de 30000 en mi caso, muestreados regularmente), y
Pregunta: ¿Puede describirme el análisis exploratorio que realizaría en este tipo de datos para comprender la naturaleza de la estructura de interdependencia (que podría no ser lineal) del proceso con el fin de proponer un modelo fino de la misma.
fuente
Respuestas:
Me parece que tiene suficientes datos para modelar la dependencia del espacio-tiempo y las influencias meteorológicas tanto del sesgo de los errores de pronóstico (es decir, la tendencia a sobreestimar / subestimar sistemáticamente [primer momento]) como su varianza [segundo momento].
Para explorar el sesgo, simplemente haría muchos diagramas de dispersión, mapas de calor o diagramas de hexbin. Para explorar la variabilidad, simplemente cuadraría los errores originales y luego volvería a hacer muchos diagramas de dispersión, mapas de calor o diagramas de hexbin. Por supuesto, esto no es del todo problemático si tiene muchos sesgos, pero aún puede ayudar a ver patrones de heterocedasticidad influenciada por covariables.
R
mboost
fuente
Nosotros (un colega y yo) finalmente escribimos un artículo sobre eso. Para resumir las cosas, propusimos dos soluciones para cuantificar y dar un resumen estadístico de la propagación (espacial-temporal) de errores a lo largo de Dinamarca y los tiempos de anticipación.
Esto se puede utilizar para calcular un vector de propagación global, es decir, algún tipo de promedio espacial de las velocidades de propagación entre pares. Parte de esto se muestra en el lado izquierdo de la Figura 1, y adivina qué propagación de errores es West East en Denamrk (ok, eso no fue una gran sorpresa :)). También analizamos esto condicionalmente a diferentes situaciones meteorológicas para mostrar la relación entre propagación y viento (velocidad, dirección).
En el segundo caso, observamos que la velocidad de propagación promedio temporal tiene una magnitud similar a la obtenida con el promedio espacial en el primer caso. Si desea ver este trabajo más en serio, el documento está aquí .
fuente