Algoritmos de aprendizaje automático para datos de panel

12

En esta pregunta, ¿existe algún método para construir árboles de decisión que tenga en cuenta los predictores estructurados / jerárquicos / multinivel? - mencionan un método de datos de panel para árboles.

¿Existen métodos de datos de panel específicos para admitir máquinas de vectores y redes neuronales? Si es así, ¿podría citar algunos documentos para los algoritmos y (si está disponible) los paquetes R que lo implementan?

Carlos Cinelli
fuente
1
Me preguntaba qué decidiste usar para esto. Tratando de resolver un problema similar.
usuario0

Respuestas:

1

LSTM (memoria a corto y largo plazo) puede ser relevante para usted. Este tipo de modelo puede manejar múltiples características en múltiples puntos en el tiempo, lo que debería ajustarse a los datos del panel. Aquí hay una muy buena explicación sobre el concepto de LSTM, y aquí hay un paquete que implementa una versión R de LSTM.

Discursos bonitos
fuente
0

Cuando tiene datos de panel, hay diferentes tareas que puede intentar resolver, por ejemplo, clasificación / regresión de series de tiempo o pronóstico de panel. Y para cada tarea, existen numerosos enfoques para resolverlo.

Cuando desee utilizar métodos de aprendizaje automático para resolver pronósticos de paneles, existen varios enfoques:

Con respecto a sus datos de entrada (X), tratando unidades (por ejemplo, países, individuos, etc.) como muestras de iid, puede

  • bin la serie de tiempo y trate cada bin como una columna separada, ignorando cualquier orden temporal, con bins iguales para todas las unidades, el tamaño del bin podría, por supuesto, ser simplemente la medición de la serie de tiempo observada, o podría muestrear y agregar en bins más grandes, luego utilizar algoritmos de aprendizaje automático estándar para datos tabulares,
  • o extraiga características de la serie de tiempo para cada unidad, y use cada característica extraída como columnas separadas, nuevamente combinadas con algoritmos tabulares estándar,
  • o use algoritmos especializados de regresión / clasificación de series temporales dependiendo de si observa datos de series temporales continuas o categóricas, esto incluye máquinas de vectores de soporte con núcleos especiales que comparan series temporales con series temporales.

Con respecto a sus datos de salida (y), si desea pronosticar múltiples puntos de tiempo en el futuro, puede

  • ajuste un estimador para cada paso adelante que desee pronosticar, utilizando siempre los mismos datos de entrada,
  • o ajuste un solo estimador para el primer paso adelante y en la predicción, pase los datos de entrada a tiempo, usando las predicciones del primer paso para agregar a los datos de entrada observados para hacer las predicciones del segundo paso y así sucesivamente.

Todos los enfoques anteriores básicamente reducen el problema de pronóstico del panel a una regresión de series de tiempo o un problema de regresión tabular. Una vez que sus datos están en la serie de tiempo o en el formato de regresión tabular, también puede agregar cualquier característica invariable en el tiempo para los usuarios.

Por supuesto, hay otras opciones para resolver el problema del pronóstico del panel, como por ejemplo, usar métodos de pronóstico clásicos como ARIMA adaptado a los datos del panel o métodos de aprendizaje profundo que le permiten realizar predicciones de secuencia a secuencia directamente.

mloning
fuente