¿Qué algoritmo de aprendizaje automático se puede utilizar para predecir el mercado de valores?

15

Alternativamente, para predecir los mercados de divisas. Sé que esto puede ser bastante complicado, así que como introducción, estoy buscando un algoritmo de predicción simple que tenga cierta precisión.

(Es para un proyecto universitario de M.Sc. que dura cuatro meses)

He leído que una red neuronal multicapa podría ser útil. ¿Alguna idea sobre eso? Además, el análisis semántico de las redes sociales puede proporcionar información sobre el comportamiento del mercado que influye en el mercado de valores. Sin embargo, el análisis semántico está un poco fuera del alcance del proyecto en este momento.

siamii
fuente
15
¡Mío, pero por razones obvias me lo guardo todo para mí!
babelproofreader
77
Si uno cree la hipótesis del mercado eficiente, es imposible lograr consistentemente retornos de mercado más altos que el promedio (sin conocimiento interno), que se integra en las tasas / precios actuales. Mucha gente no está de acuerdo con esto, pero casi todos están de acuerdo en que es cierto para un inversor casual. En otras palabras, un modelo de 3 líneas basado en rand () es probablemente casi tan bueno como el inversor típico: P
rm999
55
Parece poco probable que alguien esté dispuesto a compartir un algoritmo que tenga una precisión fuera de la muestra. Excepto, quizás, algunos trabajos académicos publicados donde la anomalía es pequeña y no cubre los costos de transacción.
NPE
2
Para el trabajo académico, podría valer la pena modelar los precios en lugar de intentar predecirlo. La predicción probablemente no tendrá éxito, pero el modelado podría al menos proporcionar una idea de cómo funcionan realmente las cosas, y en teoría puede extenderse a la predicción.
highBandWidth
2
@wayne No creo que se trate de sobreajustar, se trata de permitir predictores que no se pueden usar para predicciones, por ejemplo, variables que ocurren durante / después de los movimientos de existencias; si encuentra que las existencias de Apple y Microsoft tienden a correlacionarse, este hecho no se puede utilizar para predecir el stock de msft pero puede ser muy informativo.
rm999

Respuestas:

17

Como mencionó babelproofreader , aquellos que tienen un algoritmo exitoso tienden a ser muy reservados al respecto. Por lo tanto, es poco probable que un algoritmo ampliamente disponible sea muy útil fuera de la caja a menos que esté haciendo algo inteligente con él (en ese momento deja de estar ampliamente disponible desde que lo está agregando).

Dicho esto, aprender sobre los modelos de promedio móvil interegresivo autorregresivo (ARIMA) podría ser un comienzo útil para pronosticar datos de series temporales. Sin embargo, no esperes mejores resultados aleatorios.

Michael McGowan
fuente
55
+1: Cuántas veces he estado leyendo o he estado en una clase y he escuchado a personas que creen que si tienen un algoritmo lo suficientemente complicado, podrían enriquecerse en los mercados de acciones / electricidad / materias primas. Intenta explicar el sobreajuste, etc., pero fue en vano. Heck, por lo que sé, al no ser un experto, el software exitoso de negociación de acciones no ha dependido de tarifas de transacción, arbitraje y alta velocidad. La vanguardia ahora es utilizar lagunas en las reglas de negociación automatizadas y la propuesta / retirada de ofertas de alta velocidad para golpear a otros operadores automatizados.
Wayne
1
El otro problema es cuando varias personas terminan con el mismo algoritmo porque hicieron su capacitación sobre exactamente los mismos datos y luego transfirieron el volumen de ventas / compras. ¿Se esperaría que algún algoritmo tuviera una precisión a largo plazo?
Michelle
@Wayne existen estrategias para reducir el sobreajuste, aunque son difíciles de implementar en datos de series temporales.
Zach
1
@Zach: sí, hay formas de penalizar el sobreajuste, pero es la actitud en la que estoy reflexionando: las personas que han hecho algunos ajustes básicos (probablemente erróneos) en Excel y sienten que podrían haber ganado dinero con su salsa secreta , pero lo que realmente necesitan es uno de esos algoritmos sofisticados y de vanguardia que el profesor simplemente no compartirá con la clase. Ese algoritmo encajaría en los datos como un guante, y luego predeciría mucho mejor que todos esos otros especuladores que usan hojas de cálculo de Excel ... pero el profesor sigue hablando sobre el sobreajuste y las limitaciones de los datos. Suspiro.
Wayne
12

Creo que para sus propósitos, debe elegir un algoritmo de aprendizaje automático que le parezca interesante y probarlo.

Con respecto a la teoría del mercado eficiente, los mercados no son eficientes, en cualquier escala de tiempo. Además, algunas personas (tanto en la academia como en la vida real) están motivadas por el desafío intelectual, no solo para enriquecerse rápidamente, y publican resultados interesantes (y considero que un resultado fallido es interesante). Pero trata todo lo que lees con una pizca de sal; Si los resultados son realmente buenos, quizás su método científico no lo sea.

Data Mining With R podría ser un libro útil para usted; es caro, así que intente encontrarlo en la biblioteca de su universidad. El Capítulo 2 cubre lo que quieres hacer, y él obtiene los mejores resultados con una red neuronal. Pero tenga en cuenta que obtiene malos resultados y gasta mucho tiempo de CPU para obtenerlos. Las reseñas de Amazon señalan que el libro cuesta $ 20 más porque ese capítulo menciona la palabra finanzas ; Al leerlo tuve la impresión de que el editor lo había empujado a escribirlo. Hizo su tarea, leyó los documentos, examinó las listas de correo correctas, pero su corazón no estaba en eso. Obtuve algunos conocimientos útiles de R, pero no venceré al mercado con él :-)

Darren Cook
fuente
@Darren: me gusta tu estilo.
rolando2
1
Una versión preliminar (mayo de 2003) de minería de datos con R se puede encontrar aquí . (No tengo el libro, así que no puedo decir cuál es la brecha entre las dos versiones)
Chl
@chi Gracias! Eché un vistazo rápido, y solo dos de los cuatro capítulos están allí. Pero la mayor diferencia es que el capítulo Predicción del rendimiento del mercado de valores es muy diferente. No se menciona xts o quantmod y, en su lugar, se usa el paquete ts y el uso de acf y el paquete MARS para las predicciones. Es casi como un capítulo extra, y voy a hacer tiempo para leerlo correctamente. Todavía usa redes neuronales, pero no las compara con las SVM como en el libro publicado.
Darren Cook
10

En mi opinión, cualquier IA fuerte y corriente que pueda hacer todo lo siguiente podría producir fácilmente una predicción estadísticamente significativa:

  • Reúne y entiende los rumores.

  • Acceda e interprete todo el conocimiento del gobierno

  • Hazlo en todos los países relevantes

  • Haga predicciones relevantes sobre:

    • Las condiciones climáticas

    • Actividad terrorista

    • Pensamientos y sentimientos de los individuos.

    • Todo lo demás que afecta el comercio.

El análisis estadístico es la menor de sus preocupaciones, realmente.

Jon Purdy
fuente
4

Puede probar las funciones auto.arima y ets en R. También puede tener cierto éxito con el paquete rugarch , pero no hay funciones existentes para la selección automática de parámetros. Tal vez podría obtener parámetros para el modelo medio auto.arimay luego pasarlos arugarch y agregargarch(1,1) ?

Hay todo tipo de blogs por ahí que afirman cierto éxito al hacer esto. Aquí hay un sistema que usa un modelo arima (y luego un modelo garch) y un sistema que usa un modelo SVM . Encontrará mucha buena información sobre el comercio FOSS , especialmente si comienza a leer los blogs en su blogroll.

Independientemente del modelo que utilice, asegúrese de realizar una validación cruzada y un punto de referencia. Me sorprendería mucho si encontraras un modelo de arima, ets o incluso garch que pudiera vencer constantemente a un modelo ingenuo fuera de muestra. Se pueden encontrar ejemplos de validación cruzada de series temporales aquí y aquí . Tenga en cuenta que lo que REALMENTE desea pronosticar son los retornos, no los precios.

Zach
fuente
2

Sé de un enfoque de aprendizaje automático que actualmente está utilizando al menos un fondo de cobertura. numer.ai está utilizando un conjunto de algoritmos de aprendizaje automático proporcionados por el usuario para dirigir las acciones del fondo.

En otras palabras: un fondo de cobertura proporciona acceso abierto a una versión cifrada de datos en un par de cientos de vehículos de inversión, muy probablemente acciones. Miles de científicos de datos y similares entrenan todo tipo de algoritmos de aprendizaje automático contra esos datos y cargan los resultados en un marcador. Los puntajes más altos obtienen una pequeña cantidad de dinero dependiendo de la precisión de sus resultados y cuánto tiempo ha estado disponible en línea.

Supuestamente, las mejores predicciones son hechas por conjuntos de algoritmos.

Entonces, hay muchos científicos que proporcionan conjeturas capacitadas, algunos de los cuales son conjuntos de conjeturas y el fondo de cobertura utiliza el conjunto de todas las conjeturas proporcionadas para dirigir sus inversiones.

Los resultados de este fondo de cobertura bastante interesantes me enseñaron dos cosas:

  1. Los conjuntos a menudo se consideran una buena forma de hacer predicciones en el mercado de valores.
  2. Las buenas predicciones requieren más conjuntos de los que estoy dispuesto a construir ...

Si desea probar, visite: https://numer.ai/ No, NO estoy afiliado a ellos, lo más probable es que no pase mis días en línea si estuviera conectado a un fondo de cobertura que emplea a miles de personas , pero pagando solo aquellos que proporcionan resultados medibles :)

La comunidad numer.ai tiene un foro donde discuten su enfoque para que PUEDAS aprender de otros que están tratando de hacer lo mismo.

Personalmente, creo que cualquiera con un buen algoritmo lo mantendrá en secreto.

Beyer
fuente
1

Deberías probar las redes neuronales de tipo GMDH. Sé que algunos paquetes comerciales exitosos para la predicción del mercado de valores lo están utilizando, pero solo lo menciono en la profundidad de la documentación. En pocas palabras, es una red neuronal iterativa multicapa, por lo que está en el camino correcto.

BrutForce
fuente
0

Creo que los modelos ocultos de Markov son populares en el mercado de valores. Lo más importante a tener en cuenta es que desea un algoritmo que conserve el aspecto temporal de sus datos.

Roronoa Zoro
fuente