PhD de matemática (programación no lineal) que cambia a ciencia de datos?

9

Soy un doctorado en matemáticas. estudiante que está interesado en ir a la industria como Data Scientist después de graduarse. Daré brevemente algunos antecedentes sobre mi educación antes de plantear mi pregunta, para que se entienda mejor:

Cursos de matemáticas:

Esto ha sido principalmente en matemática pura: topología, análisis funcional, etc., pero también incluye más aplicados (en los que me he especializado para la disertación): optimización convexa, programación no lineal, análisis numérico, programación lineal, optimización multiobjetivo. Además, ahora mismo tengo 0 conocimientos de estadística inferencial, pero confío en la teoría de probabilidad.

Programación:

Acabo de tomar un curso de un año en el Bachillerato, pero fue principalmente Mathematica y algo de Java, del cual no recuerdo nada honestamente. En este curso, el contenido no incluía nada de estructuras de datos o diseño y análisis de algoritmos, ni sistemas de gestión de bases de datos. También aprendí Matlab por mi cuenta para implementar algoritmos en la tesis de licenciatura.

Los antecedentes anteriores fueron durante el programa de licenciatura y maestría. Ahora, durante el doctorado. descubrí que Machine Learning es la combinación perfecta (para mí) entre optimización no lineal, programación y aplicaciones en el mundo real, es decir, es teóricamente interesante y orientado a la aplicación. Esta es la razón por la que me entusiasmó tanto ir a la industria. Por lo tanto, comencé a aprender cosas por mi cuenta (en mi pequeño tiempo libre) durante los últimos 3 años.

Breve resumen de lo aprendido:

  • Python: Me siento cómodo implementando algoritmos de optimización, trabajo con cuadernos jupyter y la biblioteca numpy (de hecho, tuve que hacer esto para la disertación), y haciendo manipulaciones básicas de datos y tareas de limpieza en pandas. Esto lo aprendí en línea, en una plataforma llamada dataquest ( https://app.dataquest.io ). Sin embargo, no creo que tenga suficiente conocimiento para pasar una entrevista en estructuras de datos y algoritmos (ver arriba).

  • Aprendizaje automático: tomé un curso de nivel maestro en el tema en la universidad (dado que estoy en Alemania, no tenemos cursos en el doctorado, así que todo fue en mi tiempo personal), lo que realmente disfruté. Temas incluidos: k-NN, PCA, SVM, NN, etc.

  • Tomando un curso en bases de datos este semestre, que se centra en SQL.

  • Tomando la especialización de aprendizaje profundo en Coursera este semestre.

Finalmente, quiero decir que me siento totalmente capaz de aprender los temas. De hecho, con el tiempo tengo la intención de tomar más cursos de posgrado disponibles en línea (por ejemplo, Stanford CS231N, CS234, etc.) porque, en mi opinión, los cursos en línea pueden no ser lo suficientemente rigurosos. Con suerte, después de la defensa, podré concentrarme a tiempo completo en esto.

De ahí las preguntas:

  • ¿Todavía puedo ser contratado en este momento (quiero decir, después de terminar este semestre con el conocimiento descrito anteriormente)? Sinceramente, creo que no estoy listo, pero estoy seguro de que puedo ser decente en un año.

  • ¿Estoy siendo demasiado ingenuo al pensar que una compañía me daría una oportunidad?

  • ¿Qué debo hacer para ser más deseable en cualquier caso?

John D
fuente
1
Cuando solicité mi trabajo (en Alemania) había al menos dos empresas que solo consideraban el conocimiento matemático. No les importaba nada más. La programación sería un favor, pero tienen programadores dedicados para convertir las cosas en las que trabajan principalmente matemáticos y físicos en software.
Ben

Respuestas:

4

No estoy en desacuerdo con las otras respuestas, pero aquí hay una perspectiva diferente que debes tener en cuenta. Además, puedo ofrecer respuestas a sus preguntas específicas como alguien que dejó la academia (matemática aplicada / CS) para la ciencia de datos.

En resumen, comprender las necesidades subyacentes y los casos de uso para un problema comercial es primordial para cualquier proyecto, por lo que desarrollar un fuerte sentido comercial y habilidades de comunicación interfuncionales son fundamentales si desea el alcance más amplio en una carrera de ciencia de datos.

  • ¿Todavía puedo ser contratado en este momento (quiero decir, después de terminar este semestre con el conocimiento descrito anteriormente)? Sinceramente, creo que no estoy listo, pero estoy seguro de que puedo ser decente en un año.
  • ¿Estoy siendo demasiado ingenuo al pensar que una compañía me daría una oportunidad?

Voy a responder esto juntos. Depende en gran medida de la empresa y sus necesidades actuales. Para usted, esto puede variar a lo largo de las dimensiones "inicio" a "empresa" y "ML shop" a "negocio general basado en datos". Con esto último, quiero decir que hay compañías cuyo único propósito es vender productos o servicios de ML a los clientes, en comparación con las compañías de tecnología en general que desean explotar el modelado en sus negocios. Es probable que encuentre un ajuste más rápido / fácil con una empresa que ya tiene sus casos de uso de ML construidos o dictados por otros, porque es probable que no esté equipado para crear estrategias para el inicio de un nuevo proyecto.

Entonces, eso podría ser cierto para una empresa más grande que tiene un departamento dedicado a trabajar con los tecnicismos del modelo ML mientras que otras partes de la compañía determinan la estrategia y el diseño comercial, o en una empresa de cualquier tamaño que se enfoca en ML como su producto / Servicio.

A corto plazo, sí, es probable que pueda convencer a alguien para que lo tenga como pasante o asistente en algunos proyectos, pero su doctorado probablemente se verá como un inconveniente potencial si está hablando con pequeñas y medianas empresas que desean contratar a generalistas / tomas de todos los oficios ...

  • ¿Qué debo hacer para ser más deseable en cualquier caso?

Lo que me lleva a esto. Puede elegir su propia aventura porque hay muchos tipos de roles, pero debe saber qué tipo de rol y situación está buscando cada posible empleador, y ser realista acerca de cómo podría encajar con él. Hay muchos empleadores que no expresan claramente lo que quieren o necesitan, o ni siquiera saben lo que es . Harías bien en averiguarlo con ellos para evitar una gran decepción.

Si desea ampliar sus horizontes en la ciencia de datos y asegurarse de tener el mayor impacto comercial y oportunidades de desarrollo profesional, le gustaría aprender mucho más sobre las aplicaciones comerciales de la ciencia de datos. Esas son muy diversas y más informales en la práctica y más impactantes para el negocio en general que preocuparse por las optimizaciones para matrices de pseudoinversión.

A pesar de las opiniones razonables en las otras respuestas publicadas sobre el mercado, hay un enorme déficit de mercado en mi opinión para los científicos de datos que:

  • Comprenda realmente las necesidades comerciales y pueda comunicarse de manera efectiva con personas no técnicas
  • Desarrolle y ejecute planes que impliquen la resolución general de problemas basados ​​en datos, que pueden o no implicar la construcción de modelos "geniales" (y, francamente, probablemente no lo harán, al menos no hasta que el problema se entienda muy bien por métodos exploratorios más tradicionales).
RHC
fuente
muy buena respuesta
pcko1
Yo (nuevo graduado de MSc Math) creo que estoy en el barco opuesto al OP. Un poco de programación allí, un poco de matemática aquí, pero nada demasiado profundo en ninguna parte. Mi educación es demasiado general, por lo que es difícil destacar. Tengo amplias habilidades blandas como las que mencionaste en tu penúltima viñeta. Una vez que entiendo completamente un concepto técnico, soy bastante bueno para explicárselo a los legos. También era un oficial de la marina, así que tengo mucha experiencia trabajando con personas y proyectando una "imagen", que creo que se cruza con una mentalidad empresarial.
rocksNwaves
10

Los trabajos de ciencia de datos cubren una amplia gama de actividades diferentes, por lo que es probable que cualquier respuesta sea subjetiva. Estoy en el mundo académico, por lo que mi conocimiento del mercado laboral es limitado, pero por lo que puedo ver:

  • El contexto actual es muy favorable para los científicos de datos que buscan trabajo, por lo que cualquier persona con algún conocimiento básico de ML tiene una oportunidad. Ya estás por encima de este nivel, así que no te preocupes en este frente. Es probable que la tendencia continúe así, pero nadie sabe el futuro.
  • Idealmente para aumentar sus posibilidades, debería ser capaz de demostrar que tiene experiencia práctica: por ejemplo, proyectos github, participación en una competencia de ML, este tipo de cosas.
  • No descuides tu doctorado en matemáticas: parece que tienes mucho tiempo libre para aprender ciencia de datos, bien por ti ... Pero asegúrate de que el doctorado sea tu máxima prioridad, será un gran activo en tu currículum, incluso si No está relacionado con la ciencia de datos.
Erwan
fuente
3

Erwan lo clavó (+1). Pero creo que mi adición es demasiado larga para un comentario.

Parece que estás muy por delante de donde estaba cuando conseguí mi trabajo de DS. Estaba en matemática pura, un par de posdoctorados, y tenía poco tiempo de autoaprendizaje cuando estaba aplicando para la ciencia de datos de la industria.

Por otro lado, tuve exámenes actuariales en mi licenciatura, lo que probablemente me ayudó a ingresar al espacio fintech. Al aplicar, enfatice lo que ya sabe y reconozca lo que necesitará aprender en sus primeros meses (¿programación más fuerte? ¿Usando git? ...).

(Además, no mencionó modelos basados ​​en árboles en su curso de ML: supongo que fue solo una omisión, pero esos parecen ser el modelo más importante para entender a menos que esté tratando de ingresar a industrias donde las redes neuronales son la norma)

Ben Reiniger
fuente
¡Gracias por la respuesta! Es bueno saber que no es la primera vez que un matemático puro va a la ciencia de datos.
John D
¿Puedo preguntar cuál es su opinión sobre los cursos en línea, como la especialización de aprendizaje profundo en Coursera? ¿Este tipo de cursos realmente te prepara para trabajar en la industria?
John D
En lugar de ir a Coresera, intente rápido. Todos los cursos están más adaptados a las aplicaciones de la vida real, es bueno ver cualquier curso en cualquier MOOC que le enseñarán temas y el tema y los conceptos después de eso, depende de usted cuánto use esas herramientas aprendidas en sus aplicaciones requeridas. Simplemente no pienses demasiado, solo entra y te aseguro que encontrarás tu pasión.
khwaja wisal
3

Simplemente no tome este consejo a ciegas: los temas que ha mencionado en matemáticas son fundamentales para resolver problemas utilizando el aprendizaje automático / aprendizaje profundo, la programación es una herramienta para implementar toda esta teoría que aprende y sobre esa base crea sus hipótesis y luego pruebe implementándolo en código para que no necesite habilidades de codificación de un codificador, debe conocer las estructuras de datos de su uso, especialmente los marcos de datos y la manipulación del tensor y el descanso que aprenderá durante la implementación. La mejor parte con usted es que tiene el conocimiento fundamental de las matemáticas (supongo que conoce estadísticas de probabilidad, cálculo multivariado, análisis funcional y el resto de las materias que mencionó, no entraré en detalles ya que ya está haciendo un doctorado. .

Te sugiero que pases por todos los cursos de Fast.ai impartidos por Jeremy Howard (él es literalmente el dios del aprendizaje profundo). Su curso sobre aprendizaje profundo práctico para programadores está repleto de conocimientos, aparte de eso, para la comprensión central de las matemáticas detrás de las redes neuronales. puedes ir y leer un blog de Michael Nielsen llamado neuralnetworksanddeeplearning.com en realidad es un libro y uno excelente y te encantará la explicación matemática y para una mejor comprensión siempre puedes ir y leer en el blog de Chris olah es simplemente genial.

Así que ahora la cuestión es que todavía puedes obtener muchas pasantías de investigación e ir a aprender allí en un entorno industrial, pero prefiero sugerirte que te des un poco de tiempo para realizar estos cursos, obtener un control del asunto y con las matemáticas detrás de ti, Están listos para hacer cualquier cosa. Mira, la ciencia de datos en este momento es como si todos quisieran ser uno y solo obtener ese salario de 6 dígitos y terminar, pero no es que la ciencia de datos no sea algo que puedas aprender de una vez, lleva tiempo,

Por lo tanto, date un poco de tiempo, sé paciente y sigue resolviendo sigue leyendo publicaciones sobre los últimos temas que ahora están disponibles gratuitamente, así que sigue adelante.

khwaja wisal
fuente
¡gracias por la respuesta! lo haré
John D