Soy un doctorado en matemáticas. estudiante que está interesado en ir a la industria como Data Scientist después de graduarse. Daré brevemente algunos antecedentes sobre mi educación antes de plantear mi pregunta, para que se entienda mejor:
Cursos de matemáticas:
Esto ha sido principalmente en matemática pura: topología, análisis funcional, etc., pero también incluye más aplicados (en los que me he especializado para la disertación): optimización convexa, programación no lineal, análisis numérico, programación lineal, optimización multiobjetivo. Además, ahora mismo tengo 0 conocimientos de estadística inferencial, pero confío en la teoría de probabilidad.
Programación:
Acabo de tomar un curso de un año en el Bachillerato, pero fue principalmente Mathematica y algo de Java, del cual no recuerdo nada honestamente. En este curso, el contenido no incluía nada de estructuras de datos o diseño y análisis de algoritmos, ni sistemas de gestión de bases de datos. También aprendí Matlab por mi cuenta para implementar algoritmos en la tesis de licenciatura.
Los antecedentes anteriores fueron durante el programa de licenciatura y maestría. Ahora, durante el doctorado. descubrí que Machine Learning es la combinación perfecta (para mí) entre optimización no lineal, programación y aplicaciones en el mundo real, es decir, es teóricamente interesante y orientado a la aplicación. Esta es la razón por la que me entusiasmó tanto ir a la industria. Por lo tanto, comencé a aprender cosas por mi cuenta (en mi pequeño tiempo libre) durante los últimos 3 años.
Breve resumen de lo aprendido:
Python: Me siento cómodo implementando algoritmos de optimización, trabajo con cuadernos jupyter y la biblioteca numpy (de hecho, tuve que hacer esto para la disertación), y haciendo manipulaciones básicas de datos y tareas de limpieza en pandas. Esto lo aprendí en línea, en una plataforma llamada dataquest ( https://app.dataquest.io ). Sin embargo, no creo que tenga suficiente conocimiento para pasar una entrevista en estructuras de datos y algoritmos (ver arriba).
Aprendizaje automático: tomé un curso de nivel maestro en el tema en la universidad (dado que estoy en Alemania, no tenemos cursos en el doctorado, así que todo fue en mi tiempo personal), lo que realmente disfruté. Temas incluidos: k-NN, PCA, SVM, NN, etc.
Tomando un curso en bases de datos este semestre, que se centra en SQL.
Tomando la especialización de aprendizaje profundo en Coursera este semestre.
Finalmente, quiero decir que me siento totalmente capaz de aprender los temas. De hecho, con el tiempo tengo la intención de tomar más cursos de posgrado disponibles en línea (por ejemplo, Stanford CS231N, CS234, etc.) porque, en mi opinión, los cursos en línea pueden no ser lo suficientemente rigurosos. Con suerte, después de la defensa, podré concentrarme a tiempo completo en esto.
De ahí las preguntas:
¿Todavía puedo ser contratado en este momento (quiero decir, después de terminar este semestre con el conocimiento descrito anteriormente)? Sinceramente, creo que no estoy listo, pero estoy seguro de que puedo ser decente en un año.
¿Estoy siendo demasiado ingenuo al pensar que una compañía me daría una oportunidad?
¿Qué debo hacer para ser más deseable en cualquier caso?
Respuestas:
No estoy en desacuerdo con las otras respuestas, pero aquí hay una perspectiva diferente que debes tener en cuenta. Además, puedo ofrecer respuestas a sus preguntas específicas como alguien que dejó la academia (matemática aplicada / CS) para la ciencia de datos.
En resumen, comprender las necesidades subyacentes y los casos de uso para un problema comercial es primordial para cualquier proyecto, por lo que desarrollar un fuerte sentido comercial y habilidades de comunicación interfuncionales son fundamentales si desea el alcance más amplio en una carrera de ciencia de datos.
Voy a responder esto juntos. Depende en gran medida de la empresa y sus necesidades actuales. Para usted, esto puede variar a lo largo de las dimensiones "inicio" a "empresa" y "ML shop" a "negocio general basado en datos". Con esto último, quiero decir que hay compañías cuyo único propósito es vender productos o servicios de ML a los clientes, en comparación con las compañías de tecnología en general que desean explotar el modelado en sus negocios. Es probable que encuentre un ajuste más rápido / fácil con una empresa que ya tiene sus casos de uso de ML construidos o dictados por otros, porque es probable que no esté equipado para crear estrategias para el inicio de un nuevo proyecto.
Entonces, eso podría ser cierto para una empresa más grande que tiene un departamento dedicado a trabajar con los tecnicismos del modelo ML mientras que otras partes de la compañía determinan la estrategia y el diseño comercial, o en una empresa de cualquier tamaño que se enfoca en ML como su producto / Servicio.
A corto plazo, sí, es probable que pueda convencer a alguien para que lo tenga como pasante o asistente en algunos proyectos, pero su doctorado probablemente se verá como un inconveniente potencial si está hablando con pequeñas y medianas empresas que desean contratar a generalistas / tomas de todos los oficios ...
Lo que me lleva a esto. Puede elegir su propia aventura porque hay muchos tipos de roles, pero debe saber qué tipo de rol y situación está buscando cada posible empleador, y ser realista acerca de cómo podría encajar con él. Hay muchos empleadores que no expresan claramente lo que quieren o necesitan, o ni siquiera saben lo que es . Harías bien en averiguarlo con ellos para evitar una gran decepción.
Si desea ampliar sus horizontes en la ciencia de datos y asegurarse de tener el mayor impacto comercial y oportunidades de desarrollo profesional, le gustaría aprender mucho más sobre las aplicaciones comerciales de la ciencia de datos. Esas son muy diversas y más informales en la práctica y más impactantes para el negocio en general que preocuparse por las optimizaciones para matrices de pseudoinversión.
A pesar de las opiniones razonables en las otras respuestas publicadas sobre el mercado, hay un enorme déficit de mercado en mi opinión para los científicos de datos que:
fuente
Los trabajos de ciencia de datos cubren una amplia gama de actividades diferentes, por lo que es probable que cualquier respuesta sea subjetiva. Estoy en el mundo académico, por lo que mi conocimiento del mercado laboral es limitado, pero por lo que puedo ver:
fuente
Erwan lo clavó (+1). Pero creo que mi adición es demasiado larga para un comentario.
Parece que estás muy por delante de donde estaba cuando conseguí mi trabajo de DS. Estaba en matemática pura, un par de posdoctorados, y tenía poco tiempo de autoaprendizaje cuando estaba aplicando para la ciencia de datos de la industria.
Por otro lado, tuve exámenes actuariales en mi licenciatura, lo que probablemente me ayudó a ingresar al espacio fintech. Al aplicar, enfatice lo que ya sabe y reconozca lo que necesitará aprender en sus primeros meses (¿programación más fuerte? ¿Usando git? ...).
(Además, no mencionó modelos basados en árboles en su curso de ML: supongo que fue solo una omisión, pero esos parecen ser el modelo más importante para entender a menos que esté tratando de ingresar a industrias donde las redes neuronales son la norma)
fuente
Simplemente no tome este consejo a ciegas: los temas que ha mencionado en matemáticas son fundamentales para resolver problemas utilizando el aprendizaje automático / aprendizaje profundo, la programación es una herramienta para implementar toda esta teoría que aprende y sobre esa base crea sus hipótesis y luego pruebe implementándolo en código para que no necesite habilidades de codificación de un codificador, debe conocer las estructuras de datos de su uso, especialmente los marcos de datos y la manipulación del tensor y el descanso que aprenderá durante la implementación. La mejor parte con usted es que tiene el conocimiento fundamental de las matemáticas (supongo que conoce estadísticas de probabilidad, cálculo multivariado, análisis funcional y el resto de las materias que mencionó, no entraré en detalles ya que ya está haciendo un doctorado. .
Te sugiero que pases por todos los cursos de Fast.ai impartidos por Jeremy Howard (él es literalmente el dios del aprendizaje profundo). Su curso sobre aprendizaje profundo práctico para programadores está repleto de conocimientos, aparte de eso, para la comprensión central de las matemáticas detrás de las redes neuronales. puedes ir y leer un blog de Michael Nielsen llamado neuralnetworksanddeeplearning.com en realidad es un libro y uno excelente y te encantará la explicación matemática y para una mejor comprensión siempre puedes ir y leer en el blog de Chris olah es simplemente genial.
Así que ahora la cuestión es que todavía puedes obtener muchas pasantías de investigación e ir a aprender allí en un entorno industrial, pero prefiero sugerirte que te des un poco de tiempo para realizar estos cursos, obtener un control del asunto y con las matemáticas detrás de ti, Están listos para hacer cualquier cosa. Mira, la ciencia de datos en este momento es como si todos quisieran ser uno y solo obtener ese salario de 6 dígitos y terminar, pero no es que la ciencia de datos no sea algo que puedas aprender de una vez, lleva tiempo,
Por lo tanto, date un poco de tiempo, sé paciente y sigue resolviendo sigue leyendo publicaciones sobre los últimos temas que ahora están disponibles gratuitamente, así que sigue adelante.
fuente