Ahora he visto dos programas de certificación de ciencia de datos: el John Hopkins disponible en Coursera y el Cloudera .
Estoy seguro de que hay otros por ahí.
El conjunto de clases de John Hopkins se centra en R como un conjunto de herramientas, pero cubre una variedad de temas:
- Programación R
- limpieza y obtención de datos
- Análisis de los datos
- Investigación reproducible
- Inferencia estadística
- Modelos de regresión
- Aprendizaje automático
- Desarrollando productos de datos
- Y lo que parece ser una tarea de finalización basada en un proyecto similar al Data Science Challenge de Cloudera
El programa Cloudera parece delgado en la superficie, pero busca responder las dos preguntas importantes: "¿Conoces las herramientas", "¿Puedes aplicar las herramientas en el mundo real?". Su programa consiste en:
- Introducción a la ciencia de datos
- Examen de ciencia de datos esenciales
- Data Science Challenge (un escenario de proyecto de ciencia de datos del mundo real)
No estoy buscando una recomendación sobre un programa o una comparación de calidad.
Tengo curiosidad sobre otras certificaciones, los temas que cubren y la seriedad con la que la comunidad ve las certificaciones DS en este momento.
EDITAR: Estas son todas excelentes respuestas. Estoy eligiendo la respuesta correcta por votos.
Respuestas:
Hice los primeros 2 cursos y planeo hacer todos los demás también. Si no conoce R, es un muy buen programa. Hay tareas y cuestionarios todas las semanas. Muchas personas encuentran algunos cursos muy difíciles. Tendrás dificultades si no tienes experiencia en programación (incluso si dicen que no es obligatorio).
Solo recuerda ... no es porque puedas conducir un automóvil que seas un piloto de F1;)
fuente
Como ex gerente de análisis y actual científico principal de datos, desconfío de la necesidad de certificados de ciencia de datos. El término científico de datos es bastante vago y el campo de la ciencia de datos está en su infancia. Un certificado implica algún tipo de estándar uniforme que simplemente falta en ciencia de datos, todavía es mucho el salvaje oeste.
Si bien es probable que un certificado no le haga daño, creo que su tiempo se gastaría mejor en desarrollar la experiencia para saber cuándo utilizar un determinado enfoque y una comprensión profunda para poder explicar ese enfoque a una audiencia no técnica.
fuente
Los programas de certificación que mencionó son realmente cursos de nivel básico. Personalmente, creo que estos certificados muestran la persistencia de las personas y solo pueden ser útiles para aquellos que solicitan pasantías, no para los trabajos reales de ciencia de datos.
fuente
Dirijo equipos de ciencia de datos para una importante empresa de Internet y he seleccionado cientos de perfiles y entrevisté a docenas de nuestros equipos en todo el mundo. Muchos candidatos han aprobado los cursos y programas mencionados anteriormente o traen credenciales similares. Personalmente, también he tomado los cursos, algunos son buenos, otros son decepcionantes, pero ninguno de ellos te convierte en un "científico de datos".
En general, estoy de acuerdo con los demás aquí. Un certificado de Coursera o Cloudera solo indica un interés pero no mueve la aguja. Hay mucho más que considerar y puede tener un mayor impacto al proporcionar un repositorio completo de su trabajo (perfil de github, por ejemplo) y al establecer contactos con otros científicos de datos. Cualquier persona que contrate para un perfil de ciencia de datos siempre preferirá ver su trabajo anterior y su estilo / habilidades de codificación.
fuente
Hay múltiples certificaciones en curso, pero tienen diferentes áreas de enfoque y estilo de enseñanza.
Prefiero The Analytics Edge en eDX mucho más que la especialización de John Hopkins, ya que es más intensivo y práctico. La expectativa en la especialización de John Hopkins es poner de 3 a 4 horas a la semana frente a 11 a 12 horas a la semana en Analytics Edge.
Desde la perspectiva de la industria, tomo estas certificaciones como una señal de interés y no como el nivel de conocimiento que posee una persona. Hay demasiados abandonos en estos MOOC. Valoro mucho más la experiencia (como participar en concursos de Kaggle) que la certificación XYZ en MOOC.
fuente
No estoy seguro acerca de la era de la nube, pero uno de mis amigos se unió al de John Hopkins y en sus palabras es "brillante para empezar". También ha sido recomendado por mucha gente. Estoy planeando unirme en unas pocas semanas. En cuanto a la seriedad, no creo que estas certificaciones te ayuden a conseguir un trabajo, pero seguro que te ayudarán a aprender.
fuente
@OP: elegir las respuestas por votos es la PEOR idea.
Tu pregunta se convierte en un concurso de popularidad. Debe buscar la respuesta correcta, dudo que sepa lo que está preguntando, sepa lo que está buscando.
Para responder tu pregunta:
P: cuán seriamente la comunidad ve las certificaciones DS en este momento.
A: ¿Cuál es su objetivo al tomar estos cursos? ¿Para el trabajo, la escuela, la superación personal, etc.? Las clases de Coursera son muy aplicadas, no aprenderás mucha teoría, están reservadas intencionalmente para el aula.
No obstante, las clases de Coursera son muy útiles. Yo diría que es equivalente a un año de clase de graduación estadística, de un programa de maestría de dos años.
Todavía no estoy seguro de su reconocimiento en la industria, porque el problema de cómo realmente tomaste el curso. ¿Cuánto tiempo pasaste? Es mucho más fácil obtener A en estos cursos que un examen de papel y lápiz en el aula. Por lo tanto, hay una gran variación de calidad de persona a persona.
fuente
Creo que el efecto de la certificación de Coursera depende tanto del individuo como de las clases. El requisito dice un mínimo de 3-5 horas a la semana, si pones más, y el material se abre por mucho más que las 3-5 horas, entonces estas clases y certificaciones pueden ser equivalentes a una sólida base de conocimientos y experiencia en el campo . La ciencia llega a quienes la solicitan.
fuente
Ya casi termino con Johns Hopkins Data Science Specialization en Coursera (un curso y una piedra angular para graduarse). Solo te daré los pros y los contras, tratando de mantenerlo lo más objetivo posible:
Pros :
Contras :
fuente
La mejor manera de tener éxito en conseguir el trabajo que desea que demuestre que puede hacerlo.
Los MOOC que mencionas te darán una buena base en lo básico y deberían ser suficientes para que comiences a resolver tus propios problemas de aprendizaje automático / ciencia de datos. Pruebe una o dos competencias de Kaggle, esa es una excelente manera de mejorar sus habilidades, y una calificación decente será de interés para un posible empleador. Publique sus resultados en Github usando algo como un iPython Notebook, que permitirá que su trabajo sea visto y juzgado fácilmente.
Pruebe un análisis en otros conjuntos de datos públicos, como el conjunto de datos UCI Bike Sharing , o el conjunto de datos UCI Diabetes Treatment que son muy divertidos de probar, y demuestre que está interesado y dispuesto a desarrollar sus habilidades.
fuente
Realmente depende de la credibilidad de la institución que otorga el certificado. Por ejemplo, la certificación de Data Science de una empresa con sede en Harvard es reconocida por muchos socios de la industria y puede ser una buena elección. ¿No dijo qué tipo de certificado está buscando?
fuente
Valor para el estudiante, bolsa mixta. Pagar varios cientos de dólares por un programa o cien pop por un curso es un motivador.
He completado una serie, de MITx. Es un curso de encuesta de posgrado de métodos y herramientas dirigido a aquellos que necesitan "conocer" con cierto detalle. Es suficiente la base, que me he sentido cómodo aplicando lo que he aprendido.
Un curso independiente de HarvardX sobre el método de gráfico acíclico dirigido se parecía más a un seminario de posgrado en estadística sobre el método de Judea Pearl. Hubiera pasado mucho tiempo antes de que me enteré de lo contrario.
La serie HarvardX es un campo de entrenamiento de nivel de posgrado destinado a orientar al nuevo estudiante al conjunto de herramientas y aplicaciones de R.
La serie BerkeleyX es un curso de encuesta de pregrado que utiliza una clase Python especialmente diseñada que es casi un lenguaje específico de dominio.
En cuanto al valor de los certificados, solo puedo informar que mi única experiencia educativa relacionada fue una maestría en geofísica, y tuve aproximadamente un año de experiencia remunerada fuera de mi descripción de trabajo (abogado bancario sénior).
Tal vez como resultado de los certificados, he sido rechazado como "sobrecalificado" por al menos dos trabajos que conozco. Por lo tanto, mi consejo es que si tiene un certificado no lo mencione si aparece la palabra "Excel" en la publicación de trabajo.
fuente
Algunos recursos en edX para cursos de ciencia de datos de Harvard, MIT, Microsoft y más que podrían ser de interés para este grupo.
Por ejemplo, tenemos un programa de certificación profesional de Harvard que consta de 8 cursos y un examen final aquí. .
Para estudios más avanzados, tenemos un programa MicroMasters del MIT aquí .
así como uno de UC San Diego aquí . Para una excelente visión general de Data Science, tenemos un programa de Microsoft. Para todos nuestros programas, puedes consultar aquí .
Espero que esto ayude,
Josh de edX
fuente