¿Qué opinas de las certificaciones de Data Science?

35

Ahora he visto dos programas de certificación de ciencia de datos: el John Hopkins disponible en Coursera y el Cloudera .

Estoy seguro de que hay otros por ahí.

El conjunto de clases de John Hopkins se centra en R como un conjunto de herramientas, pero cubre una variedad de temas:

  • Programación R
  • limpieza y obtención de datos
  • Análisis de los datos
  • Investigación reproducible
  • Inferencia estadística
  • Modelos de regresión
  • Aprendizaje automático
  • Desarrollando productos de datos
  • Y lo que parece ser una tarea de finalización basada en un proyecto similar al Data Science Challenge de Cloudera

El programa Cloudera parece delgado en la superficie, pero busca responder las dos preguntas importantes: "¿Conoces las herramientas", "¿Puedes aplicar las herramientas en el mundo real?". Su programa consiste en:

  • Introducción a la ciencia de datos
  • Examen de ciencia de datos esenciales
  • Data Science Challenge (un escenario de proyecto de ciencia de datos del mundo real)

No estoy buscando una recomendación sobre un programa o una comparación de calidad.

Tengo curiosidad sobre otras certificaciones, los temas que cubren y la seriedad con la que la comunidad ve las certificaciones DS en este momento.

EDITAR: Estas son todas excelentes respuestas. Estoy eligiendo la respuesta correcta por votos.

Steve Kallestad
fuente
44
Esto es demasiado amplio y se basa principalmente en la opinión. Eche un vistazo a datascience.stackexchange.com/help/dont-ask
asheeshr
3
@AsheeshR: promediamos 2 preguntas por día y 2 respuestas por pregunta. En este punto, la atención debe centrarse en fomentar la participación y aumentar el interés.
Steve Kallestad
10
El compromiso a expensas de la calidad del sitio no es la solución. El compromiso es transitorio. La calidad es mucho más difícil de modificar más adelante.
asheeshr
44
Bicicletas , El lugar de trabajo , Finanzas personales y dinero , Escépticos , Desarrollo de juegos, todo lanzado con menos de 10 preguntas por día. Bicycles se lanzó con 4 por día porque se consideraba un sitio de alta calidad.
asheeshr
3
Bueno ... supongo que tengo que declararte el ganador en este momento. :)
Steve Kallestad

Respuestas:

13

Hice los primeros 2 cursos y planeo hacer todos los demás también. Si no conoce R, es un muy buen programa. Hay tareas y cuestionarios todas las semanas. Muchas personas encuentran algunos cursos muy difíciles. Tendrás dificultades si no tienes experiencia en programación (incluso si dicen que no es obligatorio).

Solo recuerda ... no es porque puedas conducir un automóvil que seas un piloto de F1;)

Patlaf
fuente
32

Como ex gerente de análisis y actual científico principal de datos, desconfío de la necesidad de certificados de ciencia de datos. El término científico de datos es bastante vago y el campo de la ciencia de datos está en su infancia. Un certificado implica algún tipo de estándar uniforme que simplemente falta en ciencia de datos, todavía es mucho el salvaje oeste.

Si bien es probable que un certificado no le haga daño, creo que su tiempo se gastaría mejor en desarrollar la experiencia para saber cuándo utilizar un determinado enfoque y una comprensión profunda para poder explicar ese enfoque a una audiencia no técnica.

neone4373
fuente
2
A veces, la experiencia es difícil de obtener si su trabajo actual no se centra en la ciencia de datos sino en algún campo relacionado (en mi caso, las estadísticas). Uso los cursos para obtener algunos conocimientos y mantenerme en el tema, lo que no puedo hacer en mi trabajo durante el día.
Christian Sauer
1
Estoy totalmente de acuerdo, los cursos son muy valiosos para darte un punto de partida y una estructura para ganar esa experiencia. Para aprovechar al máximo el Mooc, sugiero tomar un ejemplo muy específico, digamos regresión logística, y realmente trabajar con un conjunto de datos diferente, doble bonificación si lo hace en un idioma diferente al que se imparte el curso .
neone4373
Es una buena idea. Lo que falta para las estadísticas en general es un sitio web de capacitación. Por ejemplo, un conjunto de bases de datos, junto con objetivos y posibles resultados al final. Algo así como khancademy, pero más poderoso;)
Christian Sauer
11

Los programas de certificación que mencionó son realmente cursos de nivel básico. Personalmente, creo que estos certificados muestran la persistencia de las personas y solo pueden ser útiles para aquellos que solicitan pasantías, no para los trabajos reales de ciencia de datos.

Stanpol
fuente
Estoy de acuerdo. El material del curso es bueno para comenzar, pero es principalmente de nivel de entrada.
Shagun Sodhani
10

Dirijo equipos de ciencia de datos para una importante empresa de Internet y he seleccionado cientos de perfiles y entrevisté a docenas de nuestros equipos en todo el mundo. Muchos candidatos han aprobado los cursos y programas mencionados anteriormente o traen credenciales similares. Personalmente, también he tomado los cursos, algunos son buenos, otros son decepcionantes, pero ninguno de ellos te convierte en un "científico de datos".

En general, estoy de acuerdo con los demás aquí. Un certificado de Coursera o Cloudera solo indica un interés pero no mueve la aguja. Hay mucho más que considerar y puede tener un mayor impacto al proporcionar un repositorio completo de su trabajo (perfil de github, por ejemplo) y al establecer contactos con otros científicos de datos. Cualquier persona que contrate para un perfil de ciencia de datos siempre preferirá ver su trabajo anterior y su estilo / habilidades de codificación.

Rodrigo Rivera
fuente
8

Hay múltiples certificaciones en curso, pero tienen diferentes áreas de enfoque y estilo de enseñanza.

Prefiero The Analytics Edge en eDX mucho más que la especialización de John Hopkins, ya que es más intensivo y práctico. La expectativa en la especialización de John Hopkins es poner de 3 a 4 horas a la semana frente a 11 a 12 horas a la semana en Analytics Edge.

Desde la perspectiva de la industria, tomo estas certificaciones como una señal de interés y no como el nivel de conocimiento que posee una persona. Hay demasiados abandonos en estos MOOC. Valoro mucho más la experiencia (como participar en concursos de Kaggle) que la certificación XYZ en MOOC.

Kunal
fuente
2
Y qué hay de las estadísticas. SE, datascience. Perfiles de SE. ¿Crees que pueden decir mucho sobre el nivel de conocimiento relevante?
IharS
¿Qué tienen que ver los abandonos? Presumiblemente, la certificación depende de completar el curso, no solo de registrarse ...
Gala
Hay muchas personas que mencionan que están recibiendo la certificación al hacer un curso sobre estos MOOC. Tienes que tener cuidado con eso.
Kunal
@Kunal Tiene sentido, pero su respuesta salta de la "certificación" a los "abandonos" (que presumiblemente no tienen una certificación ). La clave aquí está sufriendo . Es un poco como estar registrado como estudiante o tener una cuenta de Kaggle. Nada de esto nos dice si debe valorar a alguien que realmente obtuvo un título, completar un curso o participar en una competencia hasta el final.
Gala
6

No estoy seguro acerca de la era de la nube, pero uno de mis amigos se unió al de John Hopkins y en sus palabras es "brillante para empezar". También ha sido recomendado por mucha gente. Estoy planeando unirme en unas pocas semanas. En cuanto a la seriedad, no creo que estas certificaciones te ayuden a conseguir un trabajo, pero seguro que te ayudarán a aprender.

Pensu
fuente
4

@OP: elegir las respuestas por votos es la PEOR idea.

Tu pregunta se convierte en un concurso de popularidad. Debe buscar la respuesta correcta, dudo que sepa lo que está preguntando, sepa lo que está buscando.

Para responder tu pregunta:
P: cuán seriamente la comunidad ve las certificaciones DS en este momento.

A: ¿Cuál es su objetivo al tomar estos cursos? ¿Para el trabajo, la escuela, la superación personal, etc.? Las clases de Coursera son muy aplicadas, no aprenderás mucha teoría, están reservadas intencionalmente para el aula.

No obstante, las clases de Coursera son muy útiles. Yo diría que es equivalente a un año de clase de graduación estadística, de un programa de maestría de dos años.

Todavía no estoy seguro de su reconocimiento en la industria, porque el problema de cómo realmente tomaste el curso. ¿Cuánto tiempo pasaste? Es mucho más fácil obtener A en estos cursos que un examen de papel y lápiz en el aula. Por lo tanto, hay una gran variación de calidad de persona a persona.

usuario13985
fuente
Parte de la pregunta tiene por objeto evaluar si la comunidad valoró o no la certificación. En algunas áreas, la certificación es una necesidad absoluta. En otros, la certificación no importa en absoluto. En otros, las certificaciones de una empresa en particular se tienen en alta estima y las certificaciones competitivas no. La otra parte estaba destinada a comprender la diferencia en el enfoque temático de las certificaciones que existen. Data Science es un término amplio. Las certificaciones son normalmente más enfocadas. Esta es una mala pregunta para el formato de control de calidad: es más una discusión, sujeta a opinión.
Steve Kallestad
Mi propósito al señalar que elegí la respuesta por votos fue dejar en claro que todas las respuestas merecían una lectura. Todo el mundo hace buenos puntos, incluido el camino hacia abajo en la parte inferior. Alguien que se esté preguntando acerca de estas cosas no debería limitarse a la una o dos respuestas principales.
Steve Kallestad
Votar para encontrar la respuesta correcta es una idea horrible. Es la forma incorrecta de abordar las matemáticas. Claramente perdiste mi punto.
user13985
2

Creo que el efecto de la certificación de Coursera depende tanto del individuo como de las clases. El requisito dice un mínimo de 3-5 horas a la semana, si pones más, y el material se abre por mucho más que las 3-5 horas, entonces estas clases y certificaciones pueden ser equivalentes a una sólida base de conocimientos y experiencia en el campo . La ciencia llega a quienes la solicitan.

Neveen
fuente
2

Ya casi termino con Johns Hopkins Data Science Specialization en Coursera (un curso y una piedra angular para graduarse). Solo te daré los pros y los contras, tratando de mantenerlo lo más objetivo posible:

Pros :

  • Estructura alrededor del proceso de aprendizaje.
  • Creará una cartera con el tiempo

Contras :

  • Diferentes orígenes necesarios para diferentes cursos. Los primeros cursos no asumen conocimientos previos. De repente no es fácil de entender en los cursos conceptuales. (Inferencia estadística, análisis de regresión)
  • Impartido por 3 profesores. Creo que no están en la misma página sobre su audiencia potencial y sus habilidades / necesidades / intereses.
pbahr
fuente
2

La mejor manera de tener éxito en conseguir el trabajo que desea que demuestre que puede hacerlo.

Los MOOC que mencionas te darán una buena base en lo básico y deberían ser suficientes para que comiences a resolver tus propios problemas de aprendizaje automático / ciencia de datos. Pruebe una o dos competencias de Kaggle, esa es una excelente manera de mejorar sus habilidades, y una calificación decente será de interés para un posible empleador. Publique sus resultados en Github usando algo como un iPython Notebook, que permitirá que su trabajo sea visto y juzgado fácilmente.

Pruebe un análisis en otros conjuntos de datos públicos, como el conjunto de datos UCI Bike Sharing , o el conjunto de datos UCI Diabetes Treatment que son muy divertidos de probar, y demuestre que está interesado y dispuesto a desarrollar sus habilidades.

DrMcCleod
fuente
2

Realmente depende de la credibilidad de la institución que otorga el certificado. Por ejemplo, la certificación de Data Science de una empresa con sede en Harvard es reconocida por muchos socios de la industria y puede ser una buena elección. ¿No dijo qué tipo de certificado está buscando?

Sumeet Nijjar
fuente
1

Valor para el estudiante, bolsa mixta. Pagar varios cientos de dólares por un programa o cien pop por un curso es un motivador.

He completado una serie, de MITx. Es un curso de encuesta de posgrado de métodos y herramientas dirigido a aquellos que necesitan "conocer" con cierto detalle. Es suficiente la base, que me he sentido cómodo aplicando lo que he aprendido.

Un curso independiente de HarvardX sobre el método de gráfico acíclico dirigido se parecía más a un seminario de posgrado en estadística sobre el método de Judea Pearl. Hubiera pasado mucho tiempo antes de que me enteré de lo contrario.

La serie HarvardX es un campo de entrenamiento de nivel de posgrado destinado a orientar al nuevo estudiante al conjunto de herramientas y aplicaciones de R.

La serie BerkeleyX es un curso de encuesta de pregrado que utiliza una clase Python especialmente diseñada que es casi un lenguaje específico de dominio.

En cuanto al valor de los certificados, solo puedo informar que mi única experiencia educativa relacionada fue una maestría en geofísica, y tuve aproximadamente un año de experiencia remunerada fuera de mi descripción de trabajo (abogado bancario sénior).

Tal vez como resultado de los certificados, he sido rechazado como "sobrecalificado" por al menos dos trabajos que conozco. Por lo tanto, mi consejo es que si tiene un certificado no lo mencione si aparece la palabra "Excel" en la publicación de trabajo.

Richard Careaga
fuente
1

Algunos recursos en edX para cursos de ciencia de datos de Harvard, MIT, Microsoft y más que podrían ser de interés para este grupo.

Por ejemplo, tenemos un programa de certificación profesional de Harvard que consta de 8 cursos y un examen final aquí. .

Para estudios más avanzados, tenemos un programa MicroMasters del MIT aquí .

así como uno de UC San Diego aquí . Para una excelente visión general de Data Science, tenemos un programa de Microsoft. Para todos nuestros programas, puedes consultar aquí .

Espero que esto ayude,

Josh de edX

Josh Grossman
fuente