¿A quién seguir en github para aprender sobre las mejores prácticas en el análisis de datos?

28

Es útil estudiar el código de análisis de datos de expertos. Recientemente he estado examinando github y hay varias personas que comparten código de análisis de datos allí. Esto incluye algunos paquetes R (que por supuesto están disponibles directamente de CRAN), pero también varios ejemplos de investigación reproducible, particularmente usando R ( ver esta lista R en github ).

  • ¿Quiénes son buenas personas para seguir en github para aprender sobre las mejores prácticas en análisis de datos?
  • Opcionalmente, ¿qué tipo de código comparten y por qué es útil?
Jeromy Anglim
fuente

Respuestas:

18

Hadley Wickham . Tiene varios proyectos de análisis de datos exploratorios en Github que puede ver (por ejemplo, "nombres de datos de bebé"), y dada la genialidad de ggplot2 / plyr / reshape, tengo una confianza predeterminada (pero ciertamente ciega) en su mejor prácticas, particularmente con respecto a sus propios paquetes.

¡Además, te enteras pronto de otros proyectos en los que está trabajando!

raegtin
fuente
55
(+1) También está trabajando en un conjunto de tutoriales sobre desarrollo Advanced R , ¡muy útil!
chl
@ Jeromy De hecho, parece que esta es simplemente una forma de redactar su futuro libro de texto (consulte los tweets anteriores de HW).
chl
9

También sigo el repositorio GitHub de John Myles White . Hay varios proyectos orientados a datos, pero también cosas interesantes para los desarrolladores de R:

  • ProjectTemplate , un sistema de plantillas para construir un proyecto R;
  • log4r , un sistema de registro.
chl
fuente