¿Qué paquetes de R te parecen más útiles en tu trabajo diario?

28

Subproceso duplicado: acabo de instalar la última versión de R. ¿Qué paquetes debo obtener?

¿Cuáles son los paquetes R que no podrías imaginar en tu trabajo diario con datos? Enumere las herramientas generales y específicas.

ACTUALIZACIÓN: En cuanto a 24.10.10 ggplot2parece ser el ganador con 7 votos.

Otros paquetes mencionados más de uno son:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

¡Gracias a todos por sus respuestas!

radek
fuente
1
Pregunta muy subjetiva: esta pregunta no se puede responder y no es adecuada para un sitio de control de calidad.
Egon Willighagen
3
Probablemente debería ser wiki comunitario; pregunta útil aquí pero no tiene una respuesta definitiva.
Shane
2
@ Shane: buen punto. movido. @ Egon: subjetivo de hecho. pero si las respuestas provienen de personas conocedoras, no me importa la dosis de subjetividad. Empecé a aprender R recientemente y tengo un par de docenas instaladas para explorar, sin embargo, me doy cuenta de que hay herramientas que uso con mucha más frecuencia, independientemente de la tarea en cuestión.
radek
Sería interesante si StackExchange pudiera admitir algún método para vincular publicaciones wiki de la comunidad en todos los sitios. Porque apuesto a que esta pregunta se ha hecho en Stackoverflow y también creo que el análisis estadístico puede atraer a algunas personas que generalmente no visitarían SO.
Sharpie
@Sharpie: ha habido varias publicaciones SO interesantes como stackoverflow.com/questions/1295955/… o stackoverflow.com/questions/1535021/…, sin embargo, no están enfocadas en paquetes. y estoy de acuerdo, el enlace del wiki de la comunidad podría ser realmente útil.
radek

Respuestas:

23

Yo uso plyr y ggplot2 más a diario.

También confío mucho en los paquetes de series temporales; más especialmente, el paquete zoológico .

Shane
fuente
8

Yo uso el paquete xtable . El paquete xtable convierte las tablas producidas por R (en particular, las tablas que muestran los resultados de anova) en tablas LaTeX, para ser incluidas en un artículo.

Mehper C. Palavuzlar
fuente
8

multinúcleo es bastante bueno para la herramienta para hacer scripts más rápidos más rápido.
cacheSweave ahorra mucho tiempo cuando se usa Sweave.

usuario88
fuente
8

ggplot2 : sin duda , la mejor visualización para R.

RMySQL / RSQLite / RODBC - para conectarse a una base de datos

sqldf : manipula data.frames con consultas SQL

Hmisc / rms : paquetes de Frank Harrell que contienen funciones misceláneas convenientes y buenas funciones para análisis de regresión.

GenABEL - paquete agradable para estudios de asociación de genoma completo

Rcmdr : una GUI decente para R si la necesitas.

Consulte también CRANtastic: este enlace tiene una lista de los paquetes R más populares. Muchos de los primeros en la lista ya han sido mencionados

Stephen Turner
fuente
8

¡data.table es mi favorito ahora! Esperamos con ansias la nueva versión con la lista de deseos más implementada.

Branson
fuente
6

Para mí personalmente, utilizo la mayoría de los siguientes tres paquetes, todos disponibles en el increíble Proyecto Omega para Computación Estadística (no pretendo ser un experto, pero para mis propósitos son muy fáciles de usar):

  • RCurl : Tiene muchas opciones que permiten el acceso a sitios web con los que las funciones predeterminadas en la base R tendrían dificultades, creo que es justo decirlo. Es una interfaz R para la biblioteca libcurl, que tiene el beneficio adicional de que toda una comunidad fuera de R la desarrolla. También disponible en CRAN .

  • XML : es muy indulgente de analizar XML / HTML con formato incorrecto. Es una interfaz R para la biblioteca libxml2 y nuevamente tiene el beneficio adicional de que toda una comunidad fuera de R la desarrolla. También está disponible en CRAN .

  • RJSONIO : permite analizar el texto devuelto por una llamada json y organizarlo en una estructura de lista para su posterior análisis. El competidor de este paquete es rjson pero este tiene la ventaja de ser vectorizado, fácilmente extensible a través de S3 / S4, rápido y escalable a datos grandes.
Tony Breyal
fuente
6

Sweave le permite incrustar código R en un documento LaTeX. Los resultados de ejecutar el código, y opcionalmente el código fuente, se convierten en parte del documento final.

Entonces, en lugar de pegar una imagen producida por R en un archivo LaTeX, puede pegar el código R en el archivo y mantener todo en un solo lugar.

John D. Cook
fuente
44
Solo una pista para todos aquellos que desean comenzar una investigación reproducible con R. Les recomendaría que echen un vistazo al paquete más nuevo en knitrlugar de Sweave. Básicamente es Sweave con esteroides. Es tan fácil, si no más fácil, aprender y mucho más flexible.
Christoph_J
4

¡Zoo y xts son imprescindibles en mi trabajo!

Dr. G
fuente
4

Encuentro celosía junto con el libro complementario "Celosía: visualización de datos multivariados con R" de Deepayan Sarkar invaluable.

NPE
fuente
4

Si está haciendo algún tipo de modelado predictivo, caret es un regalo del cielo. Especialmente combinado con el paquete multinúcleo , son posibles algunas cosas bastante sorprendentes.

Zach
fuente
4

Día a día, el paquete más útil debe ser "extranjero", que tiene funciones para leer y escribir datos para otros paquetes estadísticos, por ejemplo, Stata, SPSS, Minitab, SAS, etc. Trabajar en un campo donde R no es tan común significa que esto Es un paquete muy importante.

Graham Cookson
fuente
3

yo suelo

car, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, rehape, RODBC, TeachingDemos, XML.

mucho.

esco
fuente
3

No podría vivir sin:

  • celosía para gráficos
  • xlsx o XLConnect para leer archivos de Excel
  • rtf para crear informes en formato rtf (preferiría Sword o R2wd pero no puedo instalar statconn en el trabajo; seguramente intentaré odfWeave pronto).
  • nlme y lme4 para modelos mixtos
  • ff para trabajar con matrices grandes
Stéphane Laurent
fuente
2

RODBC para acceder a datos de bases de datos, sqldf para realizar consultas SQL simples en marcos de datos (aunque me estoy obligando a usar comandos R nativos), y ggplot2 y plyr

wahalulu
fuente
2

Trabajo con R y MATLAB y uso mucho R.matlab para transferir datos entre los dos.

Peter Mortensen
fuente
2

Usamos principalmente:

  • ggplot - para gráficos
  • estadísticas
  • e1071 - para SVM
mohans
fuente
También puede consultar kernlab y buscar SVM. Son alternativas interesantes (no necesariamente mejores).
Zach
2

celosía, automóvil, MASA, extranjera, fiesta.

Peter Flom - Restablece a Monica
fuente
2

Para mí, estoy usando kernlab para el laboratorio de aprendizaje automático basado en kernel y e1071 para SVM y ggplot2 para gráficos

404Dreamer_ML
fuente
2

Yo uso ggplot2, vegano y remodelar con bastante frecuencia.

EDi
fuente
2

Me gusta roxygen por su función Curry ().

charles.y.zheng
fuente
2

RColorBrewer no se ha mencionado aquí, lo uso a menudo para trazar si necesito esquemas de color

Arne Jonas Warnke
fuente
2

Soy un gran admirador de RCPP cuando necesito un bucle rápido o para realizar tratamientos que no cumplen con R. Está muy bien implementado en el sistema R eco, puede recibir Matrix / Matrix dispersa sin conversión como argumentos en una función.

La sintaxis de C ++ es fácil cuando haces cosas simples (que a menudo es mi caso).

Realmente, no necesitas ser un creador de paquetes para necesitar esta increíble lib.

¿Dije que C ++ es muy rápido?

pommedeterresautee
fuente
2

¡Los paquetes doParallel y foreach me han hecho la vida mucho más fácil al permitirme paralelizar mi código y ejecutarlo en una instancia de cómputo optimizado en Amazon EC2 ! Los uso muy a menudo. Pero eso no hubiera sido posible sin las AMI RStudio lanzadas por Louis Aslett. Finalmente, tengo que mencionar el paquete stringr que realmente hace que trabajar con cuerdas sea un paseo por el parque. Úselo en todas las aplicaciones de minería de texto. Y también utilizo knitr con mucha frecuencia para producir informes de alta calidad de mi trabajo. Muchas gracias por este increíble paquete Yihui Xie!

Antoine
fuente
1

Utilizo ggplot2, rehape, lattice, knitr con más frecuencia.

Jdbaba
fuente