¿Hay un buen navegador / visor para ver un conjunto de datos R (archivo .rda)

38

Quiero buscar un archivo .rda (conjunto de datos R). Sé sobre el View(datasetname)comando. El R.app predeterminado que viene para Mac no tiene un navegador de datos muy bueno (abre una ventana en X11). Me gusta el navegador de datos RStudio que se abre con el Viewcomando. Sin embargo, muestra solo 1000 filas y omite el resto. ( ACTUALIZACIÓN: RStudio viewer ahora muestra todas las filas ) ¿Hay un buen navegador que muestre todas las filas en el conjunto de datos y que le guste / use?

Curious2learn
fuente

Respuestas:

22

Aquí hay algunas opciones básicas, pero como usted, no puedo decir que estoy completamente satisfecho con mi sistema actual.

Evita usar el visor :

  • Es decir, use las herramientas de línea de comandos para explorar los datos.
  • heady tailpara mostrar las filas iniciales y finales
  • str para una visión general de los tipos de variables
  • dplyr::glimpse()para una visión general de los tipos de variables de todas las columnas
  • herramientas básicas de extracción como [,1:5]mostrar las primeras cinco columnas
  • Use un buscapersonas para mostrar y navegar por los datos (por ejemplo, page(foo, "print")) posiblemente junto con algunas herramientas de extracción variable. Esto funciona bastante bien en Linux, que utiliza less. No estoy seguro de cómo funciona Windows o Mac.

Exportar a software de hoja de cálculo :

Jeromy Anglim
fuente
(+1) con mayor frecuencia también exporto a hojas de cálculo, algunas veces edit(your_data_object)también es útil, aunque no estoy seguro de las limitaciones en filas y columnas para esta función.
Dmitrij Celov
3
(+1) también. El Navegador de datos en Stata no es perfecto, pero es una de las razones por las que lanzo Stata en lugar de R (Studio) en muchas circunstancias.
p.
1
En re: su segundo punto, RExcel supuestamente hace que los datos de transferencia entre R y Excel sean más fluidos, aunque solo está disponible en Windows. No lo he probado (no estoy en Windows); Básicamente estoy contento con write.csv :)
JMS
@Jeromy Pager funciona bien en Mac.
chl
2
@ Curious2learn: ¿vas a mirar en serio 700 Mb de datos manualmente? La mayoría de las opciones dadas por Jeromy ( head, tail, stretc.) debería ser suficiente. Si quieres una visión "más grande" de sus datos ... Parcela que ( plot, qqplot, histetc.)
nico
26

Recomiendo encarecidamente el paquete R googleVis , enlaces R a la API de visualización de Google . Los autores del paquete son Markus Gesmann y Diego de Castillo.

El visor de marcos de datos en googleVis es asombrosamente fácil de usar.

Estos chicos han hecho un gran trabajo porque googleVis es fácil de usar, aunque la API de visualización de Google no lo es.

googleVis está disponible en CRAN .

La función en googleVis para representar un marco de datos como una tabla HTML con estilo es gvisTable () .

Al llamar a esta función, pasar un marco de datos R representa los marcos de datos R como tablas HTML interactivas en una forma que es a la vez de calidad de tablero y funcional.

Algunas características de googleVis / gvisTable me han parecido particularmente buenas:

  • para mantener la capacidad de respuesta a medida que aumenta el número de filas, valores de parámetros especificados por el usuario para la paginación (usando botones de flecha); si no desea paginación, puede acceder a las filas fuera de la vista a través de una barra de desplazamiento en el lado derecho de la tabla, de acuerdo con los parámetros especificados en la llamada a la función gvisTable ()

  • En cuanto a la columna especie haciendo clic en el encabezado de la columna

  • la llamada a gvisTable devuelve HTML, por lo que es portátil, y aunque no he usado esta función, toda la tabla se puede diseñar de la misma forma que cualquier tabla HTML, con CSS (primero asignando clases al selector correspondiente)

Para usar, simplemente importe el paquete googleVis , llame a gvisTable () pasando su marco de datos y vincule ese resultado (que es un objeto gvis ) a una variable; luego llame a plot en esa instancia de gvis :

library(googleVis)

gvt = gvisTable(DF)

plot(gvt)

También puede pasar una serie de parámetros, aunque lo hace a través de un único argumento a gvisTable, options , que es una lista R, por ejemplo,

gvt = gvisTable(DF, options=list(page='enable', height=300))

Por supuesto, puede usar su propio CSS para obtener cualquier estilo fino que desee.

Cuando se llama a plot en un objeto gvis, se abrirá una ventana del navegador y la tabla se cargará usando Flash

:

Doug
fuente
3
Esto no parece funcionar tan bien para conjuntos de datos moderados a grandes.
Zach
13

RStudio (RStudio.org) tiene un visor de marco de datos incorporado que es bastante bueno. Afortunadamente es de solo lectura. RStudio es muy fácil de instalar una vez que haya instalado una versión reciente de R. Si utiliza Linux, primero instale el paquete r-base.

Frank Harrell
fuente
2
Sí, me gusta el visor en RStudio. Sin embargo, como dije en mi publicación, muestra solo las primeras 1000 filas. ¿Puedo aumentar esto cambiando alguna configuración? Intenté cambiar max.print, pero eso no afectó al visor de datos.
Curious2learn
@ Curious2learm: debe pedirles que agreguen esta opción en la próxima versión de RStudio en support.rstudio.org/help/discussions/suggestions Por lo general, responden dentro de 2 días
RockScience
12

Aquí hay algunos otros pensamientos (aunque siempre soy reacio a dejar Emacs):

  • El deductor (con JGR ) permite ver un marco de datos con una vista combinada de datos / variables (a la SPSS).
  • Rcmdr de J Fox también ofrece funciones de edición / visualización, aunque en un entorno X11.
  • Poor Man Gui ( pmg ) de J Verzani solo permite una vista previa rápida de data.frame y otros objetos R. No sé mucho sobre las capacidades de sonajero .

A continuación se muestran dos capturas de pantalla cuando se visualiza un marco de datos 704 por 348 (cargado como RData) con Deducer (arriba) y Rcmdr (abajo).

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

chl
fuente
9

Usted puede llegar View()a mostrar todos sus datos en RStudio. El truco es que necesita usar la sintaxis del comando en su utils::View()lugar. (Para obtener un poco más de información, consulte mi respuesta sobre Desbordamiento de pila aquí: R View () no muestra todas las columnas del marco de datos ).

gung
fuente
Escribí una función simple usando la función utils :: View () que también me muestra los números de columna y la puse en el [archivo Rprofile.site] ( statmethods.net/interface/customizing.html ) para que la función se cargue en R inicio. La mejor parte es que los números de fila y los nombres de columna siempre están visibles. Aquí está el código para la función:view <- function(x){ numberColumns <- ncol(x) numbers <- seq(1, numberColumns) names <- names(x) names(x) <- paste0(numbers, "_", names) utils::View(x) }
elevendollar
3

Recientemente comencé a mantener los datos en una base de datos sqlite, acceder a la base de datos directamente desde R usando sqldf y ver / editar con una herramienta de base de datos llamada tksqlite

Otra opción es exportar los datos y ver / editar con Google Refine

Karsten W.
fuente
Gracias por la información. Descubriré cómo exportar los datos a Google Refine y veré si eso funciona bien.
Curious2learn
1
Otra herramienta muy útil para ver o editar datos en bases de datos sqlite es sqlitebrowser.org
Dominic Comtois
0

La datatablefunción del DTpaquete crea tablas HTML. Puedes ver muy bien las mesas anchas.

Edgar Santos
fuente