Preguntas etiquetadas con dplyr

Utilice esta etiqueta para preguntas relacionadas con funciones del paquete dplyr, como group_by, summary, filter y select.

192
Mostrar / imprimir todas las filas de un tibble (tbl_df)

tibble(anteriormente tbl_df) es una versión de una trama de datos creada por el dplyrpaquete de manipulación de trama de datos en R. Evita salidas de tabla largas cuando se llama accidentalmente a la trama de datos. Una vez que un marco de datos ha sido envuelto por tibble/ tbl_df, ¿hay un comando...

188
Filtrar filas que contienen una cadena determinada

Tengo que filtrar un marco de datos utilizando como criterio aquellas filas en las que está contenida la cadena RTB. Estoy usando dplyr. d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>% arrange(desc(MonthDelivery)) Sé que puedo...

175
Extraer una columna dplyr tbl como vector

¿Hay una manera más sucinta de obtener una columna de un dplyr tbl como vector, a partir de un tbl con el back-end de la base de datos (es decir, el marco / tabla de datos no puede ser subconjunto directamente)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db,...

171
Arreglando una "columna desconocida" de advertencia múltiple

Tengo una advertencia múltiple persistente de "columna desconocida" para todos los tipos de comandos (por ejemplo, str (x) para instalar actualizaciones en paquetes), y no estoy seguro de cómo depurar esto o solucionarlo. La "columna desconocida" de advertencia está claramente relacionada con una...

168
Utilice nombres de variables dinámicas en `dplyr`

Quiero usar dplyr::mutate()para crear múltiples columnas nuevas en un marco de datos. Los nombres de columna y sus contenidos deben generarse dinámicamente. Datos de ejemplo de iris: library(dplyr) iris <- tbl_df(iris) He creado una función para mutar mis nuevas columnas de la...

153
Frecuencias / proporciones relativas con dplyr

Supongamos que quiero calcular la proporción de diferentes valores dentro de cada grupo. Por ejemplo, usando los mtcarsdatos, ¿cómo calculo la frecuencia relativa del número de engranajes por am (automático / manual) de una vez dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) #...

137
Seleccione la primera y la última fila de los datos agrupados

Pregunta Utilizando dplyr, ¿cómo selecciono las observaciones / filas superiores e inferiores de datos agrupados en una declaración? Datos y ejemplo Dado un marco de datos df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"),

128
Eliminar filas duplicadas con dplyr

Tengo un data.frame como este: set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 10 0 1 10 Me gustaría eliminar filas duplicadas basadas en las dos primeras columnas....

121
¿Aplicando una función a cada fila de una tabla usando dplyr?

Cuando trabajaba, a plyrmenudo me resultaba útil usar adplypara funciones escalares que tenía que aplicar a todas y cada una de las filas. p.ej data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width...

118
Reemplazo de "renombrar" en dplyr

Me gusta la función de cambio de nombre de plyr rename. Recientemente comencé a usar dplyr y me preguntaba si hay una manera fácil de cambiar el nombre de las variables usando una función de dplyr, que sea tan fácil de usar como la de plyr

111
¿Puede dplyr unirse en varias columnas o clave compuesta?

Me doy cuenta de que la dplyrv3.0 te permite unirte a diferentes variables: left_join(x, y, by = c("a" = "b")coincidirá x.acony.b Sin embargo, ¿es posible unir una combinación de variables o tengo que agregar una clave compuesta de antemano? Algo como esto: left_join(x, y, by = c("a c" = "b...

108
Reúna varios conjuntos de columnas

Tengo datos de una encuesta en línea donde los encuestados realizan un ciclo de preguntas de 1 a 3 veces. El software de la encuesta (Qualtrics) registra estos datos en varias columnas, es decir, Q3.2 en la encuesta tendrá columnas Q3.2.1., Q3.2.2.y Q3.2.3.: df <- data.frame( id = 1:10, time...

98
Suma en varias columnas con dplyr

Mi pregunta implica sumar valores en múltiples columnas de un marco de datos y crear una nueva columna correspondiente a esta suma usando dplyr. Las entradas de datos en las columnas son binarias (0,1). Estoy pensando en un análogo de fila de la función summarise_eacho mutate_eachde dplyr. A...