Preguntas etiquetadas con dataframe

366
Extraer columnas específicas de un marco de datos

Tengo un marco de datos R con 6 columnas, y quiero crear un nuevo marco de datos que solo tenga tres de las columnas. Suponiendo mi trama de datos es df, y quiero columnas de extracto A, By E, este es el único comando que puedo averiguar: data.frame(df$A,df$B,df$E) ¿Hay una forma más compacta...

357
Cómo sumar una variable por grupo

Tengo un marco de datos con dos columnas. La primera columna contiene categorías como "Primero", "Segundo", "Tercero", y la segunda columna tiene números que representan la cantidad de veces que vi los grupos específicos de "Categoría". Por ejemplo: Category Frequency First 10 First 15 First...

352
Convierta columnas data.frame de factores a caracteres

Tengo un marco de datos. Vamos a llamarlo bob: > head(bob) phenotype exclusion GSM399350 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399351 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399352 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399353 3- 4- 8- 25+ 44+ 11b-...

336
Convierta una lista de marcos de datos en un marco de datos

Tengo un código que en un lugar termina con una lista de marcos de datos que realmente quiero convertir en un solo marco de datos grandes. Recibí algunos consejos de una pregunta anterior que intentaba hacer algo similar pero más complejo. Aquí hay un ejemplo de lo que estoy comenzando (esto se...

325
Pandas: cómo aplanar un índice jerárquico en columnas

Tengo un marco de datos con un índice jerárquico en el eje 1 (columnas) (de una groupby.aggoperación): USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum amax amin 0 702730 26451 1993 1 1 1 0 12 13 30.92 24.98 1 702730 26451 1993 1 2 0 0 13 13 32.00 24.98 2 702730 26451 1993 1...

320
Pandas read_csv low_memory y dtype opciones

Cuando llame df = pd.read_csv('somefile.csv') Yo obtengo: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Las columnas (4,5,7,16) tienen tipos mixtos. Especifique la opción dtype al importar o establezca low_memory = False. ¿Por qué está...

317
Cómo almacenar un marco de datos usando Pandas

En este momento estoy importando un CSVmarco de datos bastante grande cada vez que ejecuto el script. ¿Existe una buena solución para mantener ese marco de datos constantemente disponible entre ejecuciones para que no tenga que pasar todo el tiempo esperando que se ejecute el