Preguntas etiquetadas con pandas

365
Pandas Merging 101

¿Cómo realizar una unión ( LEFT| RIGHT| FULL) ( INNER| OUTER) con pandas? ¿Cómo agrego NaNs para las filas que faltan después de la fusión? ¿Cómo me deshago de NaNs después de la fusión? ¿Puedo fusionarme en el índice? Cruz unirse con pandas? ¿Cómo fusiono múltiples DataFrames? merge? join?...

358
Cómo pivotar un marco de datos

¿Qué es el pivote? ¿Cómo giro? ¿Es esto un pivote? Formato largo a formato ancho? He visto muchas preguntas sobre las tablas dinámicas. Incluso si no saben que están preguntando sobre tablas dinámicas, generalmente lo hacen. Es prácticamente imposible escribir una pregunta canónica y una...

341
Python Pandas Error al tokenizar datos

Estoy tratando de usar pandas para manipular un archivo .csv pero aparece este error: pandas.parser.CParserError: error al tokenizar datos. Error C: se esperaban 2 campos en la línea 3, vi 12 Intenté leer los documentos de los pandas, pero no encontré nada. Mi código es simple: path = 'GOOG...

325
Pandas: cómo aplanar un índice jerárquico en columnas

Tengo un marco de datos con un índice jerárquico en el eje 1 (columnas) (de una groupby.aggoperación): USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum amax amin 0 702730 26451 1993 1 1 1 0 12 13 30.92 24.98 1 702730 26451 1993 1 2 0 0 13 13 32.00 24.98 2 702730 26451 1993 1...

320
Pandas read_csv low_memory y dtype opciones

Cuando llame df = pd.read_csv('somefile.csv') Yo obtengo: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Las columnas (4,5,7,16) tienen tipos mixtos. Especifique la opción dtype al importar o establezca low_memory = False. ¿Por qué está...

317
Cómo almacenar un marco de datos usando Pandas

En este momento estoy importando un CSVmarco de datos bastante grande cada vez que ejecuto el script. ¿Existe una buena solución para mantener ese marco de datos constantemente disponible entre ejecuciones para que no tenga que pasar todo el tiempo esperando que se ejecute el

299
Convertir Python dict en un marco de datos

Tengo un diccionario de Python como el siguiente: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19':...

290
Conversión entre datetime, Timestamp y datetime64

¿Cómo convierto un numpy.datetime64objeto a datetime.datetime(o Timestamp)? En el siguiente código, creo un objeto datetime, timestamp y datetime64. import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object, there's...

289
Pandas cuenta equivalente (distinto)

Estoy usando pandas como sustituto de db, ya que tengo varias bases de datos (oracle, mssql, etc.) y no puedo hacer una secuencia de comandos para un equivalente de SQL. Tengo una tabla cargada en un DataFrame con algunas columnas: YEARMONTH, CLIENTCODE, SIZE, .... etc etc En SQL, contar la...