Preguntas etiquetadas con pandas

136
¿Cómo cargar un archivo tsv en un Pandas DataFrame?

Soy nuevo en python y pandas. Estoy tratando de tsvcargar un archivo en pandas DataFrame. Esto es lo que intento y el error que obtengo: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1,...

135
Los pandas dividen la columna de listas en varias columnas

Tengo un DataFrame de pandas con una columna: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Salida: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF,...

134
pandas valores únicos columnas múltiples

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) ¿Cuál es la mejor manera de devolver los valores únicos de 'Col1' y 'Col2'? La salida deseada es 'Bob', 'Joe', 'Bill', 'Mary',

134
ImportError: ningún módulo llamado dateutil.parser

Recibo el siguiente error al importar pandasen un Pythonprograma monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning

133
Cómo imprimir un objeto groupby

Quiero imprimir el resultado de la agrupación con Pandas. Tengo un marco de datos: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Al imprimir después de agrupar por...

131
Normalizar datos en pandas

Supongamos que tengo un marco de datos de pandas df: Quiero calcular la columna sabia media de un marco de datos. Esto es facil: df.apply(average) entonces el rango sabio de columna max (col) - min (col). Esto es fácil nuevamente: df.apply(max) - df.apply(min) Ahora, para cada elemento,...

130
Cómo verificar el tipo de columna en los pandas de Python

Necesito usar diferentes funciones para tratar columnas numéricas y columnas de cadena. Lo que estoy haciendo ahora es realmente tonto: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:,...

130
verificar si la variable es dataframe

cuando se llama a mi función f con una variable, quiero verificar si var es un marco de datos de pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Supongo que la solución podría ser bastante simple, pero incluso con def f(var): if var.values != None: print "do stuff" No puedo...