Preguntas etiquetadas con pandas

251

Cómo encontrar la versión de pandas instalada

Tengo problemas con algunas de las funcionalidades de los pandas. ¿Cómo verifico cuál es mi versión de

python pandas

245

Mostrar DataFrame como tabla en iPython Notebook

Estoy usando el portátil iPython. Cuando hago esto: df Tengo una hermosa mesa con celdas. Sin embargo, si hago esto: df1 df2 no imprime la primera hermosa mesa. Si intento esto: print df1 print df2 Imprime la tabla en un formato diferente que derrama columnas y hace que la salida sea muy...

pandas printing ipython-notebook jupyter-notebook display

244

Obtenga las filas que tienen el conteo máximo en grupos usando groupby

¿Cómo encuentro todas las filas en un marco de datos de pandas que tienen el valor máximo para countcolumna, después de agrupar por ['Sp','Mt']columnas? Ejemplo 1: el siguiente dataFrame, que agrupo por ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk...

python pandas max pandas-groupby

243

Pandas: ¿eliminar un nivel de un índice de columna de varios niveles?

Si tengo un índice de columna de varios niveles: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) una --- + - b | C - + --- + - 0 | 1 | 2 1 | 3 | 4 4 ¿Cómo puedo eliminar el nivel "a" de ese índice, por lo que...

python pandas

242

Convertir columna de pandas a fecha y hora

Tengo un campo en un DataFrame de pandas que se importó como formato de cadena. Debería ser una variable de fecha y hora. ¿Cómo puedo convertirlo en una columna de fecha y hora y luego filtrar según la fecha? Ejemplo: Nombre del marco de datos : raw_data Nombre de columna: Mycol Formato del...

python datetime pandas

239

Pandas leídos en tabla sin encabezados

¿Cómo puedo leer en un archivo .csv (sin encabezados) y cuando solo quiero un subconjunto de las columnas (digamos 4 y 7 de un total de 20 columnas), usando pandas? Parece que no puedo

python pandas

239

¿Por qué no funciona mi función 'aplicar' de Pandas que hace referencia a múltiples columnas? [cerrado]

Cerrado. Esta pregunta no es reproducible o fue causada por errores tipográficos . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que sea sobre el tema de Stack Overflow. Cerrado el año pasado .

python python-2.7 pandas dataframe apply

237

Cómo ordenar el marco de datos de pandas de una columna

Tengo un marco de datos como este: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Como puede...

python pandas sorting

235

Selección con criterios complejos de pandas.DataFrame

Por ejemplo, tengo DF simple: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) ¿Puedo seleccionar valores de 'A' para los cuales los valores...

python pandas

234

¿Cómo seleccionar filas con uno o más nulos de un DataFrame de pandas sin enumerar columnas explícitamente?

Tengo un marco de datos con ~ 300K filas y ~ 40 columnas. Quiero averiguar si alguna fila contiene valores nulos, y colocar estas filas 'nulas' en un marco de datos separado para poder explorarlas fácilmente. Puedo crear una máscara explícitamente: mask = False for col in df.columns: mask =...

python pandas null nan

230

¿Convertir flotadores a int en pandas?

He estado trabajando con datos importados de un CSV. Los pandas cambiaron algunas columnas para flotar, por lo que ahora los números en estas columnas se muestran como puntos flotantes. Sin embargo, necesito que se muestren como enteros o sin coma. ¿Hay alguna manera de convertirlos a enteros o no...

python pandas floating-point integer dataset

230

los pandas obtienen filas que NO están en otro marco de datos

Tengo dos marcos de datos de pandas que tienen algunas filas en común. Supongamos que dataframe2 es un subconjunto de dataframe1. ¿Cómo puedo obtener las filas de dataframe1 que no están en dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2...

python pandas dataframe

229

¿Cómo puedo obtener el elemento lógico NO de una serie de pandas?

Tengo un Seriesobjeto pandas que contiene valores booleanos. ¿Cómo puedo obtener una serie que contenga la lógica NOTde cada valor? Por ejemplo, considere una serie que contiene: True True True False La serie que me gustaría obtener contendría: False False False True Parece que debería ser...

python pandas boolean-logic

227

Normalizar columnas de marco de datos de pandas

Tengo un marco de datos en pandas donde cada columna tiene un rango de valores diferente. Por ejemplo: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 ¿Alguna idea de cómo puedo normalizar las columnas de este marco de datos donde cada valor está entre 0 y 1? Mi salida deseada es: A B C 1 1...

python pandas dataframe normalize

221

Cómo hacer buenos ejemplos de pandas reproducibles

Las respuestas de esta pregunta son un esfuerzo comunitario . Edite las respuestas existentes para mejorar esta publicación. Actualmente no está aceptando nuevas respuestas o interacciones. Habiendo pasado una cantidad de tiempo decente viendo ambos r y pandasEn SO,...

python pandas

221

Extrayendo solo mes y año por separado de la columna Pandas Datetime

Tengo un Dataframe, df, con la siguiente columna: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Los elementos de la columna son

python pandas

221

Aplicar múltiples funciones a múltiples grupos por columnas

Los documentos muestran cómo aplicar múltiples funciones en un objeto groupby a la vez usando un dict con los nombres de las columnas de salida como las teclas: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846...

python group-by aggregate-functions pandas

220

Obtener el índice de la columna del nombre de la columna en pandas de Python

En R, cuando necesita recuperar un índice de columna basado en el nombre de la columna, puede hacer idx <- which(names(my_data)==my_colum_name) ¿Hay alguna manera de hacer lo mismo con los marcos de datos de

python pandas dataframe indexing

219

soltando valores infinitos de marcos de datos en pandas?

¿Cuál es la forma más rápida / sencilla de soltar los valores nan e inf / -inf de un DataFrame de pandas sin reiniciar mode.use_inf_as_null? Me gustaría poder usar los argumentos subsety howde dropna, excepto con infvalores que se consideran faltantes, como: df.dropna(subset=["col1", "col2"],...

python numpy scipy pandas

218

Pandas Reemplazar NaN con una cadena en blanco / vacía

Tengo un marco de datos de Pandas como se muestra a continuación: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Quiero eliminar los valores de NaN con una cadena vacía para que se vea así: 1 2 3 0 a "" read 1 b l unread 2 c ""

python pandas dataframe nan