Tengo problemas con algunas de las funcionalidades de los pandas. ¿Cómo verifico cuál es mi versión de
Tengo problemas con algunas de las funcionalidades de los pandas. ¿Cómo verifico cuál es mi versión de
Estoy usando el portátil iPython. Cuando hago esto: df Tengo una hermosa mesa con celdas. Sin embargo, si hago esto: df1 df2 no imprime la primera hermosa mesa. Si intento esto: print df1 print df2 Imprime la tabla en un formato diferente que derrama columnas y hace que la salida sea muy...
¿Cómo encuentro todas las filas en un marco de datos de pandas que tienen el valor máximo para countcolumna, después de agrupar por ['Sp','Mt']columnas? Ejemplo 1: el siguiente dataFrame, que agrupo por ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk...
Si tengo un índice de columna de varios niveles: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) una --- + - b | C - + --- + - 0 | 1 | 2 1 | 3 | 4 4 ¿Cómo puedo eliminar el nivel "a" de ese índice, por lo que...
Tengo un campo en un DataFrame de pandas que se importó como formato de cadena. Debería ser una variable de fecha y hora. ¿Cómo puedo convertirlo en una columna de fecha y hora y luego filtrar según la fecha? Ejemplo: Nombre del marco de datos : raw_data Nombre de columna: Mycol Formato del...
¿Cómo puedo leer en un archivo .csv (sin encabezados) y cuando solo quiero un subconjunto de las columnas (digamos 4 y 7 de un total de 20 columnas), usando pandas? Parece que no puedo
Cerrado. Esta pregunta no es reproducible o fue causada por errores tipográficos . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que sea sobre el tema de Stack Overflow. Cerrado el año pasado .
Tengo un marco de datos como este: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Como puede...
Por ejemplo, tengo DF simple: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) ¿Puedo seleccionar valores de 'A' para los cuales los valores...
Tengo un marco de datos con ~ 300K filas y ~ 40 columnas. Quiero averiguar si alguna fila contiene valores nulos, y colocar estas filas 'nulas' en un marco de datos separado para poder explorarlas fácilmente. Puedo crear una máscara explícitamente: mask = False for col in df.columns: mask =...
He estado trabajando con datos importados de un CSV. Los pandas cambiaron algunas columnas para flotar, por lo que ahora los números en estas columnas se muestran como puntos flotantes. Sin embargo, necesito que se muestren como enteros o sin coma. ¿Hay alguna manera de convertirlos a enteros o no...
Tengo dos marcos de datos de pandas que tienen algunas filas en común. Supongamos que dataframe2 es un subconjunto de dataframe1. ¿Cómo puedo obtener las filas de dataframe1 que no están en dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2...
Tengo un Seriesobjeto pandas que contiene valores booleanos. ¿Cómo puedo obtener una serie que contenga la lógica NOTde cada valor? Por ejemplo, considere una serie que contiene: True True True False La serie que me gustaría obtener contendría: False False False True Parece que debería ser...
Tengo un marco de datos en pandas donde cada columna tiene un rango de valores diferente. Por ejemplo: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 ¿Alguna idea de cómo puedo normalizar las columnas de este marco de datos donde cada valor está entre 0 y 1? Mi salida deseada es: A B C 1 1...
Las respuestas de esta pregunta son un esfuerzo comunitario . Edite las respuestas existentes para mejorar esta publicación. Actualmente no está aceptando nuevas respuestas o interacciones. Habiendo pasado una cantidad de tiempo decente viendo ambos r y pandasEn SO,...
Tengo un Dataframe, df, con la siguiente columna: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Los elementos de la columna son
Los documentos muestran cómo aplicar múltiples funciones en un objeto groupby a la vez usando un dict con los nombres de las columnas de salida como las teclas: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846...
En R, cuando necesita recuperar un índice de columna basado en el nombre de la columna, puede hacer idx <- which(names(my_data)==my_colum_name) ¿Hay alguna manera de hacer lo mismo con los marcos de datos de
¿Cuál es la forma más rápida / sencilla de soltar los valores nan e inf / -inf de un DataFrame de pandas sin reiniciar mode.use_inf_as_null? Me gustaría poder usar los argumentos subsety howde dropna, excepto con infvalores que se consideran faltantes, como: df.dropna(subset=["col1", "col2"],...
Tengo un marco de datos de Pandas como se muestra a continuación: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Quiero eliminar los valores de NaN con una cadena vacía para que se vea así: 1 2 3 0 a "" read 1 b l unread 2 c ""