Preguntas etiquetadas con dataframe

105
Python pandas inserta la lista en una celda

Tengo una lista 'abc' y un marco de datos 'df': abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN Quiero insertar la lista en la celda 1B, así que quiero este resultado: A B 0 12 NaN 1 23 ['foo', 'bar'] ¿Cómo puedo hacer eso? 1) Si uso esto: df.ix[1,'B'] = abc Recibo el siguiente mensaje...

104
Compara dos columnas usando pandas

Usando esto como punto de partida: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Quiero usar algo como una ifdeclaración dentro de pandas. if df['one'] >=...

103
Cómo obtener una fila de R data.frame

Tengo un data.frame con encabezados de columna. ¿Cómo puedo obtener una fila específica de data.frame como una lista (con los encabezados de columna como claves para la lista)? Específicamente, mi data.frame es A B C 1 5 4,25 4,5 2 3,5 4 2,5 3 3,25 4 4 4 4,25 4,5 2,25 5 1,5 4,5 3 Y...

103
Devolver múltiples columnas de pandas apply ()

Tengo una trama de datos pandas, df_test. Contiene una columna 'tamaño' que representa el tamaño en bytes. Calculé KB, MB y GB con el siguiente código: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] =...

101
El objeto 'DataFrame' no tiene atributo 'sort'

Me enfrento a un problema aquí, en mi paquete de python he instalado numpy, pero todavía tengo este error El objeto 'DataFrame' no tiene atributo 'sort' Cualquiera puede darme una idea ... Este es mi codigo: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final =...

101
Cómo cambiar una columna en Pandas DataFrame

Me gustaría cambiar una columna en un Pandas DataFrame, pero no he podido encontrar un método para hacerlo desde la documentación sin volver a escribir todo el DF. Alguien sabe como hacerlo? Marco de datos: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Salida deseada: ##...

101
Limpiar los valores `Inf` de un marco de datos R

En R, tengo una operación que crea algunos Infvalores cuando transformo un marco de datos. Me gustaría convertir estos Infvalores en NAvalores. El código que tengo es lento para datos grandes, ¿hay alguna forma más rápida de hacer esto? Digamos que tengo el siguiente marco de datos: dat <-...

99
Columna de agrupamiento con pandas pitón

Tengo una columna de marco de datos con valores numéricos: df['percentage'].head() 46.5 44.2 100.0 42.12 Quiero ver la columna como bin cuenta: bins = [0, 1, 5, 10, 25, 50, 100] ¿Cómo puedo obtener el resultado como contenedores con ellos value counts? [0, 1] bin amount [1, 5] etc [5, 10] etc...