Digamos que dfes un DataFrame de pandas. Me gustaría encontrar todas las columnas de tipo numérico. Algo como: isNumeric =
Digamos que dfes un DataFrame de pandas. Me gustaría encontrar todas las columnas de tipo numérico. Algo como: isNumeric =
Utilizo pandas para escribir en un archivo de Excel de la siguiente manera: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx ya consta de varias pestañas diferentes. Sin embargo, todavía...
¿Existe alguna función que sea equivalente a una combinación de df.isin()y df[col].str.contains()? Por ejemplo, digamos que tengo la serie s = pd.Series(['cat','hat','dog','fog','pet'])y quiero encontrar todos los lugares donde scontiene cualquiera de ['og', 'at'], me gustaría obtener todo menos...
Estoy confundido acerca de las reglas que usa Pandas al decidir que una selección de un marco de datos es una copia del marco de datos original o una vista del original. Si tengo, por ejemplo, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Entiendo que...
Me gustaría agregar una cadena al inicio de cada valor en dicha columna de un marco de datos de pandas (elegantemente). Ya descubrí cómo hacer esto y actualmente estoy usando: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Esto parece una cosa increíblemente poco...
Cuando ejecuto el programa, Pandas da 'Advertencia futura' como se muestra a continuación cada vez. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Recibí el...
Tengo el siguiente DataFrame donde una de las columnas es un objeto (celda de tipo de lista): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Mi resultado esperado es: A B 0 1 1 1 1 2 3 2 1 4 2 2 ¿Qué debo hacer para lograrlo? Pregunta relacionada...
Necesito encajar RandomForestRegressordesde sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Este código siempre funcionó hasta que hice algún preprocesamiento de datos ( train_y). El mensaje de...
Usando Python Pandas, estoy tratando de encontrar el Country& Placecon el valor máximo. Esto devuelve el valor máximo: data.groupby(['Country','Place'])['Value'].max() Pero, ¿cómo puedo obtener el correspondiente Countryy el
Quiero encontrar filas que contengan una cadena, así: DF[DF.col.str.contains("foo")] Sin embargo, esto falla porque algunos elementos son NaN: ValueError: no se puede indexar con un vector que contiene valores NA / NaN Entonces recurro a lo
Aquí está mi código: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Cuando ejecuto este código, aparece el siguiente error: Traceback (most recent call last): File
Estoy luchando con algo aparentemente muy simple. Tengo un marco de datos de pandas que contiene una cadena muy larga. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Ahora, cuando trato de imprimir lo mismo, no veo...
Cualquier ayuda sobre este problema será muy apreciada. Entonces, básicamente, quiero ejecutar una consulta en mi base de datos SQL y almacenar los datos devueltos como estructura de datos Pandas. He adjuntado el código para la consulta. Estoy leyendo la documentación sobre Pandas, pero tengo...
Es fácil convertir una lista de listas en un marco de datos de pandas: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) Pero, ¿cómo convierto df de nuevo en una lista de listas? lol = df.what_to_do_now? print lol #
Entonces, mi conjunto de datos tiene información por ubicación para n fechas. El problema es que cada fecha es en realidad un encabezado de columna diferente. Por ejemplo, el CSV se parece a location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Lo que me gustaría es que...
Tengo una hoja de cálculo como esta: Locality 2005 2006 2007 2008 2009 ABBOTSFORD 427000 448000 602500 600000 638500 ABERFELDIE 534000 600000 735000 710000 775000 AIREYS INLET459000 440000 430000 517500 512500 No quiero intercambiar manualmente la columna con la fila. ¿Podría ser posible usar...
Tengo una trama existente que se creó con pandas como este: df['myvar'].plot(kind='bar') El eje y tiene el formato flotante y quiero cambiar el eje y a porcentajes. Todas las soluciones que encontré usan la sintaxis ax.xyz y solo puedo colocar el código debajo de la línea de arriba que crea el...
Digamos que tengo un diccionario con 10 pares clave-valor. Cada entrada contiene una matriz numerosa. Sin embargo, la longitud de la matriz no es la misma para todos ellos. ¿Cómo puedo crear un marco de datos donde cada columna contiene una entrada diferente? Cuando
Tengo un marco de datos de pandas con las siguientes columnas; Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00 ¿Cómo combino datos...
¿Cómo puedo imprimir un marco de datos de pandas como una buena tabla basada en texto, como la siguiente? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 |...