Preguntas etiquetadas con pandas

121

¿Cómo encuentro columnas numéricas en Pandas?

Digamos que dfes un DataFrame de pandas. Me gustaría encontrar todas las columnas de tipo numérico. Algo como: isNumeric =

python types pandas

120

¿Cómo escribir en un archivo de Excel existente sin sobrescribir datos (usando pandas)?

Utilizo pandas para escribir en un archivo de Excel de la siguiente manera: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx ya consta de varias pestañas diferentes. Sin embargo, todavía...

python excel python-2.7 pandas

119

¿Cómo probar si una cadena contiene una de las subcadenas en una lista, en pandas?

¿Existe alguna función que sea equivalente a una combinación de df.isin()y df[col].str.contains()? Por ejemplo, digamos que tengo la serie s = pd.Series(['cat','hat','dog','fog','pet'])y quiero encontrar todos los lugares donde scontiene cualquiera de ['og', 'at'], me gustaría obtener todo menos...

python string pandas dataframe match

119

¿Qué reglas usa Pandas para generar una vista frente a una copia?

Estoy confundido acerca de las reglas que usa Pandas al decidir que una selección de un marco de datos es una copia del marco de datos original o una vista del original. Si tengo, por ejemplo, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Entiendo que...

python pandas dataframe indexing chained-assignment

119

agregue un prefijo de cadena a cada valor en una columna de cadena usando Pandas

Me gustaría agregar una cadena al inicio de cada valor en dicha columna de un marco de datos de pandas (elegantemente). Ya descubrí cómo hacer esto y actualmente estoy usando: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Esto parece una cosa increíblemente poco...

python string pandas dataframe

118

¿Cómo suprimir la advertencia de Pandas Future?

Cuando ejecuto el programa, Pandas da 'Advertencia futura' como se muestra a continuación cada vez. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Recibí el...

python pandas suppress-warnings future-warning

118

¿Cómo desanidar (explotar) una columna en un DataFrame de pandas?

Tengo el siguiente DataFrame donde una de las columnas es un objeto (celda de tipo de lista): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Mi resultado esperado es: A B 0 1 1 1 1 2 3 2 1 4 2 2 ¿Qué debo hacer para lograrlo? Pregunta relacionada...

python pandas dataframe

118

Se pasó una columna-vector y cuando se esperaba una matriz 1d

Necesito encajar RandomForestRegressordesde sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Este código siempre funcionó hasta que hice algún preprocesamiento de datos ( train_y). El mensaje de...

python pandas numpy scikit-learn

117

Encuentre el valor máximo de una columna y devuelva los valores de fila correspondientes usando Pandas

Usando Python Pandas, estoy tratando de encontrar el Country& Placecon el valor máximo. Esto devuelve el valor máximo: data.groupby(['Country','Place'])['Value'].max() Pero, ¿cómo puedo obtener el correspondiente Countryy el

python pandas dataframe max

117

Ignorar los NaN con str.contains

Quiero encontrar filas que contengan una cadena, así: DF[DF.col.str.contains("foo")] Sin embargo, esto falla porque algunos elementos son NaN: ValueError: no se puede indexar con un vector que contiene valores NA / NaN Entonces recurro a lo

python pandas

117

Forma correcta de revertir pandas.DataFrame?

Aquí está mi código: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Cuando ejecuto este código, aparece el siguiente error: Traceback (most recent call last): File

python pandas reverse

116

Imprima una cadena muy larga completamente en pandas dataframe

Estoy luchando con algo aparentemente muy simple. Tengo un marco de datos de pandas que contiene una cadena muy larga. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Ahora, cuando trato de imprimir lo mismo, no veo...

python string pandas options

116

¿Cómo convertir el resultado de la consulta SQL a la estructura de datos PANDAS?

Cualquier ayuda sobre este problema será muy apreciada. Entonces, básicamente, quiero ejecutar una consulta en mi base de datos SQL y almacenar los datos devueltos como estructura de datos Pandas. He adjuntado el código para la consulta. Estoy leyendo la documentación sobre Pandas, pero tengo...

python mysql data-structures pandas

115

Pandas DataFrame a la lista de listas

Es fácil convertir una lista de listas en un marco de datos de pandas: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) Pero, ¿cómo convierto df de nuevo en una lista de listas? lol = df.what_to_do_now? print lol #

python pandas

115

los pandas convierten algunas columnas en filas

Entonces, mi conjunto de datos tiene información por ubicación para n fechas. El problema es que cada fecha es en realidad un encabezado de columna diferente. Por ejemplo, el CSV se parece a location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Lo que me gustaría es que...

python pandas

114

¿Podrían los pandas usar la columna como índice?

Tengo una hoja de cálculo como esta: Locality 2005 2006 2007 2008 2009 ABBOTSFORD 427000 448000 602500 600000 638500 ABERFELDIE 534000 600000 735000 710000 775000 AIREYS INLET459000 440000 430000 517500 512500 No quiero intercambiar manualmente la columna con la fila. ¿Podría ser posible usar...

python excel pandas

114

Dar formato al eje y como porcentaje

Tengo una trama existente que se creó con pandas como este: df['myvar'].plot(kind='bar') El eje y tiene el formato flotante y quiero cambiar el eje y a porcentajes. Todas las soluciones que encontré usan la sintaxis ax.xyz y solo puedo colocar el código debajo de la línea de arriba que crea el...

python pandas matplotlib plot

114

Crear un marco de datos a partir de un diccionario donde las entradas tienen diferentes longitudes

Digamos que tengo un diccionario con 10 pares clave-valor. Cada entrada contiene una matriz numerosa. Sin embargo, la longitud de la matriz no es la misma para todos ellos. ¿Cómo puedo crear un marco de datos donde cada columna contiene una entrada diferente? Cuando

python pandas

113

Combinar columnas de fecha y hora usando python pandas

Tengo un marco de datos de pandas con las siguientes columnas; Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00 ¿Cómo combino datos...

python pandas datetime series

113

Pretty Imprimiendo un marco de datos de pandas

¿Cómo puedo imprimir un marco de datos de pandas como una buena tabla basada en texto, como la siguiente? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 |...

python pandas dataframe printing