Preguntas etiquetadas con pandas

81
Pandas to_html () trunca el contenido de la cadena

Tengo un DataFrameobjeto Python Pandas que contiene datos textuales. Mi problema es que cuando uso la to_html()función, trunca las cadenas en la salida. Por ejemplo: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print...

81
La trama de Pandas no se muestra

Cuando se usa esto en un script (no en IPython), no sucede nada, es decir, la ventana del gráfico no aparece: import numpy as np import pandas as pd ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts.plot() Incluso al agregar time.sleep(5), todavía no hay...

80
Función agregada Pandas DataFrame usando múltiples columnas

¿Hay alguna forma de escribir una función de agregación como se usa en el DataFrame.aggmétodo, que tendría acceso a más de una columna de los datos que se están agregando? Los casos de uso típicos serían funciones de desviación estándar ponderada, promedio ponderado. Me gustaría poder escribir...

79
Error de memoria al usar pandas read_csv

Estoy tratando de hacer algo bastante simple, leer un archivo csv grande en un marco de datos de pandas. data = pandas.read_csv(filepath, header = 0, sep = DELIMITER,skiprows = 2) El código falla con a MemoryError, o simplemente nunca termina. El uso de memoria en el administrador de tareas...

25
Error extraño en Pandas y Numpy con respecto al multihilo

La mayoría de las funciones de Numpy permitirán el subprocesamiento múltiple de forma predeterminada. por ejemplo, trabajo en una estación de trabajo Intel CPU de 8 núcleos, si ejecuto un script import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) Linux topmostrará...

19
¿Desapilar y devolver valor cuenta para cada variable?

Tengo un marco de datos que registra las respuestas de la elección de lenguajes de programación de 19717 personas a través de preguntas de opción múltiple. La primera columna es, por supuesto, el género del encuestado, mientras que el resto son las opciones que eligieron. Y, por lo tanto, si elijo...

16
Cómo convertir pandas dataframe a diccionario jerárquico

Tengo el siguiente marco de datos de pandas: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Estoy tratando de crear un diccionario jerárquico, con los valores del diccionario...

15
Encuentra pares simétricos rápidamente en numpy

from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # 85 9 4 # 86 9...

14
Inferir qué columnas son datetime

Tengo un gran marco de datos con muchas columnas, muchas de las cuales son de tipo datetime.datetime. El problema es que muchos también tienen tipos mixtos, que incluyen, por ejemplo, datetime.datetimevalores y Nonevalores (y potencialmente otros valores no válidos): 0 2017-07-06 00:00:00 1...