Preguntas etiquetadas con pandas

159
Cargar datos de txt con pandas

Estoy cargando un archivo txt que contiene una mezcla de datos flotantes y de cadena. Quiero almacenarlos en una matriz donde puedo acceder a cada elemento. Ahora solo estoy haciendo import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Esta es la estructura del...

159
Suelte todas las filas duplicadas en Python Pandas

La pandas drop_duplicatesfunción es excelente para "uniquificar" un marco de datos. Sin embargo, uno de los argumentos de palabras clave para pasar es take_last=Trueo take_last=False, aunque me gustaría descartar todas las filas que están duplicadas en un subconjunto de columnas. es posible? A B...

158
Indicador de progreso durante las operaciones de pandas

Regularmente realizo operaciones de pandas en marcos de datos de más de 15 millones de filas y me encantaría tener acceso a un indicador de progreso para operaciones particulares. ¿Existe un indicador de progreso basado en texto para las operaciones de división, aplicación y combinación de...

155
los pandas obtienen columna promedio / media

No puedo obtener el promedio o la media de una columna en pandas. A tiene un marco de datos. Ninguna de las cosas que probé a continuación me da el promedio de la columnaweight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033 1963 1.3123124 3...

154
Encontrar el índice del elemento en la serie pandas

Sé que esta es una pregunta muy básica, pero por alguna razón no puedo encontrar una respuesta. ¿Cómo puedo obtener el índice de cierto elemento de una serie en pandas python? (primera aparición sería suficiente) Es decir, me gustaría algo como: import pandas as pd myseries =...

153
Pandas: sumar filas de DataFrame para columnas dadas

Tengo el siguiente DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Me gustaría agregar una columna 'e'que es la suma de la columna 'a', 'b'y 'd'. Al pasar por los...

148
Pandas porcentaje del total con groupby

Esto es obviamente simple, pero como un nuevo numpy me estoy atascando. Tengo un archivo CSV que contiene 3 columnas, el estado, la identificación de la oficina y las ventas de esa oficina. Quiero calcular el porcentaje de ventas por oficina en un estado determinado (el total de todos los...

147
Python pandas: aplica una función con argumentos a una serie

Quiero aplicar una función con argumentos a una serie en pandas python: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... La documentación describe el soporte para un método de aplicación, pero no acepta ningún argumento. ¿Hay algún método...