Preguntas etiquetadas con pandas

169
Cómo filtrar filas en pandas por regex

Me gustaría filtrar limpiamente un marco de datos usando expresiones regulares en una de las columnas. Para un ejemplo artificial: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat Quiero filtrar las...

167
pandas groupby sort into groups

Quiero agrupar mi marco de datos por dos columnas y luego ordenar los resultados agregados dentro de los grupos. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 market B 7 2 market C 8 4 market D 9 1 market E In...

164
Tome múltiples listas en el marco de datos

¿Cómo tomo varias listas y las pongo como columnas diferentes en un marco de datos de Python? Probé esta solución pero tuve algunos problemas. Intento 1: Ten tres listas, y únelas y úsalas res = zip(lst1,lst2,lst3) Produce solo una columna Intento 2: percentile_list = pd.DataFrame({'lst1Tite'...

161
Combinar dos marcos de datos por índice

Hola, tengo los siguientes marcos de datos: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B ¿Cómo me fusiono en los índices para obtener: id begin conditional confidence discoveryTechnique concept 0 278 56...

159
Selección aleatoria de filas en el marco de datos de Pandas

¿Hay alguna manera de seleccionar filas aleatorias de un DataFrame en Pandas? En R, usando el paquete de automóvil, hay una función útil some(x, n)que es similar a head pero selecciona, en este ejemplo, 10 filas al azar de x. También he mirado la documentación de corte y parece que no hay nada...