Preguntas etiquetadas con pandas

107
producto cartesiano en pandas

Tengo dos marcos de datos de pandas: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) ¿Cuál es la mejor práctica para obtener su producto cartesiano (por supuesto, sin escribirlo explícitamente como yo)? #df1, df2 cartesian...

107
Cambiar un valor basado en otro valor en pandas

Estoy tratando de reprogramar mi código Stata en Python para mejorar la velocidad, y me señalaron en la dirección de PANDAS. Sin embargo, estoy teniendo dificultades para entender cómo procesar los datos. Digamos que quiero iterar sobre todos los valores en el encabezado de columna 'ID'. Si ese ID...

106
Anteponer un nivel a pandas MultiIndex

Tengo un DataFrame con un MultiIndex creado después de algunas agrupaciones: import numpy as np import pandas as p from numpy.random import randn df = p.DataFrame({ 'A' : ['a1', 'a1', 'a2', 'a3'] , 'B' : ['b1', 'b2', 'b3', 'b4'] , 'Vals' : randn(4) }).groupby(['A',

105
¿Cómo combino dos marcos de datos?

Estoy usando marcos de datos de Pandas. Tengo un marco de datos inicial, digamos D. Extraigo dos marcos de datos de esta manera: A = D[D.label == k] B = D[D.label != k] luego cambio la etiqueta AyB A.label = 1 B.label = -1 Quiero combinar A y B para poder tenerlos como un marco de datos, algo...

105
Seleccionar filas de Pandas según el índice de la lista

Tengo un marco de datos df: 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 Luego quiero seleccionar filas con ciertos números de secuencia que se indican en una lista, supongamos que aquí está [1,3], luego a la...

105
Python pandas inserta la lista en una celda

Tengo una lista 'abc' y un marco de datos 'df': abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN Quiero insertar la lista en la celda 1B, así que quiero este resultado: A B 0 12 NaN 1 23 ['foo', 'bar'] ¿Cómo puedo hacer eso? 1) Si uso esto: df.ix[1,'B'] = abc Recibo el siguiente mensaje...

105
¿Hacer que Pandas DataFrame aplique () use todos los núcleos?

A partir de agosto de 2017, Pandas DataFame.apply () lamentablemente todavía está limitado a trabajar con un solo núcleo, lo que significa que una máquina de múltiples núcleos desperdiciará la mayor parte de su tiempo de cómputo cuando ejecute df.apply(myfunc, axis=1). ¿Cómo puede usar todos...

104
¿Cómo seleccionar filas con NaN en una columna en particular?

Dado este marco de datos, ¿cómo seleccionar solo aquellas filas que tienen "Col2" igual a NaN? In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"]) In [57]: df Out[57]: 0 1 2 0 0 1 2 1 0 NaN 0 2 0 0 NaN 3 0 1 2 4 0 1...

104
Agregar columna al marco de datos de pandas

Probablemente sea fácil, pero tengo los siguientes datos: En el marco de datos 1: index dat1 0 9 1 5 En el marco de datos 2: index dat2 0 7 1 6 Quiero un marco de datos con la siguiente forma: index dat1 dat2 0 9 7 1 5 6 Intenté usar el appendmétodo, pero obtengo una combinación cruzada (es...