Toma el siguiente marco de datos:
x = np.tile(np.arange(3),3)
y = np.repeat(np.arange(3),3)
df = pd.DataFrame({"x": x, "y": y})
x y
0 0 0
1 1 0
2 2 0
3 0 1
4 1 1
5 2 1
6 0 2
7 1 2
8 2 2
Necesito ordenarlo x
primero, y solo segundo por y
:
df2 = df.sort(["x", "y"])
x y
0 0 0
3 0 1
6 0 2
1 1 0
4 1 1
7 1 2
2 2 0
5 2 1
8 2 2
¿Cómo puedo cambiar el índice para que vuelva a subir? Es decir, ¿cómo obtengo esto?
x y
0 0 0
1 0 1
2 0 2
3 1 0
4 1 1
5 1 2
6 2 0
7 2 1
8 2 2
He probado lo siguiente. Desafortunadamente, no cambia el índice en absoluto:
df2.reindex(np.arange(len(df2.index)))
df.sort(["x", "y"], ignore_index=True, inplace=True)
Respuestas:
Puede restablecer el índice usando
reset_index
para recuperar un índice predeterminado de 0, 1, 2, ..., n-1 (y usardrop=True
para indicar que desea eliminar el índice existente en lugar de agregarlo como una columna adicional a su marco de datos) :In [19]: df2 = df2.reset_index(drop=True) In [20]: df2 Out[20]: x y 0 0 0 1 0 1 2 0 2 3 1 0 4 1 1 5 1 2 6 2 0 7 2 1 8 2 2
fuente
df.sort()
está en desuso, usedf.sort_values(...)
: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_values.htmlLuego siga la respuesta de joris haciendo
df.reset_index(drop=True)
fuente
Dado que pandas 1.0.0
df.sort_values
tiene un nuevo parámetroignore_index
que hace exactamente lo que necesita:In [1]: df2 = df.sort_values(by=['x','y'],ignore_index=True) In [2]: df2 Out[2]: x y 0 0 0 1 0 1 2 0 2 3 1 0 4 1 1 5 1 2 6 2 0 7 2 1 8 2 2
fuente
Puede establecer nuevos índices usando
set_index
:Salida:
x y 0 0 0 1 0 1 2 0 2 3 1 0 4 1 1 5 1 2 6 2 0 7 2 1 8 2 2
fuente
reset_index()