Dataframe.resample () solo funciona con datos de series temporales. No puedo encontrar una manera de obtener cada enésima fila a partir de datos que no son de series temporales. Cual es el mejor metodo?
python
pandas
resampling
Mixel
fuente
fuente
df.iloc[1::5, :]
.df.iloc[::5]
Aunque la respuesta aceptada de @ chrisb responde la pregunta, me gustaría agregarle lo siguiente.
Un método simple que utilizo para obtener los
nth
datos o eliminar lanth
fila es el siguiente:Este muestreo basado en aritmética tiene la capacidad de permitir selecciones de filas aún más complejas.
Esto supone , por supuesto, que tiene una
index
columna de enteros ordenados y consecutivos que comienzan en 0.fuente
Existe una solución aún más simple para la respuesta aceptada que implica invocar directamente
df.__getitem__
.Por ejemplo, para obtener cada 2 filas, puede hacer
También hay
GroupBy.first
/GroupBy.head
, agrupa en el índice:El índice se divide en el piso por la zancada (2, en este caso). Si el índice no es numérico, haga
fuente
Tenía un requisito similar, pero quería el artículo n en un grupo en particular. Así es como lo resolví.
fuente