pandas remuestrea la documentación

184

Así que entiendo completamente cómo usar el remuestreo , pero la documentación no hace un buen trabajo explicando las opciones.

Entonces, la mayoría de las opciones en la resamplefunción son bastante sencillas, excepto por estas dos:

  • regla: la cadena de desplazamiento u objeto que representa la conversión de destino
  • cómo: cadena, método para reducir o volver a muestrear, predeterminado a 'mean'

Entonces, al mirar tantos ejemplos como encontré en línea, puedo ver las reglas que puede hacer 'D'por día, 'xMin'por minutos, 'xL'por milisegundos, pero eso es todo lo que pude encontrar.

por cuanto he visto el siguiente: 'first', np.max, 'last', 'mean', y 'n1n2n3n4...nx'donde nx es la primera letra de cada índice de la columna.

Entonces, ¿hay algún lugar en la documentación que me falta que muestre todas las opciones para pandas.resamplela regla y cómo las entradas? En caso afirmativo, porque no pude encontrarlo. Si no, ¿cuáles son todas las opciones para ellos?

Ryan Saxe
fuente
8
Para los vagabundos de Google, para volver a muestrear usando how='last'y how='first': no olvide agregar closed='left', label='left'. enlace
Nasser Al-Wohaibi
@ NasserAl-Wohaibi Estoy bastante seguro de que su comentario anterior es una indicación de que estas opciones pueden ayudar a responder completamente la siguiente pregunta. ¿Has encontrado este problema antes? stackoverflow.com/questions/26247301/…
Amelio Vazquez-Reina
how = 'last' está en desuso ahora a favor deresample(...).last()
shadi

Respuestas:

314
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

Consulte la documentación de la serie de tiempo . Incluye una lista de compensaciones (y compensaciones 'ancladas' ), y una sección sobre remuestreo .

Tenga en cuenta que no hay una lista de todas las diferentes howopciones, ya que puede ser cualquier función de matriz NumPy y cualquier función que esté disponible a través del envío de groupby se puede pasar howpor nombre.

Matti John
fuente
1
"... porque puede ser cualquier función de matriz NumPy y ...", sí, lo leí en los documentos, pero ¿hay alguna documentación que explique qué se supone que debe hacer exactamente esta función y qué tiene que ver con el remuestreo ...? Me siento bastante perdido aquí.
jhin
1
Esto debería estar vinculado a todas las áreas de documentación relevantes, como el remuestreo. Aquí está el enlace a las abreviaturas: pandas.pydata.org/pandas-docs/stable/…
wordsforthewise
Se agregó una solicitud de extracción para mejorar los documentos github.com/pandas-dev/pandas/pull/30252
Aseem Bansal
65

Hay más que esto, pero probablemente estés buscando esta lista:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

Fuente: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

vonkohorn
fuente
8
¿Por qué no está el 'Min' (como el '5Min' usado en la documentación)?
ziyuang
@zyuang, aquí solo se muestran formatos cortos: "ms" también está ausente de la lista, por ejemplo
Julien__