¿hay alguna herramienta de ordenamiento de datos para python / pandas similar a la herramienta R tidyr?

18

Estoy trabajando en un desafío de Kaggle donde algunas variables están representadas por filas en lugar de columnas (Telstra Network Disruption). Actualmente estoy buscando el equivalente de recolectar (), separar () y difundir (), que se puede encontrar en la herramienta R tidyr.

cpumar
fuente

Respuestas:

3

R gather()esencialmente va de ancho a largo. Entonces,

  1. revise la página de pandas para saber cómo usar pandas.wide_to_long(),
  2. revise este blog para una discusión sobre cómo obtener una gatherfunción elegante en Python.
ximiki
fuente
0

Traté de imitar sintácticamente el paquete tidyr en python en un paquete llamado tidypython. Lo hice compatible con el paquete dplython, que incluye el uso del operador >> para encadenar comandos.

No se ha probado completamente, pero debería funcionar bastante bien:

https://github.com/durrantmm/tidypython

Avísame si te funciona.

Matt Durrant
fuente