Estoy buscando una herramienta o proceso para ayudar a automatizar las tareas de flujo de trabajo repetitivas que requieren que un archivo Excel o CSV esté en un formato específico.
Por ejemplo, trabajamos con proveedores que nos envían una lista de clientes. Los datos en la hoja de cálculo que recibimos son los mismos, pero pueden tener una forma ligeramente diferente. Por ejemplo, podemos recibir un archivo con estas columnas:
[ID][FName][LName][Birthday]
Sin embargo, supongamos que nuestro sistema necesita que tenga la forma de esta manera:
[ID][FirstName][LastName][Birthdate]
Además, los datos pueden estar en un formato ligeramente diferente al esperado por nuestro sistema. Por ejemplo, suponga que la columna de fecha de nacimiento debe estar en un formato específico (MM / DD / AAAA) donde el proveedor puede proporcionarla como (AAAA-MM-DD).
Suponiendo que el archivo que recibimos del proveedor siempre se envíe en el mismo formato, nos gustaría transformar estos archivos rápidamente para que sean compatibles con nuestro sistema.
En mi opinión, esta sería idealmente una aplicación con las siguientes características:
- Capacidad para trabajar con archivos Excel o CSV
- Definir cómo renombrar columnas
- Definir el formato de datos para cada columna.
- Limpie los datos incorrectos (a veces los clientes tienen la cadena # N / A en un campo, que debe tratarse como en blanco en nuestro sistema)
- Salida como CSV
- Fusionar filas por columnas coincidentes (a veces se nos proporcionan varios archivos que deben fusionarse por ID)
- Una interfaz GUI sería buena para definir las reglas, luego ejecutarla usando una CLI probablemente sería útil para la automatización / futuras ejecuciones
- La capacidad de guardar estas configuraciones para que podamos volver a ejecutarlas rápidamente en el futuro al cargar nuevos datos con las configuraciones definidas previamente.
¿Existe alguna herramienta o flujo de trabajo que logre esto con muy poca fricción? Podemos desarrollar algo internamente si es necesario, pero si ya existe una herramienta que lo haga fácil, sería ideal.
fuente
Respuestas:
Su pregunta se lee como una descripción del producto de Power Query. Este es un complemento gratuito de Microsoft que funciona con Excel 2010 y 2013.
Consíguelo aquí: https://www.microsoft.com/en-us/download/details.aspx?id=39379
Puede abrir un archivo CSV, renombrar columnas, reemplazar valores, definir formatos de datos, etc. Cada actividad se registra y puede editarse. La consulta se puede guardar y repetir en cualquier momento. La salida se puede colocar en una hoja de Excel y se puede guardar como CSV.
Editar: Power Query ahora está disponible para todas las ediciones de Office 2013. Citando los requisitos del sistema en la página de descarga
fuente