Automatizar el flujo de trabajo de hoja de cálculo (Excel / CSV)

0

Estoy buscando una herramienta o proceso para ayudar a automatizar las tareas de flujo de trabajo repetitivas que requieren que un archivo Excel o CSV esté en un formato específico.

Por ejemplo, trabajamos con proveedores que nos envían una lista de clientes. Los datos en la hoja de cálculo que recibimos son los mismos, pero pueden tener una forma ligeramente diferente. Por ejemplo, podemos recibir un archivo con estas columnas:

[ID][FName][LName][Birthday]

Sin embargo, supongamos que nuestro sistema necesita que tenga la forma de esta manera:

[ID][FirstName][LastName][Birthdate]

Además, los datos pueden estar en un formato ligeramente diferente al esperado por nuestro sistema. Por ejemplo, suponga que la columna de fecha de nacimiento debe estar en un formato específico (MM / DD / AAAA) donde el proveedor puede proporcionarla como (AAAA-MM-DD).

Suponiendo que el archivo que recibimos del proveedor siempre se envíe en el mismo formato, nos gustaría transformar estos archivos rápidamente para que sean compatibles con nuestro sistema.

En mi opinión, esta sería idealmente una aplicación con las siguientes características:

  • Capacidad para trabajar con archivos Excel o CSV
  • Definir cómo renombrar columnas
  • Definir el formato de datos para cada columna.
  • Limpie los datos incorrectos (a veces los clientes tienen la cadena # N / A en un campo, que debe tratarse como en blanco en nuestro sistema)
  • Salida como CSV
  • Fusionar filas por columnas coincidentes (a veces se nos proporcionan varios archivos que deben fusionarse por ID)
  • Una interfaz GUI sería buena para definir las reglas, luego ejecutarla usando una CLI probablemente sería útil para la automatización / futuras ejecuciones
  • La capacidad de guardar estas configuraciones para que podamos volver a ejecutarlas rápidamente en el futuro al cargar nuevos datos con las configuraciones definidas previamente.

¿Existe alguna herramienta o flujo de trabajo que logre esto con muy poca fricción? Podemos desarrollar algo internamente si es necesario, pero si ya existe una herramienta que lo haga fácil, sería ideal.

usuario949286
fuente
Desafortunadamente, las preguntas que piden recomendaciones de productos, servicios o material de aprendizaje no están relacionadas con el tema porque tienden a quedar obsoletas rápidamente y atraen respuestas subjetivas. Para obtener consejos sobre cómo hacer una pregunta que puede requerir la recomendación de software, consulte esta publicación de Meta Super User .
bwDraco
1
La pregunta pide una herramienta o proceso . Las respuestas pueden incluir técnicas de gestión de datos o códigos, no solo productos. Como sucede, la pila de Microsoft Power BI tiene un enfoque adecuado. Power Query no desaparecerá pronto.
teylyn

Respuestas:

2

Su pregunta se lee como una descripción del producto de Power Query. Este es un complemento gratuito de Microsoft que funciona con Excel 2010 y 2013.

Consíguelo aquí: https://www.microsoft.com/en-us/download/details.aspx?id=39379

Puede abrir un archivo CSV, renombrar columnas, reemplazar valores, definir formatos de datos, etc. Cada actividad se registra y puede editarse. La consulta se puede guardar y repetir en cualquier momento. La salida se puede colocar en una hoja de Excel y se puede guardar como CSV.

Editar: Power Query ahora está disponible para todas las ediciones de Office 2013. Citando los requisitos del sistema en la página de descarga

Se admiten las siguientes versiones de Office:

  • Microsoft Office 2010 Professional Plus con Software Assurance
  • Microsoft Office 2013:
  • Power Query Premium: todas las funciones de Power Query disponibles para: Professional Plus, Office 365 ProPlus o Excel 2013 Standalone
  • Power Query Public: disponible para todas las demás SKU de escritorio de Office 2013. Incluye todas las características de Power Query, excepto las siguientes: Corporate Power BI Data Catalog, fuentes de datos basadas en Azure, Active Directory, HDFS, SharePoint Lists, Oracle, DB2, MySQL, PostgreSQL, Sybase, Teradata, Exchange, Dynamics CRM, SAP BusinessObjects , Fuerza de ventas.

Microsoft Power Query para Excel requiere Internet Explorer 9 o superior.

teylyn
fuente
Nota: PQ solo es compatible con las siguientes versiones de Office: Office 2010 Professional Plus con Software Assurance, Office 2013 Professional Plus, Office 365 ProPlus o Excel 2013 Standalone.
Karan
Lo comprobé y creo que probablemente pueda hacer todo lo que quiera. Ahora es solo cuestión de tomarse el tiempo para aprenderlo. ¡Gracias por la ayuda! No recuerdo haber tropezado con esto usando todas las diferentes palabras clave que probé.
user949286
@Karan, Power Query ahora está disponible para todas las ediciones de 2013. Detalles sobre la página de descarga de Power Query
teylyn
Parece que lo dividieron en Power Query Premium y Public. Gracias por la actualización @teylyn.
Karan
@Karan, sí, lo parece. Las características "Premium" parecen incluir cosas que suelen utilizar las empresas, como Active Directory. Pero incluso el usuario doméstico ahora puede obtener toda la bondad de Power Query para consultas de SQL, web, tablas de Excel, etc. Es un verdadero placer. Intenta hacer Unpivot, entonces sabrás qué tan buena es Power Query.
teylyn