En mi negocio manejamos todos los análisis a través de Excel. Esto incluye principalmente programación, planificación de producción y operaciones contables. Actualmente estamos buscando agregar un poco de modelado predictivo y Excel es suficiente hasta cierto punto, pero no tiene soporte para modelos complejos.
A mi entender, los principales beneficios de Excel son su facilidad de uso y la facilidad con la que puede encontrar y capacitar a las personas para que se acostumbren. Por otro lado, los entornos más sofisticados (por ejemplo, R, python) pueden manejar una variedad más amplia de tareas analíticas, pero requieren individuos mejor capacitados.
También he leído esta pregunta sobre si Excel es suficiente para Data Science y si bien está un poco fuera de alcance para mi propósito, la conclusión es que herramientas como R y Python son mucho mejores que Excel.
Mi pregunta es (en el contexto del análisis de datos): "¿Hasta dónde podemos llegar con Excel, sin necesidad de cambiar a una herramienta más sofisticada?" o "¿En qué momento necesitamos migrar de Excel a -let say- R?"
¡Muchas gracias!
fuente
Respuestas:
TL; DR
Si tiene tiempo ilimitado y usa una versión de 64 bits de Excel, puede llegar tan lejos con Excel como cualquier otra herramienta de análisis de datos.
Hora
Menciono el tiempo como mi primer factor, porque Excel solo tiene una funcionalidad básica incorporada, como sumar, generación de números aleatorios, búsquedas, etc. Estos corresponden a un tipo de biblioteca estándar , que Python y R también tienen. Usando estas funciones básicas, con suficiente tiempo, puede construir prácticamente cualquier herramienta de análisis que haya. No esperes un buen rendimiento en tiempo de ejecución. En Python y R, sin embargo, hay muchos paquetes que la gente ya ha creado, que funcionan bien y han sido probados por muchas personas y por lo tanto son de confianza.
Memoria
Mi segundo punto sobre Excel de 64 bits es porque permite que una sola instancia de Excel use mucha más memoria . Permite que se llenen muchas más celdas. El uso de Excel de 32 bits lo limitará a proyectos de alrededor de 2 Gb. Esa es una buena cantidad de datos, pero es un límite difícil.
Luego, los pasos en Excel de 64 bits, que básicamente significa que no hay más límites de memoria, solo aquellos que provienen de su hardware, y eso significa que Python y R también se detendrán en sus pistas.
Para proporcionar algunos números, simplemente podemos calcular el número de bits que se pueden almacenar en cada versión. Aquí en el mensaje interactivo de Python:
Eb
significa exa-bytes . Esto significa 18,4 millones de millones de gigabytes.Noté que el cálculo muestra 4 Gb para 32 bits, mientras que dije 2 Gb arriba. Leí que hay una especie de límite estricto en la versión de 32 bits. No sé ni me importa por qué eso es ... Yo uso Python y R ;-)
En cualquier caso, espero que sea suficiente para convencerlo de que la memoria no es un problema, si es una persona valiente y está dispuesta a invertir todo su tiempo en la construcción de herramientas desde cero.
Resumen
Si tiene una lógica empresarial complicada, donde el análisis real es matemáticamente simple, manténgase en Excel. La gente de negocios te amará por eso.
Si desea hacer más que una regresión lineal, use Python o R.
Advertencias
Hasta donde sé, no puedes ejecutar tareas remotas o distribuidas usando Excel, mientras que eso es relativamente fácil usando Python y (un poco menos en mi opinión) R. Entonces, en ese punto, me rendiría en Excel. Es probable que tenga que implementar sus propias herramientas en C # o C ++ utilizando el marco .Net.
fuente