Quiero aprender a escribir un lexer. Mi curso universitario tenía una tarea en la que teníamos que escribir un analizador sintáctico (y un lexer para acompañarlo), pero esto nos fue entregado sin instrucciones ni comentarios (más allá de la marca), así que realmente no aprendí mucho de él.
Después de buscar este tema, solo puedo encontrar escritos bastante avanzados que se enfocan en áreas que siento que están unos pasos por delante de donde estoy. Quiero una discusión sobre los conceptos básicos de escribir un lexer para un lenguaje muy simple que pueda usar como base para investigar la tokenización de lenguajes más complejos.
En esta etapa, no estoy realmente interesado en las mejores prácticas o técnicas de optimización, sino que prefiero centrarme en lo esencial. ¿Cuáles son algunos buenos recursos para comenzar?
fuente
El Dragon Book es probablemente la guía definitiva sobre el tema, aunque puede resultar un poco abrumador. Los patrones de implementación del lenguaje y la pragmática del lenguaje de programación también son excelentes recursos.
fuente