Diferencia entre expresión regular y gramática en autómatas

Las expresiones regulares, las gramáticas regulares y los autómatas finitos son simplemente tres formalismos diferentes para la misma cosa. Hay algoritmos para convertir de cualquiera de ellos a cualquier otro.

La razón básica de que tengamos los tres es que fueron creados de forma independiente, con el primer conjunto de equivalencias (también hay varios otros formalismos) probados por Kleene (este resultado, o parte del mismo, se llama Teorema de Kleene).

Entonces, en ese contexto, dependiendo de la forma en que desee ejecutar los modelos, todos reconocen o generan cadenas de un lenguaje regular, y matemáticamente, en ese sentido, no hay diferencia.

Por supuesto, a veces un modelo es más fácil de usar que otro para una tarea particular, debido a los detalles del formalismo. Además, la forma en que funcionan en la cabeza de un humano es a menudo un poco diferente, los autómatas finitos "se sienten" como computadoras, las expresiones regulares "se sienten" como si estuvieras construyendo una cadena de subcadenas más pequeñas y las gramáticas regulares "se sienten" como una gramática más tradicional derivación o clasificación de una oración en un idioma (como era de esperar cuando se mira el historial).

Entonces, para comparar los dos, definámoslos:

Expresiones regulares

Por lo tanto, las expresiones regulares se definen recursivamente de la siguiente manera:

$\emptyset$ es una expresión regular
$\varepsilon$ es una expresión regular
$a$ es una expresión regular para cada $a \in \Sigma$
si y son expresiones regulares, entonces B
- $A\cdot B$ es una expresión regular (concatenación)
- $A \mid B$ es una expresión regular (alternancia)
- $A^{\ast}$ es una expresión regular (estrella de Kleene)

Junto con algunas semánticas (es decir, cómo interpretamos los operadores para obtener una cadena), obtenemos una forma de generar cadenas a partir de un lenguaje regular.

Gramáticas regulares

Las gramáticas regulares consisten en cuatro tuplas donde es el conjunto de no terminales, es el conjunto de terminales, es el inicio no terminal y es el conjunto de producciones que nos dicen cómo cambiar el símbolo de inicio, paso a paso, en una cadena en . puede tener sus producciones extraídas de uno de dos tipos (aunque no de ambos): $(N,\Sigma, P, S \in N)$ $N$ $\Sigma$ $S$ $P$ $\Sigma^{\ast}$ $P$

Gramáticas lineales derechas

Para los no terminales , , terminal y la cadena vacía , todas las reglas tienen la forma: $B$ $C$ $a$ $\varepsilon$

$B \rightarrow a$
$B \rightarrow aC$
$B \rightarrow \varepsilon$

Gramáticas lineales izquierdas

Izquierda lineal gramáticas son los mismos, pero la regla # 2 es . $B \rightarrow Ca$

Cosas para reflexionar

Entonces, mirando estas definiciones y jugando con ellas, podemos ver que las expresiones regulares se parecen a reglas coincidentes, o formas de tratar las cadenas de a poco.

Las gramáticas parecen "etiquetar" secciones de la cadena y agrupar etiquetas bajo nuevas etiquetas para validar la cadena (es decir, si podemos pasar de a la cadena, o viceversa, estamos contentos). $S$

Sin embargo, estos realmente están haciendo lo mismo fundamental, y la forma en que veas la metáfora de su función depende de ti.

Luke Mathieson
fuente

Pondría más énfasis en el hecho de que las gramáticas generan cadenas en el lenguaje, mientras que las expresiones regulares (como dijiste) son más un patrón coincidente que coincide (o "prueba") con cada cadena en el lenguaje.

Ran G.

@RanG., Esa es de hecho la forma habitual de pensarlo, pero puedes dar la vuelta a ambos; el análisis de abajo hacia arriba prueba una cadena contra una gramática, y puede usar una expresión regular como una descripción compacta de un lenguaje (aunque esto es probablemente menos común).

Luke Mathieson el

@simpleBob es el conjunto de no terminales, es el no terminal inicial. ¿Cuál sería ?

N

$N$

S

$S$

R

$R$

Luke Mathieson

@LukeMathieson Mi error, leí el párrafo y pensé que era un error tipográfico con debido al orden en que se definióAhora que he leído la definición formal en otra parte, parece que el error tipográfico era que debería ser (creo) (segunda línea en el primer párrafo de las gramáticas regulares)

N

$N$

R

$R$

R

$R$

P

$P$

Daniel

@simpleBob, Ah sí, definitivamente es un error tipográfico. ¡Gracias!

Luke Mathieson

Diferencia entre expresión regular y gramática en autómatas

Respuestas: