¿Es el conjunto de todas las palabras primitivas un idioma principal?

17

Una palabra ww se llama primitiva , si no hay una palabra vv y k > 1, dek>1 modo que w = v kw=vk . El conjunto QQ de todas las palabras primitivas sobre un alfabeto ΣΣ es un lenguaje bien conocido. WLOG podemos elegir Σ = { a , b }Σ={a,b} .

Un lenguaje LL es primo , si para cada idioma AA y BB con L = A BL=AB tenemos A = { ϵ }A={ϵ} o B = { ϵ }B={ϵ} .

¿Q es primo?

Con la ayuda de un solucionador SAT, podría demostrar que tenemos o ya que de lo contrario no se puede factorizar en{ a , b } A {a,b}A{ a , b } B {a,b}B{ a b a b a , b a b a b } Q {ababa,babab}QAA y BB , pero han estado atrapados desde entonces.

Henning
fuente

Respuestas:

13

La respuesta es sí. Supongamos que tenemos una factorización Q = A BQ=AB .

Una observación fácil es que AA y BB deben ser disjuntos (ya que para w A BwAB obtenemos w 2Qw2Q ). En particular, solo uno de A , BA,B puede contener ϵϵ . Podemos suponer sin pérdida de generalidad (desde el otro caso es completamente simétrica) que varepsilon BϵB . A continuación, desde unaa y bb no se puede factorizar en factores que no estén vacíos, debemos tener una , b Aa,bA .

A continuación, obtenemos que a m b nAambnA (y, de forma completamente análoga, b m a nAbmanA ) para todos m , n > 0m,n>0 por inducción en mm :

Para m = 1m=1 , ya que un b nQabnQ , debemos tener un b n = u vabn=uv con u A , v BuA,vB . Como u ϵuϵ , vv debe ser b kbk para algunos k nkn . Pero si k > 0k>0 , entonces desde b AbA obtenemos b 1 + kQb1+kQ , contradicción. Entoncesv = εv=ϵ , y un b nAabnA .

Para la etapa inductiva, ya que una m + 1 b nQam+1bnQ tenemos un m + 1 b n = u vam+1bn=uv con u A , v BuA,vB . Como nuevamente u ϵuϵ , tenemos v = a k b nv=akbn para algunos 0 < k < m + 10<k<m+1 , o v = b kv=bk para algunos k <nk<n . Pero en el primer caso, vv ya está en AA por la hipótesis de inducción, entonces v 2Qv2Q , contradicción. En este último caso, hay que tener k = 0k=0 (es decir, v = εv=ϵ ) ya que desde b AbA obtenemos b 1 + kQb1+kQ . Así u = un m + 1 b nAu=am+1bnA .

Consideremos ahora el caso general de palabras primitivas con rr alternancias entre unaa y bb , es decir, ww es o bien un m 1 b n 1 ... un m s b n sam1bn1amsbns , b m 1 a n 1 ... b m es un n sbm1an1bmsans (para r = 2 s - 1r=2s1 ), a m 1 b n 1a m s+ 1am1bn1ams+1 , ob m 1 a n 1b m s + 1bm1an1bms+1 (parar=2sr=2s); podemos demostrar que todos están enAAusando la inducción enrr. Lo que hicimos hasta ahora cubierto los casos baser=0r=0yr=1r=1.

Para r > 1r>1 , usamos otra inducción en m 1m1 , que funciona de manera muy similar a la de r = 1r=1 anterior:

Si m 1 = 1m1=1 , entonces w = u vw=uv con u A , v BuA,vB , y como u ϵuϵ , vv tiene menos de rr alternancias. Entonces vv (o su raíz en caso de que vv no sea primitivo) está en AA por la hipótesis de inducción en rr para una contradicción como la anterior, a menos que v = ϵv=ϵ . Así w = u Aw=uA .

Si m 1 > 1m1>1 , en cualquier factorización w = u vw=uv con u ϵuϵ , vv tiene menos alternancias (y su raíz está en A aA menos que v = ϵv=ϵ por la hipótesis de inducción en rr ), o un primer bloque más corto (y su la raíz está en A a menos que v = ϵv=ϵ por la hipótesis de inducción en m 1m1 ). En cualquiera de los casos que conseguir que debemos tener v = εv=ϵ , es decir w = u Aw=uA .


El caso de Q : = Q { ϵ }Q:=Q{ϵ} es bastante más complicado. Las cosas obvias a tener en cuenta son que en cualquier descomposición Q = A BQ=AB , tanto AA como BB deben ser subconjuntos de Q Q con A B = { ϵ }AB={ϵ} . También, un , ba,b debe estar contenido en A BAB .

Con un poco de trabajo extra, se puede mostrar que unaa y Bb deben estar en el mismo subconjunto. De lo contrario, asumir sin pérdida de generalidad que un AaA y b BbB . Digamos que w Q wQ tiene una factorización adecuada si w = u vw=uv con u A { ϵ }uA{ϵ} y v B { ϵ }vB{ϵ} . Tenemos dos subcasas (simétricas) dependiendo de dónde va b aba (debe estar enAA or BB since it has no proper factorization).

  • If baAbaA, then abaaba has no proper factorization since ba,aB. Since abaA would imply ababAB, we get abaB. As a consequence, bab is neither in A (which would imply bababaAB) nor in B (which would imply ababAB). Now consider the word babab. It has no proper factorization since babAB and abab,baba are not primitive. If bababA, then since abaB we get (ba)4AB; if bababB, then since aA we get (ab)3AB. So there is no way to have bababAB, contradiction.
  • The case baB is completely symmetric. In a nutshell: bab has no proper factorization and cannot be in B, so it must be in A; therefore aba cannot be in A or B; therefore ababa has no proper factorization but also cannot be in either A or B, contradiction.

I am currently not sure how to proceed beyond this point; it would be interesting to see if the above argument can be systematically generalized.

Klaus Draeger
fuente
Wow, you have my respect. I'll go through it later today or tomorrow as I don't have time right now, but I am seriously impressed :) It took me a few hours to get that {a, b} are in A but I didn't exploit that \epsilon is not a primitive word. How did you approach this problem (or was it "just do it"?)? How long did it take you to come up with that proof?
Henning
Thanks! I got the main idea (showing that any nonempty proper suffix of words must be in A) by thinking about what happens to some "simple" words. ϵ,a, and b were relatively straightforward, an or bn were out of the question, and considering ab,abb,abbb, got me on the right path.
Klaus Draeger
4
Your proof is beautiful and not as hard as I thought (I feel quite stupid now, I spent some time thinking about it). However it seems to heavily relay on epsilon not being element of Q. Is Q{ϵ} also prime?
Henning
1
Good question! I'll have to get back to you on that one.
Klaus Draeger
2
Thanks for the comments, and sorry for the delay. The case where we want to include the empty word seems to be more complicated, see update.
Klaus Draeger