Cuando escribo documentación, comentarios, etc. Me encanta hacer tablas ASCII. Por lo general, terminan viéndose bastante bien, pero siempre siento que podrían verse aún mejor, especialmente porque UTF-8 / Unicode incluye los caracteres de dibujo de caja . Sin embargo, estos caracteres son muy pesados de usar y requieren varias pulsaciones de teclas para insertar. ¿Tu tarea? Escriba un programa o una función que pueda convertir automáticamente tablas ASCII al equivalente UTF-8 / Unicode.

Este desafío fue sandboxed .

Desafío

Escriba un programa que, dada una tabla ASCII como una cadena de entrada, muestre la tabla redibujada con los caracteres de dibujo de cuadro Unicode / UTF-8. Específicamente, los caracteres que forman parte de la tabla deben traducirse de la siguiente manera:

(Unicode, 3 bytes each in UTF-8)
- to ─ (\u2500)
| to │ (\u2502)
= to ═ (\u2550)

and + to one of:
   ┌ (\u250C), ┐ (\u2510), └ (\u2514), ┘ (\u2518),
   ├ (\u251C), ┤ (\u2524), ┬ (\u252C), ┴ (\u2534),
   ┼ (\u253C)
or, if '=' on either side:
   ╒ (\u2552), ╕ (\u2555), ╘ (\u2558), ╛ (\u255D),
   ╞ (\u255E), ╡ (\u2561), ╤ (\u2564), ╧ (\u2567),
   ╪ (\u256A)

Detalles

E / S:

Se permite E / S predeterminada
Puede tomar la entrada en cualquier formato razonable, incluida la tabla como una cadena, o una ruta a un archivo que contiene la tabla.
Puede generar un archivo y tomar el nombre del archivo como argumento adicional.
- Sin embargo, no puede modificar el archivo de entrada . (Debe conservarse para facilitar la edición futura)

Entrada:

Puede suponer que cada fila de entrada se ha rellenado para tener la misma longitud .
No puede suponer que el primer carácter después de una nueva línea es parte de los bordes de la tabla (ya que puede ser un espacio en blanco).
La entrada se considera una tabla válida si todos los caracteres (que forman parte de la tabla) -=|están conectados a exactamente dos caracteres y+ están conectados a al menos un carácter tanto horizontal como verticalmente.
Su programa puede no producir ningún error con entradas válidas.
Si la entrada no es válida, el comportamiento es indefinido y puede producir cualquier salida.
La entrada puede contener caracteres UTF-8, incluidos los caracteres de dibujo de recuadro.

Salida:

Cualquiera de los caracteres -=|+que no forman parte de la tabla debe dejarse como está.
Del mismo modo, cualquier otro personaje debe dejarse como está.
Se permite una nueva línea inicial y / o final.

Otro:

Las lagunas estándar están prohibidas, como de costumbre.
Si su idioma preferido tiene una función integrada que resuelve este problema, no puede usarlo.
- Esto significa programas, funciones, subrutinas o instrucciones que serían presentaciones válidas para este desafío sin adiciones.
Cada uno de los caracteres necesarios en este desafío tiene una longitud de tres bytes cuando están codificados en UTF-8.

Personajes conectados :

Un personaje está conectado a otro, si:

Está |y está directamente arriba o abajo +o |;
Es -y es directamente antes o después +o -;
Es =y es directamente antes o después +o =;
Está +y está directamente arriba o abajo |o +, o está directamente antes o después -, =o +.

Un personaje se considera parte de la tabla, si está conectado a algún personaje que sea parte de la tabla. Por definición, el primero +en la entrada es una parte de la tabla.

Ejemplos

Ejemplos disponibles aquí como una versión copiable y pastable.

 Input:                    Output:
+------------------+      ┌──────────────────┐
|   Hello+World!   |      │   Hello+World!   │
+==================+      ╞══════════════════╡
| This is+my first |  ->  │ This is+my first │
|+-+ code|golf  +-+|      │+-+ code|golf  +-+│
|+-+chall|enge! +-+|      │+-+chall|enge! +-+│
+------------------+      └──────────────────┘

     +===+===+===+             ╒═══╤═══╤═══╕
     | 1 | 2 | 3 |             │ 1 │ 2 │ 3 │
 +---+===+===+===+         ┌───╪═══╪═══╪═══╡
 | 1 | 1 | 2 | 3 |         │ 1 │ 1 │ 2 │ 3 │
 +---+---+---+---+    ->   ├───┼───┼───┼───┤
 | 2 | 2 | 4 | 6 |         │ 2 │ 2 │ 4 │ 6 │
 +---+---+---+---+         ├───┼───┼───┼───┤
 |-3 |-3 |-6 |-9 |         │-3 │-3 │-6 │-9 │
 +===+---+---+---+         ╘═══╧───┴───┴───┘

      +-----+         ->      <Undefined>

      +-----+         ->      ┌─────┐
      +-----+                 └─────┘

+-----------------+
|  Hello, World!  |
| This is invalid |   ->      <Undefined>
|      input      |
 -----------------+

       ++++                      ┌┬┬┐
       ++++           ->         ├┼┼┤
       ++++                      └┴┴┘

       +--+
       ++++           ->      <Undefined>
       +--+

Finalmente...

Este es el código de golf , por lo que gana la menor cantidad de bytes. ¡Feliz golf!

code-golf ascii-art
fuente

En el primer ejemplo, ¿por qué +-+no se considera que los extractos consecutivos forman una tabla conectada?

recursivo el

Si una función de 16 bits puede usar un solo byte para representar ╡, ¿cómo es el recuento de bytes?

l4m2

@recursive Si te refieres a la primera Hello Worldtabla, no se considera que las tablas internas formen una tabla porque el texto dentro de la tabla debe permanecer sin cambios, y no se consideran parte de los bordes de la tabla externa ya que no están conectadas a ellas correctamente.

Si te refieres al primer +----+ejemplo, sería porque la dirección de las esquinas sería ambigua.

1

Oh, el requisito de "no hay tablas dentro de las tablas a menos que se conecten para extender la tabla más externa posible" hace que esto sea mucho más difícil.

Jonathan Allan

2

Python 3, 392 281 bytes

Lo jugué un poco más y lo convertí en una solución recursiva en lugar de una iterativa:

def h(a):
 def g(i):
  k=-3;d=a[i]=='=';z[i]=''
  for p,j,r in zip((1,2,4,8),(i+1,i+w,i-1,i-w),('+-=','+|')*2):
   if 0<=j<len(a)and{a[i],a[j]}<={*r}:k+=p;d|=a[j]=='=';z[j]and g(j)
  z[i]="┌╒!!─═┐╕┬╤@@└╘││├╞┘╛┴╧┤╡┼╪"[2*k+d]
 w=a.find('\n')+1;z=[*a];g(a.find('+'))
 return''.join(z)

Toma una cadena de filas de igual longitud separadas por nuevas líneas y devuelve una cadena en el mismo formato. Puede lanzar una excepción en una entrada no válida.

Solución previa:

def h(a):
 i=a.find('+');q=[i];w=a.find('\n')+1;z=[*a]
 while q:
  i=q.pop();c=a[i];k=-5
  for p,j in enumerate((i+1,i-1,i+w,i-w)):
   r='++-|='[p>1::2]
   if 0<=j<len(a)and a[i]in r and a[j]in r:
    k+=1<<p;q+=[j][:z[j]<'─']
  z[i]='│'if c>'='else'─═'[a[i]>'-']if c>'+'else"┌╒┐╕┬╤@@└╘┘╛┴╧##├╞┤╡┼╪$$"['='in a[abs(i-1):i+2]::2][k]
 return''.join(z)

Versión sin golf:

def h(a):
    i = a.find('+')         # find index of first '+'. It is first node
    q = [i]                 # in the queue of indexes to convert to unicode
    w = a.find('\n')+1      # width of the table
    z = [*a]                # strings are immutable, so copy it to a list

    while q:                # while the queue isn't empty
        i=q.pop()           # get the next index to process
        c=a[i]              # and the associated character

        k=-5                # 'k' is the index into the unicode string, U.  The way they
                            # are encoded, the first unicode value is at index 5. 

                 # directions  E   W   S   N
        for p,j in enumerate((i+1,i-1,i+w,i-w)):  # j is the index of an adjacent cell

            # r='++-|='[p>1::2] is equivalent to:
            if p > 1:
                r = '+|'    # compatible symbols for vertical connections
            else:
                r = '+-='   # compatible symbols for horizontal connections

            # if adjacent cell index is valid and the characters are compatible
            if 0 <= j < len(a) and a[i] in r and a[j] in r:
                k += 1<<p                 # update the unicode symbol index

                # q += [j][:z[j]<'─'] is equivalent to:
                if z[j] < '-':            # if the adjacent cell hasn't been converted already
                    q.append(j)           #  append it's index to the queue

            if c > '=':
                z[i] = '│'                # replace a '|' with a '│'

            elif c > '+':
                z[i] = '─═'[a[i]>'-']     # replace a '-' or '=' with '─' or '═' respectively 

            else:                                      # it's a '+'
                U = "┌╒┐╕┬╤@@└╘┘╛┴╧##├╞┤╡┼╪$$"         # even indexes are single horizontal line, 
                                                       # double horizontal lines are at odd indexes

                z[i] = U['='in a[abs(i-1):i+2]::2][k]  # '='in a[abs(i-1):i+2] is true if there is an '=' to the left or right
                                                       # so this selects the odd chars from U
                                                       #  then [k] selects the correct char

 return''.join(z)

RootTwo
fuente

3

Python 3 , 914 898 827 823 594 587 569 540 469 bytes

Editar: cambió significativamente la estrategia, ahora haciendo un campo de bits de vecinos (similar a la respuesta de dead-zarigüeya). He dejado la versión anterior a continuación.

H='─│═-|=└╘++++┌╒├╞++┘╛++┴╧┐╕┤╡┬╤┼╪'
def n(l):
 def j(r,c,t=0):O=(0,r-1,c),(1,r,c+1),(2,r+1,c),(3,r,c-1);v=f(r,c);b=t|any(f(Y,X)=='='for i,Y,X in O);l[r][c]={'+':H[b+2*sum((f(Y,X)in H)<<x for x,Y,X in O)],**dict(zip(H[3:6],H))}.get(v,v);[f(Y,X)!=';'and v in'+++-|='[i%2::2]and j(Y,X,v=='=')for i,Y,X in O]
 for i,I in enumerate(l):
  if'+'in I:f=lambda r,c:l[r][c]if len(l)>r>=0and 0<=c<len(l[r])else';';j(i,I.index('+'));break

Pruébalo en línea!

La entrada tiene la forma de una lista de listas de caracteres, que se modifica en su lugar. Recurre desde el primer + que encuentra.

x=range
C='┌┐└┘','╒╕╘╛'
D='┬┤┴├','╤╡╧╞'
A='┼╪'
H,V,T='─│═'
J={'-':H,'|':V,'=':T}
K=C[1]+D[1]+A[1]+'='+T
E=('+|','+-=')*2
F=['+|'+V,'+-='+H+T]*2
O=(0,-1,0),(1,0,1),(2,1,0),(3,0,-1)
for i in x(4):
 for j in{0,1,2,3}-{i}:F[i+2&3]+=D[0][j]+D[1][j]
 h=C[0][i]+C[1][i];F[i&2]+=h;F[3-2*(i&1)]+=h
def n(l):
 for i,I in enumerate(l):
  if'+'in I:r=i;c=I.index('+');break
 else:return l
 def f(r,c):
  try:assert c>=0 and r>=0;return l[r][c]
  except:return'\0'
 def j(r,c):
  v=f(r,c)
  l[r][c]=J.get(v,v)
  if v=='+':
   X=[f(r+Y,c+X)for i,Y,X in O];B=any(x in K for x in X);X=[X[x]in F[x]for x in x(4)];L=sum(X)
   if L in(2,3,4):l[r][c]=D[B][X.index(False)]if L==3 else C[B][X[0]*2+X[3]]if L==2 else A[B]
  for i,Y,X in O:
   if v in E[i]and f(r+Y,c+X)in E[i]:j(r+Y,c+X)
 j(r,c);return l

Pruébalo en línea!

Esto es lo más parecido que tengo a una versión sin golf:

def tr(s):
    t='┌┐└┘','╒╕╘╛'
    t2='┬┤┴├','╤╡╧╞'
    A = '┼','╪'
    H,V,T = '─│═'
    Th = ''.join(x[1]for x in (t,t2,A))+'='+T
    ps = ['+|'+V, '+-='+H+T, '+|'+V, '+-='+H+T]
    ps2 = ('+|', '+-=')*2
    for i in range(4):
        for j in {0,1,2,3}-{i}:
            ps[(i+2)%4] += t2[0][j]+t2[1][j]
        h=t[0][i] + t[1][i]
        ps[i & 2] += h
        ps[3 - 2 * (i & 1)] += h

    l = [list(x) for x in s.split('\n')]
    r = 0
    for i,I in enumerate(l):
        if'+'in I:
            r=i;c=I.index('+')
            break
    def g(r,c): return l[r][c]
    def G(r,c):
        if r >= 0 and r < len(l) and c >= 0 and c < len(l[r]):
            return g(r,c)
        return '\0'
    def process(r,c):
        v = g(r,c)
        if v == '-': l[r][c] = H
        elif v == '|': l[r][c] = V
        elif v == '=': l[r][c] = T
        elif v == '+':
            all=[G(r-1,c),G(r,c+1),G(r+1,c),G(r,c-1)]
            bold=any(x in Th for x in all)
            for i in range(4):all[i] = all[i] in ps[i]
            N,E,S,W=all
            tt=sum(all)
            if tt == 3:
                l[r][c]=t2[bold][all.index(False)]
            elif tt == 2:
                l[r][c]=t[bold][N*2+W]
            elif tt == 4:
                l[r][c]=A[bold]
            else: return
        for i,(dy,dx) in enumerate(((-1,0),(0,1),(1,0),(0,-1))):
            if v in ps2[i] and G(r+dy,c+dx) in ps2[i]:
                process(r+dy,c+dx)
    process(r,c)
    return l

pbfy0
fuente

Mejoras menores para ahorrar 9 bytes (hasta 814) bit.ly/2NOu7HF

mypetlion

Pocos más para otros 9 bytes (805 bytes ahora) bit.ly/2pYom0x

mypetlion

Hasta 763: bit.ly/2OxErsJ

mypetlion el

1

JavaScript, 311 307 bytes

X=>(O=[...X],P=(I,j=0,_=0)=>!P[I]&&(P[I]=1,['-─1','|│','=═1'].map(([a,b,n=X.indexOf('\n')+1])=>[-n,+n].map(n=>{for(i=I;X[i+=n]==a;)O[i]=b
if(X[i]=='+')j|=[1,2,4,8,I-i>1&&17,i-I>1&&18][_],P(i)
_++})),O[I]='┘└┴ ┐┌┬ ┤├┼     ╛╘╧ ╕╒╤ ╡╞╪'[j-5]),P(X.indexOf`+`),O.join``)

Mostrar fragmento de código

f=
X=>(W=X.indexOf('\n')+1,O=[...X],P=(I,j=0,_=0)=>!P[I]&&(P[I]=1,['-─1','|│','=═1'].map(([a,b,n=W])=>[-n,+n].map(n=>{for(i=I;X[i+=n]==a;O[i]=b);if(X[i]=='+')j|=[1,2,4,8,I-i>1&&17,i-I>1&&18][_],P(i);_++})),O[I]='┘└┴ ┐┌┬ ┤├┼     ╛╘╧ ╕╒╤ ╡╞╪'[j-5]),P(X.indexOf`+`),O.join``)


console.log(
f(
`+------------------+
|   Hello+World!   |
+==================+
| This is+my first |
|+-+ code|golf  +-+|
|+-+chall|enge! +-+|
+------------------+`
))

console.log(
f(
`     +===+===+===+
     | 1 | 2 | 3 |
 +---+===+===+===+
 | 1 | 1 | 2 | 3 |
 +---+---+---+---+
 | 2 | 2 | 4 | 6 |
 +---+---+---+---+
 |-3 |-3 |-6 |-9 |
 +===+---+---+---+`
))

console.log(
f(
`+-----+
+-----+`))

console.log(
f(
`++++
++++
++++`))

Expandir fragmento

Explicación

Comenzando en el primer +cruce encontrado , el programa intenta encontrar caminos a otros cruces en todas las direcciones, realizando reemplazos a medida que avanza. Almacena las direcciones encontradas y el estado de "doble borde" en un mapa de bits, que luego determina el carácter de unión apropiado.

// Take an input string X
f = X => {
    // Copy the input string into an array so characters can be overwritten and eventually output
    O = [...X]

    // Define a function that processes a junction ("+" symbol) at index I in the input string X:
    P = I => {
        // Make a bitmap to keep track of the direction coming out of the junction and double borders
        // Bits from right to left: west, east, north, south, double border
        // E.g. a double-bordered south/east junction corresponds to the binary number 11010 ("╒")
        let j = 0

        // A counter
        let _ = 0

        // Ensure this junction hasn't already been processed
        if(!P[I]){
            P[I] = 1,

            // We'll walk away from the junction in each of the four directions, then west and east again to check for double borders
            // i.e. walk along `a`, replace with `b`, move index `i` by `n`
            // 1st pass: walk along "-", replace with "─", move index by 1
            // 2nd pass: walk along "|", replace with "│", move index by the width of the input (plus 1 for the newline) to traverse vertically
            // 3rd pass: walk along "=", replace with "═", move index by 1
            ['-─1','|│','=═1'].map(([a, b, n = X.indexOf('\n') + 1])=>
                // We'll walk in the negative and positive directions for each pass
                [-n,+n].map(n=>{
                    // Start the walk
                    i=I
                    // Keep walking (incrementing by n) as long as we're on a "path" character, "a"
                    while(i += n, X[i] == a)
                        // Replace the corresponding character in the output with "b"
                        O[i] = b

                    // Upon reaching another junction at index i:
                    if(X[i] == '+'){
                        // OR the bitmap according to the direction we walked
                        j |= [
                            // Pass 1: Horizontal
                            1, // west
                            2, // east

                            // Pass 2: Vertical
                            4, // north
                            8, // south

                            // Pass 3: Double Horizontal (only if we've walked more than 1 step)
                            I-i > 1 && 17, // west, double border
                            i-I > 1 && 18 // east, double border
                        ][_]

                        // Process the junction we walked to
                        P(i)
                    }
                    _++
                })
            )

            // Finally, replace the "+" with a proper junction character based on the bitmap value
            O[I] = '     ┘└┴ ┐┌┬ ┤├┼     ╛╘╧ ╕╒╤ ╡╞╪'[j]
        }
    }

    // Process the first junction to kick off the recursion
    P(X.indexOf`+`)

    // Return our modified character array as a joined string
    return O.join``
}

Darrylyeo
fuente

Solucionado - Debo haber mirado el conteo de caracteres y no el conteo de bytes.

darrylyeo

1

Python 3 , 599 bytes

No soy muy bueno jugando al golf en Python 3, pero (para mi vergüenza) no pude obtener la salida normal de caracteres UTF-8 en Python 2. Así que aquí estamos.

Supongo que el único truco interesante aquí es decidir la +transformación.
He codificado todas las variantes posibles con direcciones de 4 bits. Cada bit de dirección se asemeja a la conexión a la celda vecina. Entonces 0 - sin conexión y 1 - conexión.
1111is ┼
0011is ┐
etc.
Algunas configuraciones de conexiones no son válidas y se reemplazan con valores ficticios:'012┐45┌┬8┘0┤└┴├┼'

Si alguna celda de vecino contiene =, la segunda lista se usará con líneas duplicadas.

['012┐45┌┬8┘0┤└┴├┼','012╕45╒╤8╛0╡╘╧╞╪']['='in r]

La dirección se combina aquí.

r=''.join([str(int(V(y,x)))+W(y,x)for y,x in[(Y-1,X),(Y,X+1),(Y+1,X),(Y,X-1)]])

rcontiene la longitud de cadena 8, donde cada dos caracteres son 1/0 y los caracteres reales vecinos.
Por ejemplo: 1+0y1-1|.
Esto se utiliza para elegir la lista de sustituciones como se muestra anteriormente. Y luego contratado a la dirección:int(r[0::2],2)

Esta lambda se usa para verificar que las coordenadas de la celda sean válidas y el char de la celda sea uno de '+ - | ='

V=lambda y,x:~0<x<len(I[0])and~0<y<len(I)and I[y][x]in'+-|='

Este lambda solía recibir carbón de la célula. Devuelve ' 'si las coordenadas no son válidas. (Definitivamente se puede jugar golf)

W=lambda y,x:V(y,x)and I[y][x]or' '

Condiciones de recursión. Podría ser golfable también.

if Z in'+-=':F(Y,X+1);F(Y,X-1)
if Z in'+|':F(Y-1,X);F(Y+1,X)

I=eval(input())
J=[i[:]for i in I]
V=lambda y,x:~0<x<len(I[0])and~0<y<len(I)and I[y][x]in'+-|='
W=lambda y,x:V(y,x)and I[y][x]or' '
def F(Y,X):
 if V(Y,X)and I[Y][X]==J[Y][X]:
  Z=I[Y][X]
  if','>Z:
   r=''.join([str(int(V(y,x)))+W(y,x)for y,x in[(Y-1,X),(Y,X+1),(Y+1,X),(Y,X-1)]])
   J[Y][X]=['012┐45┌┬8┘0┤└┴├┼','012╕45╒╤8╛0╡╘╧╞╪']['='in r][int(r[0::2],2)]
  else:J[Y][X]=dict(zip('|-=','│─═'))[Z]
  if Z in'+-=':F(Y,X+1);F(Y,X-1)
  if Z in'+|':F(Y-1,X);F(Y+1,X)
e=enumerate
F(*[(y,x)for y,r in e(I)for x,c in e(r)if'+'==c][0])
for r in J:print(''.join(r))

Pruébalo en línea!

Zarigüeya muerta
fuente

Convierta una tabla de arte ASCII en una tabla UTF-8

Desafío

Detalles

Ejemplos

Finalmente...

Respuestas:

Python 3, 392 281 bytes

Python 3 , 914 898 827 823 594 587 569 540 469 bytes

JavaScript, 311 307 bytes

Explicación

Python 3 , 599 bytes