Utilidad reversible de volcado hexadecimal (también conocido como `xxd`)

12

xxdes una utilidad, incluida vim, que se ha utilizado para codificar respuestas a problemas de código de golf en este sitio. Convierte un archivo binario en un volcado hexadecimal y viceversa.

Implemente los comandos xxdy xxd -ren los lenguajes de programación que elija. La puntuación se basa en las longitudes de caracteres / bytes de a) sus programas yb) cualquier argumento de línea de comando necesario para cambiar un programa combinado entre modos (no es necesario que lo sean -r). Como en el golf, los puntajes más bajos son mejores.

  • Para dos programas separados: código directo + código inverso
  • Para un programa combinado: código combinado + suma ( argumentos directos ) + suma ( argumentos inversos ) - 2

Especificación del xxdsubconjunto elegido

El comando de reenvío ( por ejemplo xxd ) acepta 0 ≤ n ≤ 2 16 bytes de la entrada estándar y genera líneas ceil ( n / 16) de salida estándar en el siguiente formato (todos los dígitos hexadecimales):

  • Desplazamiento del primer byte codificado (cadena de formato "%07x:"); termina en"0"
  • Como máximo 16 bytes codificados en hexadecimal, agrupados en pares (cadena de formato " %02x"para bytes pares, "%02x"para bytes impares) y rellenados a la derecha con espacios de 42 caracteres
  • Los bytes codificados interpretados como caracteres ASCII, valores que no están entre 0x20 y 0x7e ( '\40'y '\176') inclusive"."
  • Una nueva línea ( "\n"; "\r\n"permitida cuando la salida estándar está en modo binario)

Implementación mínima de C sin golf:

#include <stdio.h>
int main() {
    unsigned char L[16];
    int t = 0, n, i, s;

    for (; (n = fread(L, 1, 16, stdin)); t += n) {
        printf("%07x:", t);
        s = 42;
        for (i = 0; i < n; i++)
            s -= printf(i & 1 ? "%02x" : " %02x", L[i]);
        printf("%*s", s, "");
        for (i = 0; i < n; i++)
            putchar(L[i] > '\37' && L[i] < '\177' ? L[i] : '.');
        printf("\n");
    }

    return 0;
}

El comando inverso ( por ejemplo xxd -r ) acepta cualquier salida no modificada del comando de reenvío (dada una entrada válida para ese comando) y produce esa entrada original.

Ejemplo de uso

$ xxd < /dev/null | wc -c
0
$ php -r 'echo join(range("\0",~"\0"));' | xxd
0000000: 0001 0203 0405 0607 0809 0a0b 0c0d 0e0f  ................
0000010: 1011 1213 1415 1617 1819 1a1b 1c1d 1e1f  ................
0000020: 2021 2223 2425 2627 2829 2a2b 2c2d 2e2f   !"#$%&'()*+,-./
0000030: 3031 3233 3435 3637 3839 3a3b 3c3d 3e3f  0123456789:;<=>?
0000040: 4041 4243 4445 4647 4849 4a4b 4c4d 4e4f  @ABCDEFGHIJKLMNO
0000050: 5051 5253 5455 5657 5859 5a5b 5c5d 5e5f  PQRSTUVWXYZ[\]^_
0000060: 6061 6263 6465 6667 6869 6a6b 6c6d 6e6f  `abcdefghijklmno
0000070: 7071 7273 7475 7677 7879 7a7b 7c7d 7e7f  pqrstuvwxyz{|}~.
0000080: 8081 8283 8485 8687 8889 8a8b 8c8d 8e8f  ................
0000090: 9091 9293 9495 9697 9899 9a9b 9c9d 9e9f  ................
00000a0: a0a1 a2a3 a4a5 a6a7 a8a9 aaab acad aeaf  ................
00000b0: b0b1 b2b3 b4b5 b6b7 b8b9 babb bcbd bebf  ................
00000c0: c0c1 c2c3 c4c5 c6c7 c8c9 cacb cccd cecf  ................
00000d0: d0d1 d2d3 d4d5 d6d7 d8d9 dadb dcdd dedf  ................
00000e0: e0e1 e2e3 e4e5 e6e7 e8e9 eaeb eced eeef  ................
00000f0: f0f1 f2f3 f4f5 f6f7 f8f9 fafb fcfd feff  ................
$ xxd <<< 'The quick brown fox jumps over the lazy dog.'
0000000: 5468 6520 7175 6963 6b20 6272 6f77 6e20  The quick brown 
0000010: 666f 7820 6a75 6d70 7320 6f76 6572 2074  fox jumps over t
0000020: 6865 206c 617a 7920 646f 672e 0a         he lazy dog..
$ xxd <<< 'The quick brown fox jumps over the lazy dog.' | xxd -r
The quick brown fox jumps over the lazy dog.
Por favor levantese
fuente
¿Debería el modo inverso ignorar caracteres ASCII incorrectos? (FWIW lo hace el xxd real, lo cual es bastante útil).
Peter Taylor
@PeterTaylor: el modo inverso solo tiene que funcionar correctamente con volcados hexadecimales no modificados (comience en 0000000, dígitos hexadecimales en minúsculas, 16 bytes en todas las líneas pero la última, sin espacios, etc. ), y no se requiere validación de entrada. Dicho esto, probablemente tenga sentido ignorar la columna "ASCII" de 16 caracteres a la derecha, porque no se puede usar para distinguir "". y caracteres no imprimibles.
favor

Respuestas:

3

Perl, 122 + 54 = 176122 + 45 = 167

El guión hacia adelante:

$/=$,;for(<>=~/.{1,16}/gs){$h="";$h.=sprintf"%*s%02x",++$m%2,"",ord for/./gs;
s/[^ -~]/./g;printf"%06x0:%-42s",$n++,$h;say}

Y el guión inverso:

/:(.+?)  /,print map{chr hex}$1=~/\w\w/gfor<>

(Este es interesante; hay todo tipo de errores oscuros que pueden aparecer en el script inverso dependiendo de la entrada, si no tienes cuidado).

caja de pan
fuente
Como $1solo se sabe que contiene dígitos hexadecimales y espacios, ¿no puedes usarlos en /\w\w/lugar de /[0-9a-f]{2}/?
Neil
$1contiene muchas cosas además de dígitos hexadecimales y espacios.
breadbox
En el ejemplo, solo veo dígitos hexadecimales y espacios entre el : y el ``.
Neil
(¿Alguien sabe cómo generar dos espacios monoespaciales en la reducción de comentarios?)
Neil
@Neil No importa, he leído mal mi propio código. Ahora no recuerdo por qué no solo usé /\w\w/. Parece tan obvio que siento que debo haber tenido una razón, pero no puedo ver una. Mi mejor conjetura es que era un remanente de una versión que intentaba evitar requerir la expresión regular inicial.
breadbox