Cifrado simple para personas con un presupuesto de bytes

17

Visión general

Su objetivo es implementar el cifrado RC4. El cifrado RC4, inventado por Ron Rivest (de la fama RSA), fue diseñado para ser seguro, pero lo suficientemente simple como para ser implementado desde la memoria por soldados militares en el campo de batalla. Hoy en día, hay varios ataques contra RC4, pero todavía se usa en muchos lugares hoy.

Su programa debe aceptar una sola cadena con una clave y algunos datos. Se presentará en este formato.

\x0Dthis is a keythis is some data to encrypt

El primer byte representa la longitud de la clave. Se puede suponer que la clave no tendrá más de 255 bytes y no menos de 1 byte. Los datos pueden ser arbitrariamente largos.

Su programa debe procesar la clave y luego devolver los datos cifrados. El cifrado y descifrado RC4 son idénticos, por lo que usar la misma clave para "cifrar" el texto cifrado debería devolver el texto sin formato original.

Cómo funciona RC4

Inicialización

La inicialización de RC4 es bastante simple. Una matriz de estado de 256 bytes se inicializa en todos los bytes de 0 a 255.

S = [0, 1, 2, 3, ..., 253, 254, 255]

Procesamiento de claves

Los valores en el estado se intercambian según la clave.

j = 0
for i from 0 to 255
    j = (j + S[i] + key[i mod keylength]) mod 256
    swap S[i] and S[j]

Cifrado

El cifrado se logra utilizando el estado para generar bytes pseudoaleatorios, que luego son XOR'd a los datos. Los valores en el estado se intercambian constantemente.

i = j = 0
for each byte B in data
    i = (i + 1) mod 256
    j = (j + S[i]) mod 256
    swap S[i] and S[j]
    K = S[(S[i] + S[j]) mod 256]
    output K XOR B

Entradas y salidas esperadas

Los caracteres no imprimibles se mostrarán en \xABformato.

Entrada: \x01\x00\x00\x00\x00\x00\x00
Salida: \xde\x18\x89A\xa3
Salida (hexadecimal):de188941a3

Entrada: \x0Dthis is a keythis is some data to encrypt
Salida: \xb5\xdb?i\x1f\x92\x96\x96e!\xf3\xae(!\xf3\xeaC\xd4\x9fS\xbd?d\x82\x84{\xcdN
Salida (hexadecimal):b5db3f691f9296966521f3ae2821f3ea43d49f53bd3f6482847bcd4e

Entrada: \x0dthis is a key\xb5\xdb?i\x1f\x92\x96\x96e!\xf3\xae(!\xf3\xeaC\xd4\x9fS\xbd?d\x82\x84{\xcdN
Entrada (hexadecimal): 0d746869732069732061206b6579b5db3f691f9296966521f3ae2821f3ea43d49f53bd3f6482847bcd4e
Salida:this is some data to encrypt

Entrada: Sthis is a rather long key because the value of S is 83 so the key length must matchand this is the data to be encrypted
Salida: \x96\x1f,\x8f\xa3%\x9b\xa3f[mk\xdf\xbc\xac\x8b\x8e\xfa\xfe\x96B=!\xfc;\x13`c\x16q\x04\x11\xd8\x86\xee\x07
Salida (hexadecimal):961f2c8fa3259ba3665b6d6bdfbcac8b8efafe96423d21fc3b13606316710411d886ee07

Daffy
fuente
¿Qué modo de salida desea o podemos elegir cuál? Se preferiría el
maleficio
@andrewarchi Se supone que la salida está en bytes, por lo que se puede volver a descifrar.
Daffy
1
¿Podemos también tomar la entrada como una matriz de bytes?
Arnauld
1
@andrewarchi Esas anotaciones eran solo para facilitar la lectura. Si se supone que su programa saldrá\xde , entonces debe tener 1 byte de largo, y convertirlo a un número (a través de Python ord()o JavaScript .charCodeAt(0)) debería devolver 222 (0xDE).
Daffy
1
@Arnauld Teniendo en cuenta que los dos son básicamente indistinguibles en muchos idiomas, sí.
Daffy

Respuestas:

3

JavaScript (ES6), 169168 bytes

Toma la entrada como una matriz de bytes. Devuelve otra matriz de bytes.

([l,...s])=>s.slice(l).map(b=>b^S[(S[S[J=J+(t=S[I=I+1&m])&m,I]=x=S[J],J]=t)+x&m],[...S=[...Array(m=255).keys(),m]].map(i=>S[S[i]=S[j=j+(t=S[i])+s[i%l]&m],j]=t,I=J=j=0))

¿Cómo?

Esto es esencialmente una implementación literal de la especificación.

Primero dividimos la matriz de entrada en l (longitud de la clave) ys (datos de carga útil: clave + mensaje). Luego, en orden de ejecución:

  • Inicializamos la matriz de estado S y definimos m = 255 que se usa repetidamente más tarde como una máscara de bits.

    S = [...Array(m = 255).keys(), m]
  • Barajamos la matriz de estado. Los índices I y J que se inicializan aquí se usan realmente en el siguiente paso.

    [...S].map(i =>
      S[S[i] = S[j = j + (t = S[i]) + s[i % l] & m], j] = t,
      I = J = j = 0
    )
  • Aplicamos el cifrado.

    s.slice(l).map(b =>
      b ^ S[
        (S[S[J = J + (t = S[I = I + 1 & m]) & m, I] = x = S[J], J] = t) +
        x & m
      ]
    )
    

Casos de prueba

Arnauld
fuente
13

138 bytes, código de máquina (16 bits x86)

000000 88 9f 00 02 fe c3 75 f8 b9 01 00 89 fa b4 3f cd
000010 21 86 0d ba 00 03 b4 3f cd 21 89 dd 01 f6 02 9e
000020 00 03 8a 04 00 c3 86 87 00 02 88 04 46 45 39 cd
000030 75 02 31 ed 81 fe 00 03 75 e4 81 ee 00 01 31 db
000040 31 d2 ff c6 81 fe 00 03 75 04 81 ee 00 01 8a 04
000050 00 c3 88 c2 86 87 00 02 88 04 00 c2 89 d7 81 c7
000060 00 02 8a 15 89 d7 89 dd 31 db ba 00 03 b9 01 00
000070 b8 00 3f cd 21 87 fa 30 15 85 c0 74 0b 87 fa 43
000080 b4 40 cd 21 89 eb eb b8 cd 20

Ejecutando: guardar en codegolf.com, dosbox:

codegolf.com < input.bin

intento exitoso

No sé si esto contará como una entrada, pero he decidido hacerlo manualmente usando editores hexadecimales. No se usaron compiladores para hacer esto.

ht editor en realidad tiene ensamblador, pero honestamente no supe sobre esto hasta que terminé ¯ \ _ (ツ) _ / ¯

Por que y como

Por qué: principalmente porque quería comprobar si soy capaz de hacer esto.

Cómo: comencé a crear un byte lleno de NOPsy seguí con una parte simple: tratando de escribir el primer ciclo que llenaS tate con 0..255 valores. Cambié a Python y rápidamente escribí la versión de Python, solo para tener algo contra lo que probar. A continuación, estaba simplificando el código de Python en pseudocódigo / pseudo ensamblaje. Entonces yo estaba tratando de escribir piezas pequeñas. Decidí que sería más fácil leer desde stdin, así que comencé con algo pequeño que leería un solo byte, luego agregué lectura de contraseña e inicialización de clave. Averiguar qué registros elegir me llevó algo de tiempo.

Pensé que agregar el ciclo de / cifrado será fácil, pero primero obtuve una decodificación de un solo byte y luego agregué el ciclo completo.

El último paso fue deshacerme de lo adicional nopsque dejé entre las instrucciones al escribirlo (ofc que también requería corregir saltos).

Puedes ver una pequeña galería que intenté hacer mientras progresaba aquí .

Disección

El programa se basa en algunos valores iniciales después del inicio (ver recursos a continuación).

00000000 889f0002                  mov         [bx+0200], bl
00000004 fec3                      inc         bl
00000006 75f8                      jnz         0x0

rellenar estado (a 0x200)

00000008 b90100                    mov         cx, 0x1
0000000b 89fa                      mov         dx, di
0000000d b43f                      mov         ah, 0x3f
0000000f cd21                      int         0x21
00000011 860d                      xchg        [di], cl
00000013 ba0003                    mov         dx, 0300
00000016 b43f                      mov         ah, 0x3f
00000018 cd21                      int         0x21

leer longitud, leer contraseña, almacenar contraseña en ds: 0x300

0000001a 89dd                      mov         bp, bx
0000001c 01f6                      add         si, si
0000001e 029e0003                  add         bl, [bp+0300]
00000022 8a04                      mov         al, [si]
00000024 00c3                      add         bl, al
00000026 86870002                  xchg        [bx+0200], al
0000002a 8804                      mov         [si], al
0000002c 46                        inc         si
0000002d 45                        inc         bp
0000002e 39cd                      cmp         bp, cx
00000030 7502                      jnz         0x34
00000032 31ed                      xor         bp, bp
00000034 81fe0003                  cmp         si, 0300
00000038 75e4                      jnz         0x1e

Inicializar el estado con una tecla ( BPse usa para atravesar la tecla, SIse usa para atravesar el estado)

0000003a 81ee0001                  sub         si, 0100
0000003e 31db                      xor         bx, bx
00000040 31d2                      xor         dx, dx
00000042 ffc6                      inc         si
00000044 81fe0003                  cmp         si, 0300
00000048 7504                      jnz         0x4e
0000004a 81ee0001                  sub         si, 0100
0000004e 8a04                      mov         al, [si]
00000050 00c3                      add         bl, al
00000052 88c2                      mov         dl, al
00000054 86870002                  xchg        [bx+0200], al
00000058 8804                      mov         [si], al
0000005a 00c2                      add         dl, al
0000005c 89d7                      mov         di, dx
0000005e 81c70002                  add         di, 0200
00000062 8a15                      mov         dl, [di]

generar un valor pseudoaleatorio (en DL, DHes 0 thx a xor en 0x140)

00000064 89d7                      mov         di, dx      
00000066 89dd                      mov         bp, bx      
00000068 31db                      xor         bx, bx      
0000006a ba0003                    mov         dx, 0300    
0000006d b90100                    mov         cx, 0x1     
00000070 b8003f                    mov         ax, 3f00    
00000073 cd21                      int         0x21        
00000075 87fa                      xchg        dx, di      
00000077 3015                      xor         [di], dl    
00000079 85c0                      test        ax, ax      
0000007b 740b                      jz          0x88        
0000007d 87fa                      xchg        dx, di      
0000007f 43                        inc         bx          
00000080 b440                      mov         ah, 0x40    
00000082 cd21                      int         0x21        
00000084 89eb                      mov         bx, bp      
00000086 ebb8                      jmp         0x40        
00000088 cd20                      int         0x20        
  • almacenar valores que necesitamos preservar ( SI- las entradas no lo tocarán BX)
  • leer char de entrada, xor
  • salir si final de la transmisión
  • salida decodificada char
  • restaurar valores
  • bucle a 0x40 (reutilizar xor activado DX)

PD: Esto probablemente podría ser aún más corto, pero esto tomó 4 noches, así que no estoy seguro de si quiero pasar otra ...

Herramientas y recursos

GiM
fuente
4

C (gcc) , 193 188 182 178 171 172 bytes

f(x,l)int*x;{unsigned char*X=x,i=0,j=0,S[256],t;for(;S[i]=++i;);for(;t=S[i],S[i]=S[j+=t+X[1+i%*X]],S[j]=t,t=++i;);for(X+=*X;l--;S[i]-=S[t]=j)*++X^=S[S[i]+=S[t+=j=S[++i]]];}

Pruébalo en línea!

Editar: ahora funciona con claves de más de 127 bytes.

Edit2: Se agregó un caso de prueba con clave de 129 bytes al enlace TIO.

Versión ligeramente menos golfizada

f(x,l)int*x;{
  unsigned char*X=x,i=0,j=0,S[256],t;
  // initialize state
  for(;S[i]=++i;);
  // key processing
  for(;t=S[i],S[i]=S[j+=t+X[1+i%*X]],S[j]=t,t=++i;);
  // encrypt
  for(X+=*X;l--;S[i]-=S[t]=j)
    *++X^=S[S[i]+=S[t+=j=S[++i]]];
}
techo
fuente
¿No temes los errores de un compilador general de C? Es un comportamiento indefinido s [i] = ++ i? Sí, sé que posiblemente solo sea importante usar el compilador ...
RosLuP
Para lo que está escrito en "Procesamiento de clave", la clave de la parte debe ser <= 256 bytes ... (porque otros caracteres no influyen en el cálculo y los intercambios)
RosLuP
¿Y por qué no estaría bien usar char * en lugar de int * en el argumento (sí, solo menos caracteres)? Mi parece estar bien incluso para la clave de 129 bytes de longitud ... Parece un comportamiento indefinido
RosLuP
4

Conjunto de instrucciones de CPU x86, 133 bytes

000009F8  53                push ebx
000009F9  56                push esi
000009FA  57                push edi
000009FB  55                push ebp
000009FC  55                push ebp
000009FD  BF00010000        mov edi,0x100
00000A02  29FC              sub esp,edi
00000A04  8B6C3C18          mov ebp,[esp+edi+0x18]
00000A08  31DB              xor ebx,ebx
00000A0A  8A5D00            mov bl,[ebp+0x0]
00000A0D  45                inc ebp
00000A0E  31C0              xor eax,eax
00000A10  880404            mov [esp+eax],al
00000A13  40                inc eax
00000A14  39F8              cmp eax,edi
00000A16  72F8              jc 0xa10
00000A18  31F6              xor esi,esi
00000A1A  31C9              xor ecx,ecx
00000A1C  89F0              mov eax,esi
00000A1E  31D2              xor edx,edx
00000A20  F7F3              div ebx
00000A22  8A0434            mov al,[esp+esi]
00000A25  02441500          add al,[ebp+edx+0x0]
00000A29  00C1              add cl,al
00000A2B  8A0434            mov al,[esp+esi]
00000A2E  8A140C            mov dl,[esp+ecx]
00000A31  88040C            mov [esp+ecx],al
00000A34  881434            mov [esp+esi],dl
00000A37  46                inc esi
00000A38  39FE              cmp esi,edi
00000A3A  72E0              jc 0xa1c
00000A3C  8B443C1C          mov eax,[esp+edi+0x1c]
00000A40  01E8              add eax,ebp
00000A42  722F              jc 0xa73
00000A44  48                dec eax
00000A45  89C6              mov esi,eax
00000A47  01DD              add ebp,ebx
00000A49  31C0              xor eax,eax
00000A4B  31D2              xor edx,edx
00000A4D  31C9              xor ecx,ecx
00000A4F  39F5              cmp ebp,esi
00000A51  7320              jnc 0xa73
00000A53  FEC2              inc dl
00000A55  8A0414            mov al,[esp+edx]
00000A58  00C1              add cl,al
00000A5A  8A1C0C            mov bl,[esp+ecx]
00000A5D  88040C            mov [esp+ecx],al
00000A60  881C14            mov [esp+edx],bl
00000A63  00D8              add al,bl
00000A65  8A1C04            mov bl,[esp+eax]
00000A68  8A4500            mov al,[ebp+0x0]
00000A6B  30D8              xor al,bl
00000A6D  884500            mov [ebp+0x0],al
00000A70  45                inc ebp
00000A71  EBDC              jmp short 0xa4f
00000A73  01FC              add esp,edi
00000A75  5D                pop ebp
00000A76  5D                pop ebp
00000A77  5F                pop edi
00000A78  5E                pop esi
00000A79  5B                pop ebx
00000A7A  C20800            ret 0x8
00000A7D

A7D-9F8 = 85h = 133 bytes, pero no sé si el cálculo está bien porque el número de bytes de la misma función resulta 130 bytes ... El primer argumento de la función que denomino "cript" es la cadena, El segundo argumento es la longitud de la cadena (primer byte + longitud de la tecla + longitud del mensaje). Debajo está el archivo de lenguaje ensamblador para obtener las rutinas de cript:

; nasmw -fobj  this.asm

section _DATA use32 public class=DATA
global cript
section _TEXT use32 public class=CODE

cript:    
      push    ebx
      push    esi
      push    edi
      push    ebp
      push    ebp
      mov     edi,  256
      sub     esp,  edi
      mov     ebp,  dword[esp+  edi+24]
      xor     ebx,  ebx
      mov     bl,  [ebp]
      inc     ebp
      xor     eax,  eax
.1:   mov     [esp+eax],  al
      inc     eax
      cmp     eax,  edi
      jb      .1
      xor     esi,  esi
      xor     ecx,  ecx
.2:   mov     eax,  esi
      xor     edx,  edx
      div     ebx
      mov     al,  [esp+esi]
      add     al,  [ebp+edx]
      add     cl,  al
      mov     al,  [esp+esi]
      mov     dl,  [esp+ecx]
      mov     [esp+ecx],  al
      mov     [esp+esi],  dl
      inc     esi
      cmp     esi,  edi
      jb      .2
      mov     eax,  dword[esp+  edi+28]
      add     eax,  ebp
      jc      .z
      dec     eax
      mov     esi,  eax
      add     ebp,  ebx
      xor     eax,  eax
      xor     edx,  edx
      xor     ecx,  ecx
.3:   cmp     ebp,  esi
      jae     .z
      inc     dl
      mov     al,  [esp+edx]
      add     cl,  al
      mov     bl,  [esp+ecx]
      mov     [esp+ecx],  al
      mov     [esp+edx],  bl ; swap S[c] S[r]
      add     al,  bl
      mov     bl,  [esp+eax]
      mov     al,  [ebp]
      xor     al,  bl
      mov     [ebp],  al
      inc     ebp
      jmp     short  .3
.z:       
      add     esp,  edi
      pop     ebp
      pop     ebp
      pop     edi
      pop     esi
      pop     ebx
      ret     8

debajo del archivo C para ver los resultados:

// Nasmw  -fobj  fileasm.asm
// bcc32 -v filec.c fileasm.obj
#include <stdio.h>

void _stdcall cript(char*,unsigned);

char es1[]="\x01\x00\x00\x00\x00\x00\x00";
char es2[]="\x0Dthis is a keythis is some data to encrypt";
char es3[]="\x0dthis is a key\xb5\xdb?i\x1f\x92\x96\226e!\xf3\xae(!\xf3\xea\x43\xd4\x9fS\xbd?d\x82\x84{\xcdN";
char es4[]="Sthis is a rather long key because the value of S is 83 so the key length must matchand this is the data to be encrypted";

void printMSGKeyC(unsigned char* a, unsigned len)
{unsigned i,j,k;
 unsigned char *p,*end;

 printf("keylen = %u\nKey    = [", (unsigned)*a);
 for(i=1, j=*a;i<=j;++i) printf("%c", a[i]);
 printf("]\nMessage= [");
 for(p=a+i,end=a+len-1;p<end;++p)printf("%c", *p);
 printf("]\n");
}

void printMSGKeyHex(unsigned  char* a, unsigned len)
{unsigned i,j,k;
 unsigned char *p,*end;

 printf("keylen = %u\nKey    = [", (unsigned)*a);
 for(i=1, j=*a;i<=j;++i) printf("%02x", a[i]);
 printf("]\nMessage= [");
 for(p=a+i,end=a+len-1;p<end;++p)printf("%02x", *p);
 printf("]\n");
}


main()
{printf("sizeof \"%s\"= %u [so the last byte 0 is in the count]\n", "this", sizeof "this");

 printf("Input:\n");
 printMSGKeyHex(es1, sizeof es1);
 cript(es1,  (sizeof es1)-1);
 printf("Afther I cript:\n");
 printMSGKeyHex(es1, sizeof es1);

 printf("Input:\n");
 printMSGKeyC(es2, sizeof es2);
 printMSGKeyHex(es2, sizeof es2);
 cript(es2,  (sizeof es2)-1);
 printf("Afther I cript:\n");
 printMSGKeyC(es2, sizeof es2);
 printMSGKeyHex(es2, sizeof es2);
 cript(es2,  (sizeof es2)-1);
 printf("Afther II cript:\n");
 printMSGKeyC(es2, sizeof es2);
 printMSGKeyHex(es2, sizeof es2);
 printf("----------------------\n");

 printf("Input:\n");
 printMSGKeyHex(es3, sizeof es3);
 cript(es3,  (sizeof es3)-1);
 printf("Afther I cript:\n");
 printMSGKeyHex(es3, sizeof es3);
 printf("----------------------\n");

 printf("Input:\n");
 printMSGKeyHex(es4, sizeof es4);
 cript(es4,  (sizeof es4)-1);
 printf("Afther I cript:\n");
 printMSGKeyHex(es4, sizeof es4);
 cript(es4,  (sizeof es4)-1);
 printf("Afther II cript:\n");
 printMSGKeyHex(es4, sizeof es4);

 return 0;
}

Los resultados:

 sizeof "this"= 5 [so the last byte 0 is in the count]
Input:
keylen = 1
Key    = [00]
Message= [0000000000]
Afther I cript:
keylen = 1
Key    = [00]
Message= [de188941a3]
Input:
keylen = 13
Key    = [this is a key]
Message= [this is some data to encrypt]
keylen = 13
Key    = [746869732069732061206b6579]
Message= [7468697320697320736f6d65206461746120746f20656e6372797074]
Afther I cript:
keylen = 13
Key    = [this is a key]
Message= [Á█?iÆûûe!¾«(!¾ÛCȃS¢?déä{═N]
keylen = 13
Key    = [746869732069732061206b6579]
Message= [b5db3f691f9296966521f3ae2821f3ea43d49f53bd3f6482847bcd4e]
Afther II cript:
keylen = 13
Key    = [this is a key]
Message= [this is some data to encrypt]
keylen = 13
Key    = [746869732069732061206b6579]
Message= [7468697320697320736f6d65206461746120746f20656e6372797074]
----------------------
Input:
keylen = 13
Key    = [746869732069732061206b6579]
Message= [b5db3f691f9296966521f3ae2821f3ea43d49f53bd3f6482847bcd4e]
Afther I cript:
keylen = 13
Key    = [746869732069732061206b6579]
Message= [7468697320697320736f6d65206461746120746f20656e6372797074]
----------------------
Input:
keylen = 83
Key    = [74686973206973206120726174686572206c6f6e67206b65792062656361757365207468652076616c7565206f66205320697320383320736f20746865206b6579206c656e677468206d757374206d61746368]
Message= [616e64207468697320697320746865206461746120746f20626520656e63727970746564]
Afther I cript:
keylen = 83
Key    = [74686973206973206120726174686572206c6f6e67206b65792062656361757365207468652076616c7565206f66205320697320383320736f20746865206b6579206c656e677468206d757374206d61746368]
Message= [961f2c8fa3259ba3665b6d6bdfbcac8b8efafe96423d21fc3b13606316710411d886ee07]
Afther II cript:
keylen = 83
Key    = [74686973206973206120726174686572206c6f6e67206b65792062656361757365207468652076616c7565206f66205320697320383320736f20746865206b6579206c656e677468206d757374206d61746368]
Message= [616e64207468697320697320746865206461746120746f20626520656e63727970746564]
RosLuP
fuente
3

JavaScript (ES6), 262 bytes

Pensé en usar solo funciones encadenadas, pero opté por golfificar el algoritmo dado aquí: https://gist.github.com/farhadi/2185197 .

A=>eval(`for(C=A[c='charCodeAt']
(),K=A.slice(1,++C),T=A.slice(C),i=j=k=l=m=y=0,s=[],r=[],a=256;i<a;)s[i]=i++
for(;j<a;){t=s[k=(k+s[j]+K[c](j%K.length))%a]
s[k]=s[j]
s[j++]=t}for(;y<T.length;){r[y]=T[c](y++)^s[((t=s[m=(m+s[l=++l%a])%a])+
(s[m]=s[l]))%a]
s[l]=t}r`)

Menos golf

A=>{
  C=A.charCodeAt()
  K=A.slice(1,++C)
  T=A.slice(C)
  for(i=j=k=l=m=y=0,s=[],r=[];i<256;)s[i]=i++
  for(;j<256;){
    t=s[k=(k+s[j]+K.charCodeAt(j%K.length))%256];
    s[k]=s[j];
    s[j++]=t;
  }
  for(;y<T.length;){
    t=s[m=(m+s[l=(l+1)%256])%256];
    s[m]=s[l];
    s[l]=t;
    r[y]=T.charCodeAt(y++)^s[(s[l]+s[m])%256];
  }
  return r;
}

andrewarchi
fuente
2
+1 Siempre aprecio cuando las personas incluyen explicaciones para el código de golf.
Daffy
2

Python 2 , 203 bytes

def f(x):
	def h():S[i],S[j]=S[j],S[i]
	m=256;x=map(ord,x);S=range(m);l=x.pop(0);j=0
	for i in S[:]:j=(j+S[i]+x[i%l])%m;h()
	i=j=0
	for b in x[l:]:i=(i+1)%m;j=(j+S[i])%m;h();yield chr(S[(S[i]+S[j])%m]^b)

Pruébalo en línea!

f es un generador (iterable) de cadenas.

Sin golf:

def f(x):
    def h():
        S[i], S[j] = S[j], S[i]  # we have to do this two times
    m = 256  # used often
    x = map(ord, x)  # get numbers to do stuff with
    S = range(m)  # init State
    l = x.pop(0)  # get key length and remove the first byte in one go
    j = 0
    for i in S[:]:  # shorter than range(256)
        j = (j + S[i] + x[i%l]) % m
        h()
    i = j = 0
    for b in x[l:]:  # data comes after the key
        i = (i+1) % m
        j = (j+S[i]) % m
        h()
        yield chr(S[(S[i]+S[j]) % m] ^ b)  # convert to str again
usuario24343
fuente
1

Rubí, 234 bytes

No probado

->s{l=s[0].ord;k=s[1..l];i=s[l+1..-1];o='';s=[*0..255];i,j,q=0;256.times{|i|j=(j+s[i]+k[i%k.size].ord)%256;s[i],s[j]=s[j],s[i]};i.size.times{|k|i=(i+1)%256;q=(q+s[i])%256;s[i],s[q]=s[q],s[i];b=s[(s[i]+s[q])%256];o<<(b^i[k].ord).chr;o}
dkudriavtsev
fuente
1

C, 181 bytes

f(a,n)char*a;{unsigned char A=*a++,i=-1,j=0,k,s[256];for(;s[i]=i;--i);for(;k=s[i],s[i]=s[j+=k+a[i%A]],s[j]=k,k=++i;);for(n-=A,a+=A;--n;*a++^=s[j+=A])j=s[++i],A=s[i]=s[k+=j],s[k]=j;}

gracias a ceilingcat por algunos bytes menos:

f(a,n)char*a;
{unsigned char A=*a++,i=-1,j=0,k,s[256];
 for(;s[i]=i;--i);
 for(;k=s[i],s[i]=s[j+=k+a[i%A]],s[j]=k,k=++i;);
 for(n-=A,a+=A;--n;*a++^=s[j+=A])j=s[++i],A=s[i]=s[k+=j],s[k]=j;
}

f (a, n) en "a" habría una matriz de caracteres 1Byte len + tecla + mensaje; en n existe el tamaño de toda la matriz de "a" sin contar el último '\ 0'. el código para la prueba y el resultado sería el utilizado para la función de ensamblaje.

RosLuP
fuente
@ceilingcat mi argumento de la función n, aquí está la longitud de toda la matriz de caracteres (1byte + clave + mensaje) ... longitud del mensaje que tiene que ser: nk-1 donde k es la longitud de la clave yn es la longitud de todo el conjunto de caracteres.
RosLuP
@ceilingcat para mí la llamada "f (a, sizeof a);" está mal porque sizeof calcula como la longitud de 'a' el char agregado '\ 0' al final de la cadena ... Por lo tanto, debe ser f (a, (sizeof a) -1)
RosLuP
No estoy de acuerdo con esto ", * ++ a ^ = s [j + = s [i]])" me parece que aquí leyó 2 veces a la matriz s, y en otra instrucción similar aquí el resultado fue diferente. ..
RosLuP
1

APL (NARS), 329 caracteres, 658 bytes

xor←{⍺<0:¯1⋄⍵<0:¯1⋄⍺=0:⍵⋄⍵=0:⍺⋄k←⌈/{⌊1+2⍟⍵}¨⍺⍵⋄(2⍴⍨≢m)⊥m←↑≠/{(k⍴2)⊤⍵}¨⍺⍵}
∇r←C w;s;i;j;l;t;b;x
k←256⋄s←¯1+⍳k⋄i←j←0⋄l←¯1+⎕AV⍳↑w
t←s[1+i]⋄j←k∣¯1+j+t+⎕AV⍳w[2+l∣i]⋄s[1+i]←s[1+j]⋄s[1+j]←t⋄i+←1⋄→2×⍳i<k
i←j←0⋄b←≢w⋄l+←1
l+←1⋄→6×⍳l>b⋄i←k∣i+1⋄t←s[1+i]⋄j←k∣j+t⋄s[1+i]←s[1+j]⋄s[1+j]←t
x←s[1+k∣t+s[1+i]] xor ¯1+⎕AV⍳w[l]⋄w[l]←⎕AV[1+x]⋄→4
r←w
∇

como siempre, la verificación de error se exigiría a otra persona ... Esto parece estar bien en entrada y salida, prueba:

  str2Hex←{∊{'0123456789ABCDEF'[1+{(2⍴16)⊤⍵}⍵]}¨{¯1+⎕AV⍳⍵}⍵}
  str2Hex ⎕AV[2,1,1,1,1,1,1]
01000000000000
  str2Hex C ⎕AV[2,1,1,1,1,1,1]
0100DE188941A3
  str2Hex C C ⎕AV[2,1,1,1,1,1,1]
01000000000000
  str2Hex C ⎕AV[14],'this is a keythis is some data to encrypt'
0D746869732069732061206B6579B5DB3F691F9296966521F3AE2821F3EA43D49F53BD3F6482847BCD4E
  C C ⎕AV[14],'this is a keythis is some data to encrypt'

this is a keythis is some data to encrypt

  str2Hex C 'Sthis is a rather long key because the value of S is 83 so the key length must matchand this is the data to be encrypted'
5374686973206973206120726174686572206C6F6E67206B65792062656361757365207468652076616C7565206F662053
  20697320383320736F20746865206B6579206C656E677468206D757374206D61746368961F2C8FA3259BA3665B6D
  6BDFBCAC8B8EFAFE96423D21FC3B13606316710411D886EE07

  C C 'Sthis is a rather long key because the value of S is 83 so the key length must matchand this is the data to be encrypted'
Sthis is a rather long key because the value of S is 83 so the key length must matchand this is th
  e data to be encrypted

Sí, todo se puede reducir ... pero, por ejemplo, hacer más poco la función xor podría significar que sea menos general ...

RosLuP
fuente
0

Rust 348

fn rc4(n:Vec<u8>)->Vec<u8>{let(mut s,mut j,mut t,l)=((0..256).collect::<Vec<usize>>(),0,0,n[0] as usize);let(key,msg)=n[1..].split_at(l);(0..256).fold(0,|a,i|{j=(a+s[i]+key[i%l] as usize)%256;t=s[i];s[i]=s[j];s[j]=t;j});j=0;(1..).zip(msg.iter()).map(|(i,b)|{j=(j+s[i])%256;t=s[i];s[i]=s[j];s[j]=t;s[(s[i]+s[j])%256]as u8^b}).collect::<Vec<u8>>()}

Esto es bastante grande, espero que alguien pueda dar algunas sugerencias.

sin golf: en play.rust-lang.org playground

don brillante
fuente
Sugerir en klugar de keyy en mlugar de msgy en foo&255lugar de(foo)%256
ceilingcat