Formato UUID: 8-4-4-4-12 - ¿Por qué?

84

¿Por qué los UUID se presentan en el formato "8-4-4-4-12" (dígitos)? He buscado la razón, pero no encuentro la decisión que la requiere.

Ejemplo de UUID formateado como cadena hexadecimal: 58D5E212-165B-4CA0-909B-C86B9CEE0111

Fidel
fuente
11
En realidad, ese ejemplo de cadena hexadecimal es incorrecto. La especificación UUID requiere que la cadena hexadecimal que representa un valor UUID debe estar en minúsculas . La especificación también requiere una implementación para poder analizar una cadena de mayúsculas o minúsculas, pero solo se pueden generar minúsculas. Desafortunadamente, las implementaciones comunes violan esta regla, incluidas las de Apple, Microsoft y otros.
Basil Bourque
1
Interesante Basil, gracias
Fidel

Respuestas:

65

Está separado por time, version, clock_seq_hi, clock_seq_lo, node, como se indica en el siguiente rfc.

Desde el IETF RFC4122:

4.1.2.  Layout and Byte Order

   To minimize confusion about bit assignments within octets, the UUID
   record definition is defined only in terms of fields that are
   integral numbers of octets.  The fields are presented with the most
   significant one first.

   Field                  Data Type     Octet  Note
                                        #

   time_low               unsigned 32   0-3    The low field of the
                          bit integer          timestamp

   time_mid               unsigned 16   4-5    The middle field of the
                          bit integer          timestamp

   time_hi_and_version    unsigned 16   6-7    The high field of the
                          bit integer          timestamp multiplexed
                                               with the version number  

   clock_seq_hi_and_rese  unsigned 8    8      The high field of the
   rved                   bit integer          clock sequence
                                               multiplexed with the
                                               variant

   clock_seq_low          unsigned 8    9      The low field of the
                          bit integer          clock sequence

   node                   unsigned 48   10-15  The spatially unique
                          bit integer          node identifier

   In the absence of explicit application or presentation protocol
   specification to the contrary, a UUID is encoded as a 128-bit object,
   as follows:

   The fields are encoded as 16 octets, with the sizes and order of the
   fields defined above, and with each field encoded with the Most
   Significant Byte first (known as network byte order).  Note that the
   field names, particularly for multiplexed fields, follow historical
   practice.

   0                   1                   2                   3
    0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                          time_low                             |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |       time_mid                |         time_hi_and_version   |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |clk_seq_hi_res |  clk_seq_low  |         node (0-1)            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                         node (2-5)                            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Matten
fuente
11
¿Por qué se dividió la marca de tiempo en tres partes?
user253751
4
La forma en que se generan los campos depende de la versión UUID. El método preferido no usa el tiempo, ya que revela la hora en que se generó la identificación (un problema de seguridad potencial). en.wikipedia.org/wiki/…
pmont
1
@pmont "Preferido"?
Basil Bourque
2
@brocoli tengo que no estar de acuerdo. V4 depende de un generador de números aleatorios criptográficamente fuerte, que es mucho más difícil de construir bien que simplemente tomar la dirección MAC , el momento actual y un número arbitrario creciente, como se ve en el UUID V1. Además, las implementaciones de V1 son generalmente de código abierto y se construyeron hace muchos años con mucho uso en toda la industria, ahora bien gastadas. Afirmar que V1 es "propenso a fallas parciales" es una tontería. Un UUID V1 es la última pieza de su sistema en la que debe preocuparse por fallas.
Basil Bourque
2
@BasilBourque Uno de los problemas que puede ver ahora con la proliferación de contenedores y redes de contenedores es la colisión de direcciones MAC. Normalmente, los contenedores y las máquinas virtuales se extraen de un rango limitado de posibles direcciones MAC. IIRC Hyper-V solo extrae de un grupo de 256 direcciones MAC posibles de forma predeterminada.
Nathan Clayton
12

El formato se define en IETF RFC4122 en la sección 3. El formato de salida se define donde dice "UUID = ..."

3.- Plantilla de registro de espacio de nombres

ID de espacio de nombres: UUID Información de registro: Fecha de registro: 2003-10-01

Registrante declarado del espacio de nombres: JTC 1 / SC6 (Grupo de relator ASN.1)

Declaración de estructura sintáctica: Un UUID es un identificador que es único tanto en el espacio como en el tiempo, con respecto al espacio de todos los UUID. Dado que un UUID tiene un tamaño fijo y contiene un campo de tiempo, es posible que los valores se traspasen (alrededor de AD 3400, según el algoritmo específico utilizado). Un UUID se puede utilizar para múltiples propósitos, desde etiquetar objetos con una vida útil extremadamente corta hasta identificar de manera confiable objetos muy persistentes en una red.

  The internal representation of a UUID is a specific sequence of
  bits in memory, as described in Section 4.  To accurately
  represent a UUID as a URN, it is necessary to convert the bit
  sequence to a string representation.

  Each field is treated as an integer and has its value printed as a
  zero-filled hexadecimal digit string with the most significant
  digit first.  The hexadecimal values "a" through "f" are output as
  lower case characters and are case insensitive on input.

  The formal definition of the UUID string representation is
  provided by the following ABNF [7]:

  UUID                   = time-low "-" time-mid "-"
                           time-high-and-version "-"
                           clock-seq-and-reserved
                           clock-seq-low "-" node
  time-low               = 4hexOctet
  time-mid               = 2hexOctet
  time-high-and-version  = 2hexOctet
  clock-seq-and-reserved = hexOctet
  clock-seq-low          = hexOctet
  node                   = 6hexOctet
  hexOctet               = hexDigit hexDigit
  hexDigit =
        "0" / "1" / "2" / "3" / "4" / "5" / "6" / "7" / "8" / "9" /
        "a" / "b" / "c" / "d" / "e" / "f" /
        "A" / "B" / "C" / "D" / "E" / "F"
Paul-Joseph de Werk
fuente
4

128 bits

El formato "8-4-4-4-12" es solo para ser leído por humanos. El UUID es realmente un número de 128 bits .

Considere que el formato de cadena requiere el doble de bytes que el número de 128 bits cuando se almacena o en la memoria. Sugeriría usar el número internamente y cuando deba mostrarse en una interfaz de usuario o exportarse en un archivo, use el formato de cadena.

Pablo Pazos
fuente