¿Qué significa STX, SOH y GS en la salida de Notepad ++?

20

Al revisar la fuente MIME para un correo electrónico (presumiblemente que contiene caracteres internacionales), veo cosas como esta en Notepad ++

ingrese la descripción de la imagen aquí

Entiendo que CRLFes el avance de línea de retorno de carro, pero ¿qué pasa con los demás? ¿Qué significa SOH, GSy STXsignifica?

Mike B
fuente

Respuestas:

19

Notepad ++ usa estos símbolos para representar caracteres de control o caracteres que no se imprimen.

Personaje de control - Wikipedia

Un carácter de control o un carácter que no se imprime es un punto de código (un número) en un conjunto de caracteres, que no representa un símbolo escrito.

Códigos de control C0 y C1 - Wikipedia

STX - Inicio del texto: primer carácter del texto del mensaje, y puede usarse para terminar el encabezado del mensaje.

SOH - Inicio del encabezado: primer carácter de un encabezado de mensaje.

GS - Separador de grupo: se puede utilizar como delimitadores para marcar campos de estructuras de datos. Si se usa para niveles jerárquicos, EE. UU. Es el nivel más bajo (división de elementos de datos de texto sin formato), mientras que RS, GS y FS son de nivel creciente para dividir grupos formados por elementos del nivel debajo de él.

Steven
fuente
Hmm ... Estoy confundido sobre por qué los encabezados de un correo electrónico pueden contener un carácter que no se imprime. ¿Sería exacto interpretar que la descripción anterior significa "un carácter de control o un carácter que no se imprime es un punto de código (un número) en un conjunto de caracteres, que no representa un símbolo ASCII escrito".
Mike B
No estoy familiarizado con las especificaciones de los encabezados de correo ni por qué pueden contener caracteres no imprimibles. Sin embargo, Notepad ++ usa sus propios símbolos (como mostró) para mostrar estos caracteres de control.
Steven
Todos los caracteres no imprimibles aparecen dentro del encabezado X-Example, entre comillas. Ese encabezado no forma parte de ningún estándar de correo electrónico (consulte stackoverflow.com/questions/14469110/… ). Lo habrá configurado el cliente que creó el correo electrónico o quizás uno de los transportes en el camino. De cualquier manera, en lo que respecta al procesamiento del correo electrónico, es efectivamente un comentario y podría ser cualquier cosa. Es como si alguien dibujara un pequeño corazón en un sobre: ​​no es parte del estándar postal y no afecta en absoluto la entrega.
Randy Orrison
... bueno, por supuesto, siempre y cuando no rompa las cosas. Un encabezado X con cadenas UNICODE realmente largas podría desencadenar un error de desbordamiento del búfer en un programa de transporte, y un corazón escrito sobre la dirección podría confundir al cartero. Pero dentro de lo razonable, simplemente se ignora.
Randy Orrison
6

SOH es Start Of Header

STX es Start of teXt

GS es Group Seperator

td512
fuente