Tipo de contenido válido para documentos XML, HTML y XHTML

123

¿Cuáles son los tipos de contenido correctos para documentos XML, HTML y XHTML?

Necesito escribir un rastreador simple que solo obtenga este tipo de archivos.

Hoy en día http://example.net/index.html puede servir, por ejemplo, un archivo JPEG debido a mod_rewrite, por lo que necesito verificar el tipo de contenido del encabezado de respuesta y compararlo con una lista de tipos de contenido permitidos.

¿De dónde puedo obtener esa lista?

astropanico
fuente
Acerca de los fragmentos, consulte stackoverflow.com/q/19303361/287948 y w3.org/TR/xml-fragment
Peter Krauss

Respuestas:

206

HTML: punto text/htmly final.

XHTML: application/xhtml+xml, o sólo si siguiendo las directrices compatbility HTML, text/html. Consulte la nota sobre tipos de papel de W3 .

XML: text/xml, application/xml( RFC 2376 ).

También hay muchos otros tipos de medios basados ​​en XML, por ejemplo application/rss+xmlo image/svg+xml. Es una apuesta segura que cualquier terminación no reconocida pero registrada +xmlestá basada en XML. Consulte la lista de IANA para ver los tipos de medios registrados que terminan en +xml.

(Para los x-tipos no registrados , todas las apuestas están canceladas, pero es de esperar +xmlque se respeten).

bobince
fuente
32
Sobre las diferencias entre text/xmly application/xmlver aquí stackoverflow.com/questions/4832357/…
sanmai
Lo mismo es válido para los fragmentos , consulte w3.org/TR/xml-fragment o esta otra qustion .
Peter Krauss