¿Cuáles son los tipos de contenido correctos para documentos XML, HTML y XHTML?
Necesito escribir un rastreador simple que solo obtenga este tipo de archivos.
Hoy en día http://example.net/index.html puede servir, por ejemplo, un archivo JPEG debido a mod_rewrite, por lo que necesito verificar el tipo de contenido del encabezado de respuesta y compararlo con una lista de tipos de contenido permitidos.
¿De dónde puedo obtener esa lista?

Respuestas:
HTML: punto
text/htmly final.XHTML:
application/xhtml+xml, o sólo si siguiendo las directrices compatbility HTML,text/html. Consulte la nota sobre tipos de papel de W3 .XML:
text/xml,application/xml( RFC 2376 ).También hay muchos otros tipos de medios basados en XML, por ejemplo
application/rss+xmloimage/svg+xml. Es una apuesta segura que cualquier terminación no reconocida pero registrada+xmlestá basada en XML. Consulte la lista de IANA para ver los tipos de medios registrados que terminan en+xml.(Para los
x-tipos no registrados , todas las apuestas están canceladas, pero es de esperar+xmlque se respeten).fuente
text/xmlyapplication/xmlver aquí stackoverflow.com/questions/4832357/…