Entonces, me dicen que HTML5 es el gran paso adelante. El último paso hacia adelante que dimos que conozco fue la introducción de XHTML. Las ventajas eran obvias: simplicidad, rigurosidad, la capacidad de utilizar analizadores y generadores XML estándar para trabajar con páginas web, etc.
Qué extraño y frustrante, entonces, que HTML5 revierta todo eso: una vez más, estamos trabajando con una sintaxis no estándar; una vez más, tenemos que lidiar con el equipaje histórico y la complejidad del análisis; una vez más, no podemos usar nuestras bibliotecas, analizadores, generadores o transformadores XML estándar; y todas las ventajas introducidas por XML (extensibilidad, espacios de nombres, estandarización, etc.), que el W3C pasó una década presionando por buenas razones, se pierden.
Bien, tenemos XHTML5, pero parece que no ha ganado popularidad como la codificación HTML5. Vea esta pregunta SO , por ejemplo. Incluso la especificación HTML5 dice que HTML5, no XHTML5, "es el formato sugerido para la mayoría de los autores".
¿Tengo mis datos equivocados? De lo contrario, ¿por qué soy el único que se siente así? ¿Por qué las personas eligen HTML5 sobre XHTML5?
<!DOCTYPE html>Hello World
XHTML:<?xml version="1.0" encoding="iso-8859-1"?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "DTD/xhtml1-transitional.dtd"><html xml:lang="en" lang="en" xmlns="http://www.w3.org/1999/xhtml"><head><title></title></head><body>Hello World</body></html>
<!DOCTYPE html>Hello World
, ¿verdad? Prueba eso en este validador .<!DOCTYPE html>Hello World!
, ya que es perfectamente válido HTML5. Los documentos más cortos significan menos gastos generales de ancho de banda, lo que equivale a ahorros significativos para las grandes empresas (¿ha visto lo que google envía para www.google.com?).Respuestas:
Yo recomendaría leer ¿Cómo llegamos aquí? . Mark Pilgrim ofrece una excelente y breve historia de HTML hasta HTML5.
Esencialmente, sin embargo, entiendo que muchas páginas web ni siquiera aprovechan la "X" de XHTML porque no especifican el tipo MIME adecuado para ello.
fuente
C
programa probablemente terminaría pareciéndose mucho más a unPython
programa en el sentido de que los puntos y comas podrían desaparecer, y lo que quedaría es el código importante./past.html
ya no está disponible en este servidor y no hay una dirección de reenvío”.Si produce html5 compatible con xml y los envía con xml como tipo mime, entonces el analizador xml se usará con todo el buen jazz que vuelve;)
EDITAR: vea eso para obtener más información: http://wiki.whatwg.org/wiki/HTML_vs._XHTML
fuente
HTML5 es la conclusión lógica e inevitable de los navegadores que adoptan la ley de Postel ("Sé liberal en lo que aceptas").
Una vez que un navegador con suficiente participación en el mercado adopta este principio, otros se ven obligados a seguir su ejemplo, no solo por ser liberales al aceptar contenido no conforme, sino también al hacerlo de la misma manera que lo hacen sus competidores. HTML5 es el resultado lógico de esa situación: los proveedores de navegadores han decidido que, dado que no van a rechazar ningún contenido como no válido (al menos, no en el nivel HTML, ¡Javascript es otra cuestión!) También podrían sentarse alrededor del presentar y acordar una interpretación para cualquier cosa que el autor del contenido pueda arrojarles. En este entorno, no han reaccionado amablemente a los fanáticos de las normas diciéndoles que si solo hubieran rechazado el contenido mal formado desde el principio, no se habrían metido en este lío.
Entonces, usted y yo podemos gritar desde la barrera y decirles a los vendedores de navegadores y a sus usuarios que el mundo hubiera sido un lugar mejor si no hubieran creído a John Postel, pero el daño está hecho y es muy difícil deshacerlo.
fuente
La especificación HTML5 se ha mejorado mucho en comparación con la especificación HTML4. En particular, el manejo de las condiciones de error y el marcado no válido en realidad está estandarizado, lo que significa que todos los navegadores que implementan correctamente el estándar manejarán el marcado no válido de la misma manera.
El HTML lo escriben los humanos la mayoría de las veces (generalmente junto con algún tipo de lenguaje de plantillas), y los humanos cometen errores. Siempre y cuando todos los navegadores manejen los errores de sintaxis de la misma manera, la regla "sé liberal en lo que aceptas" es perfectamente aceptable.
Realmente hay pocas ventajas en la producción de XML válido, ya que las herramientas y las bibliotecas para manejar HTML están (casi) tan fácilmente disponibles, y HTML es más fácil de escribir para los humanos que XML.
fuente
De todos modos, nunca obtendrá los beneficios de un analizador más simple o herramientas XML estándar del lado del cliente.
Hay miles de millones de páginas en la web en HTML, algunas de ellas escritas por personas muertas hace mucho tiempo, por lo que nunca se actualizarán a XML. Así que si desea crear un agente de usuario de utilidad general que tiene que ser capaz de analizar antigua usanza HTML de todos modos. Podría decirse que XHTML solo introduce una complejidad adicional, ya que requiere un nuevo modo de análisis además del análisis HTML que ya debe admitir.
En el lado del servidor, aún puede aprovechar las herramientas XML, por ejemplo. generar XHTML usando XSLT. Pero si no está utilizando específicamente una cadena de herramientas XML, no hay ningún beneficio en el uso de la sintaxis XML en lugar de solo HTML.
(No es correcto que HTML sea una sintaxis "no estándar". La sintaxis de HTML se especifica con minucioso detalle en la especificación HTML5, por lo que es tan estándar como la sintaxis XML).
fuente