¿Cuál es la diferencia entre usar RDFS / OWL versus XML?

10

Me preguntaba qué ventajas tienen los lenguajes de ontología de RDFS / OWL sobre el uso de un sistema de etiquetado / marcado (como http://www.schema.org/ ) para administrar y crear metadatos.

Diccionario de sinónimos Webster
fuente
3
El motor de inferencia, eso es lo que. De lo cual sorprendentemente ninguna de las respuestas a continuación habla. Los motores como Jena pueden inferir nuevos datos y hacer uso de propiedades transitivas.
Andrew T Finnell
2
@AndrewFinnell publica una explicación más detallada como respuesta, por favor
Andrew, estoy de acuerdo y votaré tu respuesta. Las respuestas actualmente existentes a continuación no están informadas y son de baja calidad.
Dibbeke
@ AndrewFinnell, también me gustaría que publiques tu propia respuesta, también me pregunto si la inferencia está más allá del alcance del OP o no. (Originalmente pensé que sí, pero tal vez no lo sea)
ZJR

Respuestas:

5

Tu pregunta tiene poco sentido como es. RDFS es un lenguaje de esquema muy básico para expresar restricciones RDF. OWL es un esquema más avanzado para expresar una ontología complicada. No tienen absolutamente nada en común con XML, excepto que se pueden expresar en XML.

Stefano Borini
fuente
4

No podría diagreear más con la respuesta de ZJR. Está completamente desinformado.

  1. ¿Cómo se analizan los microdatos? ¿Qué analiza también? RDFa analiza a RDF, un modelo de datos común que es lo que la Web Semántica ha estado pidiendo. Los microdatos surgieron básicamente porque Hickie no podía molestarse en leer las especificaciones RDF y RDFa. Puede ser más fácil para un desarrollador, pero no es mejor para la web (es decir, perezoso )
  2. Para obtener una lista de vocabularios OWL comunes, consulte a continuación:

  3. La próxima versión de RDF es inminente, incluidos los nuevos formatos de serialización como Turtle y RDFj

  4. SPARQL 1.1 también se debe inminentemente. Federación de consultas, expresión de ruta de propiedad, actualización SPARQL y mucho más.

  5. La BBC está construida sobre RDF. La API de gráficos de Facebook proporciona RDF (es cierto, puede diferenciar un URI de gráfico utilizando el encabezado de texto / tortuga Acepta y recuperar RDF) y muchas otras grandes corporaciones.

En resumen, la Web Semántica, RDF, RDFS, OWL, SPARQL y todos los estándares de la Web Semántica están muy vivos y activos. Si no me cree, eche un vistazo a toda la actividad en http://www.semanticoverflow.com

William Greenly
fuente
la BBC se basa en RDF, aunque se asigna a microdatos, ¿entonces? Reconstruyeron el sitio en la década 2000-2010 en un momento en que el W3C prometía maravillosas herramientas mágicas para RDF, esas herramientas realmente no se materializaron, RDF es un legado, allí. Estructura organizativa sólida, pero horrible de compartir, los microdatos cubren la última milla. (y salva el día)
ZJR
y algo más: un SPARQL útil ha sido inminente desde siempre, la redacción de la especificación RDF solía absorber a lo grande y asustó a la mayoría de los implementadores potenciales durante años. (no sé si arreglaron eso, ¿arreglaron eso? en mi opinión, demasiado tarde, de todos modos ) y luego, la RDF<some-letter>nomenclatura genera confusiones y disputas todo el tiempo.
ZJR
1
La BBC está construida sobre RDF utilizando BigOWLIM, no microdatos. Mircodata no es un formato de datos canónico. Es una adición a HTML. La nueva plataforma olímpica está construida completamente en RDF, como se menciona en comunicados de prensa y presentaciones en su Academia.
William Greenly
4

RDF / OWL vs XML es una alternativa falsa. De hecho, una de las serializaciones populares es usar XML.

También RDF / OWL vs microformatos es una alternativa falsa. De hecho, hay estándares que permiten usar RDF como microformato, eRDF y RDFa oficial del W3C con una forma estandarizada de incrustarlo en HTML5 .

Entonces, la verdadera pregunta es cuál es la ventaja de usar formatos estándar aprobados por el W3C. Las razones son:

  • Ya existen varias ontologías, incluidas las más utilizadas como Dublin Core y FOAF .
  • múltiples tiendas triples compatibles con RDF / OWL para la mayoría de los lenguajes de programación.
  • Varios de los almacenes triples mencionados anteriormente cuentan con motores de inferencia con interfaz SPARQL .

En general, no veo ninguna razón por la que debería optar por un microformato no estándar ni W3C.

vartec
fuente
1

RDF y OWL son estándares establecidos para codificar datos semánticos y su esquema, en un nivel mucho más profundo y genérico que un marcado ad-hoc.

Por ejemplo, con OWL, puede definir un nuevo esquema, que otras herramientas comprenderán al menos parcialmente (porque puede mezclar diferentes esquemas OWL / RDF). De esta manera, puede exportar desde un conjunto de datos diferentes "vistas" del mismo y hacer que todos cooperen. Además, puede simplemente "explorar" los enlaces entre los objetos y sus propiedades.

Con los microdatos, es básicamente un conjunto de cosas aceptadas y ad-hoc que puede aplicar, no una plataforma semántica general.

p_l
fuente
Todavía estoy confundido acerca de cómo RDF difiere de RDFS difiere de OWL ... ¿Se pueden usar esos términos indistintamente ...?
Webster Thesaurus
@WebsterThesaurus RDF es un lenguaje bastante simple para describir conceptos basados ​​en triples de sujeto-verbo-objeto. RDFS es el esquema RDF, básicamente un conjunto predefinido de términos para facilitar la definición del significado de las relaciones. OWL es un sistema de descripción de la ontología, mucho más potente que RDFS, pero más difícil de poner en práctica
P_L
1

Me gustaría comenzar señalando que esta respuesta no está escrita por un experto en el tema. Aunque soy un defensor de los sistemas semánticos distribuidos, creo que las aplicaciones de OWL son actualmente limitadas. Aunque describir con precisión el nicho en el que se puede aplicar OWL estaría más allá del alcance de esta respuesta, podría sacar a la luz algunos pros y contras.

OWL es básicamente un lenguaje que permite la expresión de construcciones semánticas utilizando la clasificación, a diferencia de las clases que conoce de OOP y las restricciones entre las clases y sus instancias. Uno podría verlo como una forma más formal y de orden superior para describir las relaciones que conoce de una base de datos relacional.

Para describir y comunicar este idioma, debe ser serializado a un formato determinado. Hay varios formatos, de los cuales RDF es solo uno.

Hay tres niveles diferentes de OWL, lo que permite aumentar la expresividad, pero limita la computabilidad (por ejemplo, si puede encontrar una posible solución a las preguntas que hace a la base de conocimiento descrita por una definición de OWL). Estos son OWL Lite, DL y Full.

La ventaja más importante de usar OWL / RDF es el intercambio de conocimiento entre diferentes bases de conocimiento (o jerarquías de clasificación) y crear inferencias útiles sin tener que diseñar todas estas bases de antemano para permitir que se comuniquen. Esto se hace en parte definiendo clases de equivalencia. El uso de espacios de nombres permite al ingeniero determinar la unicidad; Un paradigma útil.

Otra ventaja es la cantidad cada vez mayor de motores de inferencia y lenguajes de consulta. En nuestro mundo en red, existe una demanda de intercambio de conocimiento distribuido.

Quizás una desventaja importante es la relativa alta complejidad de determinar la computabilidad de las inferencias y sus limitaciones de espacio y tiempo. P.ej. en OWL completo, es posible que pueda solicitar inferencias que no se puede demostrar que terminen. Por lo tanto, ciertamente hay un límite para el poder de OWL.

El conocimiento de OWL es discreto ... no hay medias verdades o sistemas de creencias. Tener esto probablemente haría que las soluciones sean demasiado complejas.

Pero la desventaja más importante para mi gusto es que uno simplemente no puede encontrar muchos buenos ingenieros en el campo. Necesitará un ingeniero de conocimiento, uno o dos informáticos y un pequeño equipo de desarrollo para construir incluso una pequeña base de conocimiento. Por lo tanto, a menudo es mucho más barato y efectivo usar solo lenguajes descriptivos como el esquema XML y describir la semántica necesaria en un documento legible para humanos.

Dibbeke
fuente
0

RDFS se trata de describir datos estructurados. Sería mucho más útil si incluyera métodos o funciones, por lo que podríamos describir interfaces con él. Actualmente necesita un vocabulario adicional para hacerlo, por ejemplo, WSDL o Hydra by webservices. Supongo que también hay un vocabulario para OOP, simplemente no conozco muchos vocabulario.

OWL es algo así como XSD, se trata de validar sus datos, por ejemplo, si espera una cadena con un máximo de 20 caracteres, usa OWL para describir esa regla y generar un validador. En teoría, podría hacer lo mismo con RDFS y XSD, no tengo idea de por qué la gente tuvo que inventar OWL en lugar de simplemente usar XSD. Tal vez sea porque XSD no se basa en RDFS, por lo que, por ejemplo, la cadena XSD no es descendiente de RDFS Literal.

Schema.org describe clases comunes como Persona, por ejemplo. Crean su propio RDFS como vocabulario, que incluye Thing en lugar de rdfs: Class, domainIncludes en lugar de rdfs: domain, rangeIncludes en lugar de rdfs: range, etc. en lugar de usar RDFS. Sus tipos restringidos también son ad-hoc, usan Texto y Número sin definirlos o conectarlos al menos a rdfs: primitivas literales o XSD. No pueden usar XSD u OWL para definir tipos restringidos por lo que puedo decir. No estoy seguro de si hay restricciones en su vocabulario, pero si es así, supongo que lo mencionan en las descripciones legibles por humanos, por lo que no podrá generar un validador adecuado contra schema.org, lo que podría hacer si usaría XSD / OWL y RDFS.

Así que creo que la ventaja de usar estándares como RDFS, XSD, OWL es que puedes escribir bibliotecas que puedes reutilizar en cada documento.

inf3rno
fuente
-2

Con el fin de desarrollar productos futuros, los archivos RDFS / OWL XML deben considerarse prácticamente muertos y desaparecidos.

Requieren demasiado trabajo para expresar los conceptos que una solución personalizada basada en formatos de texto personalizados expresaría mejor , manteniendo los datos más legibles y editables para humanos y máquinas por igual. No agregan ningún valor real y solo hacen la vida un poco más miserable para todos los que se topan con ellos. (y tiene que lidiar con su nomenclatura de espacio de nombres)

Sin embargo, existen soluciones de manejo de documentos gigantes basadas en ellos, y recientemente se desarrollaron, implementaron y están en servicio actual. Amenazan con quedarse por mucho tiempo. Muchos programadores en el futuro sin duda sufrirán muchos WTF inducidos por RDF y OWL.

Los sistemas de microdatos (la versión de microformatos compatible con validadores ) como los descritos en schema.org , presentan en cambio muchas ventajas para desarrolladores, editores y lectores por igual; tanto humanos como mecánicos.

Los conceptos RDF (aquellos que vale la pena guardar) se pueden mapear (y en realidad se están mapeando explícitamente) sobre representaciones de microdatos sin dolor.

Los elementos de microdatos permiten a los autores y los sistemas de manejo de documentos enriquecer la comunicación de una manera que es bastante fácil (tan fácil como CSS o DOM) de manejar y personalizar para el lector.

ZJR
fuente
Espera, no entiendo ... Entonces, ¿en qué se diferencia Microdata de XML / HTML? El plan descrito en schema.org dice específicamente que usan etiquetas dentro de sus páginas web ... ¿no es eso lo que también hacen XML y HTML?
Webster Thesaurus
Y si Microdata es mucho mejor, ¿por qué el W3C está presionando por RDFS / OWL y no por Microdata?
Webster Thesaurus
Creo que esa respuesta es bastante engañosa, como RDF! = XML. La codificación XML de RDF es solo una de muchas, y fue diseñada con el propósito de mezclarse con las aplicaciones XML existentes. Además, volver a los sistemas personalizados (sí, incluidos los microdatos) significa volver a "escribir un analizador personalizado para jodir todo" en lugar de poder usar vocabulario genérico. Con RDF / OWL puedo mezclar diferentes aplicaciones, cada una trabajando en un subconjunto de datos involucrados, así como escribir código flexible que tenga reflejo automático; un buen ejemplo es Xanasys LinkExplorer.
p_l
1
Respuesta obstinada y poco informativa. Muestre referencias para respaldar estas afirmaciones.
Dibbeke
@Dibbeke Mi conjetura original era que el OP estaba buscando metadatos pragmáticos. RDF en ese caso es exagerado. La parte opinión es relativa a mi creencia en que RDF es siempre una exageración .
ZJR