¿Cómo se analizan los archivos XML? [cerrado]

492

¿Existe un método simple para analizar archivos XML en C #? ¿Entonces qué?

domoaringatoo
fuente
puede usar esta implementación: stackoverflow.com/a/34813985/5784646
Eulogy el
Ok, reabrí esto. El duplicado era una solución de lector XML, ya que se trata de analizar archivos XML. El posible duplicado se puede ver en el historial de edición de preguntas ps @GeorgeStocker
Jeremy Thompson
1
@JeremyThompson Una de las razones por las cuales esto fue un duplicado es que la otra pregunta tiene una respuesta mucho mejor. La respuesta principal es una simple respuesta de "solo enlace" no es útil.
George Stocker
1
@GeorgeStocker las preguntas son lo suficientemente diferentes como para coexistir y ambas tienen excelentes respuestas, además de que las aceptadas están utilizando diferentes tecnologías. Es por eso que voté que dejáramos esto abierto, sé que este aceptado es solo un enlace, pero es MSDN y fue escrito en un momento antes de que eso fuera inaceptable, es de esperar que un efecto secundario de la reapertura esté animando a Jon un poco, lea su perfil . De todos modos saludos.
Jeremy Thompson el

Respuestas:

245

Que haría uso de LINQ to XML si estás en .NET 3.5 o superior.

Jon Galloway
fuente
314

Es muy simple. Sé que estos son métodos estándar, pero puedes crear tu propia biblioteca para lidiar con eso mucho mejor.

Aquí hay unos ejemplos:

XmlDocument xmlDoc= new XmlDocument(); // Create an XML document object
xmlDoc.Load("yourXMLFile.xml"); // Load the XML document from the specified file

// Get elements
XmlNodeList girlAddress = xmlDoc.GetElementsByTagName("gAddress");
XmlNodeList girlAge = xmlDoc.GetElementsByTagName("gAge"); 
XmlNodeList girlCellPhoneNumber = xmlDoc.GetElementsByTagName("gPhone");

// Display the results
Console.WriteLine("Address: " + girlAddress[0].InnerText);
Console.WriteLine("Age: " + girlAge[0].InnerText);
Console.WriteLine("Phone Number: " + girlCellPhoneNumber[0].InnerText);

Además, hay algunos otros métodos para trabajar. Por ejemplo, aquí . Y creo que no hay un mejor método para hacer esto; siempre debe elegirlo usted mismo, lo que sea más adecuado para usted.

Lukas Šalkauskas
fuente
47
+1 por mencionar XmlDocument, que es mucho más conveniente que las interfaces de serialización en algunos casos. Si busca un elemento específico, puede acceder a elementos secundarios con el indexador: xmlDoc ["Root"], y estos se pueden encadenar: xmlDoc ["Root"] ["Carpeta"] ["Elemento"] para excavar jerarquía (aunque es sensato validar que estos elementos realmente existen)
Jason Williams
1
InnerTextaquí obtiene el valor de ese nodo, concatenado con todos los valores de los nodos secundarios, ¿verdad? Parece una cosa extraña querer.
Don Cheadle
17
¿Un programador con una lista de amigas? ¡Engaños!
E. van Putten
1
@ E.vanPutten no en este día y edad. Esto no es La venganza de los nerds
user4052054
@DonCheadle Si usted no está esperando allí para ser nodos secundarios, a continuación, InnerTextsimplemente devolverá el valor del nodo - que es lo que (y probablemente todos los demás leer esta pregunta) Estoy análisis del XML de encontrar en el primer lugar.
F1Krazy
48

Use un buen esquema XSD para crear un conjunto de clases con xsd.exe y use un XmlSerializerpara crear un árbol de objetos a partir de su XML y viceversa. Si tiene pocas restricciones en su modelo, incluso podría intentar crear una asignación directa entre sus clases de modelo y el XML con los Atributos Xml *.

Hay un artículo introductorio sobre la serialización XML en MSDN.

Consejo de rendimiento: la construcción de un XmlSerializeres costoso. Mantenga una referencia a su XmlSerializerinstancia si tiene la intención de analizar / escribir múltiples archivos XML.

David Schmitt
fuente
55
Un buen ejemplo es el "Ejemplo de orden de compra" en el medio de este ejemplo de microsoft. msdn.microsoft.com/en-us/library/58a18dwa.aspx . Evita tener que crear un esquema: su clase de C # es el esquema, adornado con atributos de C #.
Mark Lakata
25

Si está procesando una gran cantidad de datos (muchos megabytes), entonces desea usar XmlReaderpara analizar el XML.

Todo lo demás ( XPathNavigator, XElement, XmlDocumente incluso XmlSerializersi se mantiene la gráfica completa objeto generado) resultará en uso de memoria alta y también un tiempo de carga muy lento.

Por supuesto, si necesita todos los datos en la memoria de todos modos, es posible que no tenga muchas opciones.

Simon Steele
fuente
10

Recientemente, se me solicitó trabajar en una aplicación que implicaba el análisis de un documento XML y estoy de acuerdo con Jon Galloway en que el enfoque basado en LINQ to XML es, en mi opinión, el mejor. Sin embargo, tuve que cavar un poco para encontrar ejemplos utilizables, así que sin más preámbulos, ¡aquí hay algunos!

Cualquier comentario es bienvenido ya que este código funciona, pero puede que no sea perfecto y me gustaría obtener más información sobre cómo analizar XML para este proyecto.

public void ParseXML(string filePath)  
{  
    // create document instance using XML file path
    XDocument doc = XDocument.Load(filePath);

    // get the namespace to that within of the XML (xmlns="...")
    XElement root = doc.Root;
    XNamespace ns = root.GetDefaultNamespace();

    // obtain a list of elements with specific tag
    IEnumerable<XElement> elements = from c in doc.Descendants(ns + "exampleTagName") select c;

    // obtain a single element with specific tag (first instance), useful if only expecting one instance of the tag in the target doc
    XElement element = (from c in doc.Descendants(ns + "exampleTagName" select c).First();

    // obtain an element from within an element, same as from doc
    XElement embeddedElement = (from c in element.Descendants(ns + "exampleEmbeddedTagName" select c).First();

    // obtain an attribute from an element
    XAttribute attribute = element.Attribute("exampleAttributeName");
}

¡Con estas funciones pude analizar cualquier elemento y cualquier atributo de un archivo XML sin ningún problema!

PJRobot
fuente
8

Si está utilizando .NET 2.0, pruebe XmlReadery sus subclases XmlTextReader, y XmlValidatingReader. Proporcionan una forma rápida, liviana (uso de memoria, etc.), solo hacia adelante para analizar un archivo XML.

Si necesita XPathcapacidades, pruebe el XPathNavigator. Si necesita todo el documento en memoria, intente XmlDocument.

Ceniza
fuente
7

Además, puede usar el selector XPath de la siguiente manera (manera fácil de seleccionar nodos específicos):

XmlDocument doc = new XmlDocument();
doc.Load("test.xml");

var found = doc.DocumentElement.SelectNodes("//book[@title='Barry Poter']"); // select all Book elements in whole dom, with attribute title with value 'Barry Poter'

// Retrieve your data here or change XML here:
foreach (XmlNode book in nodeList)
{
  book.InnerText="The story began as it was...";
}

Console.WriteLine("Display XML:");
doc.Save(Console.Out);

la documentación

Joel Harkes
fuente
6

No estoy seguro de si existe la "mejor práctica para analizar XML". Existen numerosas tecnologías adecuadas para diferentes situaciones. La forma de usar depende del escenario concreto.

Usted puede ir con LINQ to XML , XmlReader, XPathNavigatoro incluso expresiones regulares. Si elabora sus necesidades, puedo intentar darle algunas sugerencias.

aku
fuente
3
regex para xml. Tú, monstruo.
será el
3

Puede analizar el XML utilizando esta biblioteca System.Xml.Linq. A continuación se muestra el código de muestra que utilicé para analizar un archivo XML

public CatSubCatList GenerateCategoryListFromProductFeedXML()
{
    string path = System.Web.HttpContext.Current.Server.MapPath(_xmlFilePath);

    XDocument xDoc = XDocument.Load(path);

    XElement xElement = XElement.Parse(xDoc.ToString());


    List<Category> lstCategory = xElement.Elements("Product").Select(d => new Category
    {
        Code = Convert.ToString(d.Element("CategoryCode").Value),
        CategoryPath = d.Element("CategoryPath").Value,
        Name = GetCateOrSubCategory(d.Element("CategoryPath").Value, 0), // Category
        SubCategoryName = GetCateOrSubCategory(d.Element("CategoryPath").Value, 1) // Sub Category
    }).GroupBy(x => new { x.Code, x.SubCategoryName }).Select(x => x.First()).ToList();

    CatSubCatList catSubCatList = GetFinalCategoryListFromXML(lstCategory);

    return catSubCatList;
}
Tapan kumar
fuente
1

Puede usar ExtendedXmlSerializer para serializar y deserializar.

Instalación Puede instalar ExtendedXmlSerializer desde nuget o ejecutar el siguiente comando:

Install-Package ExtendedXmlSerializer

Publicación por entregas:

ExtendedXmlSerializer serializer = new ExtendedXmlSerializer();
var obj = new Message();
var xml = serializer.Serialize(obj);

Deserialización

var obj2 = serializer.Deserialize<Message>(xml);

El serializador XML estándar en .NET es muy limitado.

  • No admite la serialización de clase con referencia circular o clase con propiedad de interfaz,
  • No es compatible con diccionarios,
  • No hay ningún mecanismo para leer la versión anterior de XML,
  • Si desea crear un serializador personalizado, su clase debe heredar de IXmlSerializable. Esto significa que su clase no será una clase POCO,
  • No es compatible con IoC.

ExtendedXmlSerializer puede hacer esto y mucho más.

ExtendedXmlSerializer admite .NET 4.5 o superior y .NET Core . Puede integrarlo con WebApi y AspCore.

Wojtpl2
fuente
1

Puede usar XmlDocument y para manipular o recuperar datos de los atributos puede Linq a clases XML.

shaishav shukla
fuente