¿Cómo convertir xml en matriz en php?

167

Quiero convertir debajo de XML a matriz de PHP. ¿Alguna sugerencia sobre cómo puedo hacer esto?

<aaaa Version="1.0">
   <bbb>
     <cccc>
       <dddd Id="id:pass" />
       <eeee name="hearaman" age="24" />
     </cccc>
   </bbb>
</aaaa>
Hearaman
fuente
3
Además, ¿en qué se diferencia esa pregunta de su otra pregunta? stackoverflow.com/questions/6578084/…
Gordon
3
Pocas cosas son tan desagradables como un OP que acepta la respuesta incorrecta a su propia pregunta.
John

Respuestas:

128

Otra opción es la extensión SimpleXML (creo que viene estándar con la mayoría de las instalaciones de php).

http://php.net/manual/en/book.simplexml.php

La sintaxis se ve más o menos así para su ejemplo.

$xml = new SimpleXMLElement($xmlString);
echo $xml->bbb->cccc->dddd['Id'];
echo $xml->bbb->cccc->eeee['name'];
// or...........
foreach ($xml->bbb->cccc as $element) {
  foreach($element as $key => $val) {
   echo "{$key}: {$val}";
  }
}
Sam Dufel
fuente
82
Para ser justos, esto no responde exactamente a la pregunta de cómo obtener una matriz.
sieppl
SimpleXML apesta al analizar este xml: amazon.in/rss/bestsellers/shoes?tag=dealslama-21 Incluso print_r no dice que el objeto contiene realmente.
ravisoni
use var_dump, verá la estructura xml como claves dentro del objeto.
Magus
3
Tengo [CDATA[TEXT]]algunos elementos internos y no están analizando esto. Lo analiza como a SimpleXMLElement Object. ¿Alguna solución para eso?
masterFly
Esto no responde la pregunta
Bilaal Rashid
435

¡fácil!

$xml = simplexml_load_string($xmlstring, "SimpleXMLElement", LIBXML_NOCDATA);
$json = json_encode($xml);
$array = json_decode($json,TRUE);
usuario1398287
fuente
20
Es posible que tenga problemas en las secciones CDATA (regresando siempre nulo). Como solución, pruebe $ xml = simplexml_load_string ($ xmlstring, null, LIBXML_NOCDATA); $ json = json_encode ($ xml); $ array = json_decode ($ json, VERDADERO); (consulte stackoverflow.com/a/2970701/413531 ) // e maldición ... ¿hay alguna forma de agregar nuevas líneas en un comentario?
Hirnhamster
44
Hacemos exactamente lo mismo pero con simplexml_load_file y funciona bien. Gracias
Thermech
2
¿Para qué sirve el segundo parámetro (TRUE)?
Mansour Fahad
3
@MansourFahad En json_decode puede usar el segundo parámetro opcional como TRUE(normalmente predeterminado FALSE) para convertir la entrada JSON en una matriz asociativa.
Jake Bathman
16
@Ismael Miguel demasiado código? El hecho de que coloque todas esas funciones en una línea no significa que esté usando menos código. Puede parecer más compacto, pero a expensas de la legibilidad.
Jage
44

Convirtiendo una cadena XML ( $buffer) en una matriz simplificada ignorando atributos y agrupando elementos secundarios con los mismos nombres:

function XML2Array(SimpleXMLElement $parent)
{
    $array = array();

    foreach ($parent as $name => $element) {
        ($node = & $array[$name])
            && (1 === count($node) ? $node = array($node) : 1)
            && $node = & $node[];

        $node = $element->count() ? XML2Array($element) : trim($element);
    }

    return $array;
}

$xml   = simplexml_load_string($buffer);
$array = XML2Array($xml);
$array = array($xml->getName() => $array);

Resultado:

Array
(
    [aaaa] => Array
        (
            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => 
                            [eeee] => 
                        )

                )

        )

)

Si también desea tener los atributos, están disponibles a través de la codificación / decodificación JSON de SimpleXMLElement. Esta es a menudo la solución más rápida y fácil:

$xml   = simplexml_load_string($buffer);
$array = json_decode(json_encode((array) $xml), true);
$array = array($xml->getName() => $array);

Resultado:

Array
(
    [aaaa] => Array
        (
            [@attributes] => Array
                (
                    [Version] => 1.0
                )

            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [Id] => id:pass
                                        )

                                )

                            [eeee] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [name] => hearaman
                                            [age] => 24
                                        )

                                )

                        )

                )

        )

)

Tenga en cuenta que todos estos métodos solo funcionan en el espacio de nombres del documento XML.

hakre
fuente
En PHP 7 que tenía que añadir lo siguiente: && (is_countable($node) && 1 === count($node) ? $node = array($node) : 1)Sin embargo me dio un error en la línea siguiente: [] operator not supported for strings.
andreshg112
@ andreshg112: No puedo reproducir (funciona PHP estable 5.3.0 - 7.4.0), el comportamiento no ha cambiado desde hace años, por favor compare con cientos de diferentes versiones de PHP: 3v4l.org/l4nQN
hakre
tal vez sea por mi archivo KML (es un XML). No puedo compartirlo Ya lo importé pero tuve que hacerlo de otra manera.
andreshg112
probablemente le preocupan los espacios de nombres XML. El ejemplo es solo para las partes sin un espacio de nombres (o el predeterminado, a veces mezclo esto).
hakre
25
$array = json_decode(json_encode((array)simplexml_load_string($xml)),true);
Fawad Ghafoor
fuente
1
si echas a matriz, no necesitas json_encodey json_decode.
Ismael Miguel
11
@Ismael en teoría, la conversión a matriz debería ser suficiente. En la práctica, también necesitamos lanzar todos los nodos de hoja, que también son objetos. Un elenco ingenuo deja las hojas como objetos SimpleXML. json_encode lanza recursivamente ahorrando mucho trabajo preliminar.
Peter Mellett
2
Si no tiene valores de texto en su $arrayvariable, tal vez se deba a CDATA. Para resolverlo, cargar el código XML con: new SimpleXMLElement($xml, LIBXML_NOCDATA).
Jonathan Petitcolas
1
PD. $ xml = str_replace (array ('<! [CDATA [', ']]>'), '', $ xml);
user956584
1
No funciona así. Ese código no convertiría ni siquiera un XML simple como este <?xml version="1.0" encoding="UTF-8"?><note a="b"><body c="d">Hello!</body></note>. Ejecute el código y verá que se pierde el atributo <body> c . Consulte el código completo aquí si no desea sorpresas negativas github.com/gaarf/XML-string-to-PHP-array/blob/master/… o vea mi respuesta a continuación stackoverflow.com/a/30234924/828366
Francesco Casula
8

Sorprendido, nadie mencionó xml_parse_into_struct:

$simple = "<para><note>simple note</note></para>";
$p = xml_parser_create();
xml_parse_into_struct($p, $simple, $vals, $index);
xml_parser_free($p);
echo "Index array\n";
print_r($index);
echo "\nVals array\n";
print_r($vals);
eozzy
fuente
A veces me pregunto qué estaba pensando el desarrollador que creó la implementación de PHP XML cuando se diseñó xml_parse_into_struct ...
Anibal Sanchez
7

Ver https://github.com/gaarf/XML-string-to-PHP-array/blob/master/xmlstr_to_array.php

<?php
/**
  * convert xml string to php array - useful to get a serializable value
  *
  * @param string $xmlstr
  * @return array
  *
  * @author Adrien aka Gaarf & contributors
  * @see http://gaarf.info/2009/08/13/xml-string-to-php-array/
*/
function xmlstr_to_array($xmlstr) {
  $doc = new DOMDocument();
  $doc->loadXML($xmlstr);
  $root = $doc->documentElement;
  $output = domnode_to_array($root);
  $output['@root'] = $root->tagName;
  return $output;
}
function domnode_to_array($node) {
  $output = array();
  switch ($node->nodeType) {
    case XML_CDATA_SECTION_NODE:
    case XML_TEXT_NODE:
      $output = trim($node->textContent);
    break;
    case XML_ELEMENT_NODE:
      for ($i=0, $m=$node->childNodes->length; $i<$m; $i++) {
        $child = $node->childNodes->item($i);
        $v = domnode_to_array($child);
        if(isset($child->tagName)) {
          $t = $child->tagName;
          if(!isset($output[$t])) {
            $output[$t] = array();
          }
          $output[$t][] = $v;
        }
        elseif($v || $v === '0') {
          $output = (string) $v;
        }
      }
      if($node->attributes->length && !is_array($output)) { //Has attributes but isn't an array
        $output = array('@content'=>$output); //Change output into an array.
      }
      if(is_array($output)) {
        if($node->attributes->length) {
          $a = array();
          foreach($node->attributes as $attrName => $attrNode) {
            $a[$attrName] = (string) $attrNode->value;
          }
          $output['@attributes'] = $a;
        }
        foreach ($output as $t => $v) {
          if(is_array($v) && count($v)==1 && $t!='@attributes') {
            $output[$t] = $v[0];
          }
        }
      }
    break;
  }
  return $output;
}
Francesco Casula
fuente
7

El método utilizado en los atributos de caída de respuestas aceptados cuando se encuentran elementos secundarios con solo un nodo de texto. Por ejemplo:

$xml = '<container><element attribute="123">abcd</element></container>';
print_r(json_decode(json_encode(simplexml_load_string($xml, "SimpleXMLElement", LIBXML_NOCDATA)),1));

Array
(
    [element] => abcd
)

Mi solución (y desearía poder dar crédito aquí porque estoy seguro de que adapté esto de algo):

function XMLtoArray($xml) {
    $previous_value = libxml_use_internal_errors(true);
    $dom = new DOMDocument('1.0', 'UTF-8');
    $dom->preserveWhiteSpace = false; 
    $dom->loadXml($xml);
    libxml_use_internal_errors($previous_value);
    if (libxml_get_errors()) {
        return [];
    }
    return DOMtoArray($dom);
}

function DOMtoArray($root) {
    $result = array();

    if ($root->hasAttributes()) {
        $attrs = $root->attributes;
        foreach ($attrs as $attr) {
            $result['@attributes'][$attr->name] = $attr->value;
        }
    }

    if ($root->hasChildNodes()) {
        $children = $root->childNodes;
        if ($children->length == 1) {
            $child = $children->item(0);
            if (in_array($child->nodeType,[XML_TEXT_NODE,XML_CDATA_SECTION_NODE])) {
                $result['_value'] = $child->nodeValue;
                return count($result) == 1
                    ? $result['_value']
                    : $result;
            }

        }
        $groups = array();
        foreach ($children as $child) {
            if (!isset($result[$child->nodeName])) {
                $result[$child->nodeName] = DOMtoArray($child);
            } else {
                if (!isset($groups[$child->nodeName])) {
                    $result[$child->nodeName] = array($result[$child->nodeName]);
                    $groups[$child->nodeName] = 1;
                }
                $result[$child->nodeName][] = DOMtoArray($child);
            }
        }
    }
    return $result;
}

$xml = '
    <aaaa Version="1.0">
       <bbb>
         <cccc>
           <dddd id="123" />
           <eeee name="john" age="24" />
           <ffff type="employee">Supervisor</ffff>
         </cccc>
       </bbb>
    </aaaa>
';
print_r(XMLtoArray($xml));

Array
(
    [aaaa] => Array
        (
            [@attributes] => Array
                (
                    [Version] => 1.0
                )

            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [id] => 123
                                        )

                                )

                            [eeee] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [name] => john
                                            [age] => 24
                                        )

                                )

                            [ffff] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [type] => employee
                                        )

                                    [_value] => Supervisor
                                )

                        )

                )

        )

)
Billynoah
fuente
2

XML a matriz

Más detalles Visite https://github.com/sapankumarmohanty/lamp/blob/master/Crate-XML-2-Array

// Convertir XML a matriz y SOAP XML a matriz

function xml2array($contents, $get_attributes = 1, $priority = 'tag')
    {
        if (!$contents) return array();
        if (!function_exists('xml_parser_create')) {
            // print "'xml_parser_create()' function not found!";
            return array();
        }
        // Get the XML parser of PHP - PHP must have this module for the parser to work
        $parser = xml_parser_create('');
        xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, "UTF-8"); // http://minutillo.com/steve/weblog/2004/6/17/php-xml-and-character-encodings-a-tale-of-sadness-rage-and-data-loss
        xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
        xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
        xml_parse_into_struct($parser, trim($contents) , $xml_values);
        xml_parser_free($parser);
        if (!$xml_values) return; //Hmm...
        // Initializations
        $xml_array = array();
        $parents = array();
        $opened_tags = array();
        $arr = array();
        $current = & $xml_array; //Refference
        // Go through the tags.
        $repeated_tag_index = array(); //Multiple tags with same name will be turned into an array
        foreach($xml_values as $data) {
            unset($attributes, $value); //Remove existing values, or there will be trouble
            // This command will extract these variables into the foreach scope
            // tag(string), type(string), level(int), attributes(array).
            extract($data); //We could use the array by itself, but this cooler.
            $result = array();
            $attributes_data = array();
            if (isset($value)) {
                if ($priority == 'tag') $result = $value;
                else $result['value'] = $value; //Put the value in a assoc array if we are in the 'Attribute' mode
            }
            // Set the attributes too.
            if (isset($attributes) and $get_attributes) {
                foreach($attributes as $attr => $val) {                                   
                                    if ( $attr == 'ResStatus' ) {
                                        $current[$attr][] = $val;
                                    }
                    if ($priority == 'tag') $attributes_data[$attr] = $val;
                    else $result['attr'][$attr] = $val; //Set all the attributes in a array called 'attr'
                }
            }
            // See tag status and do the needed.
                        //echo"<br/> Type:".$type;
            if ($type == "open") { //The starting of the tag '<tag>'
                $parent[$level - 1] = & $current;
                if (!is_array($current) or (!in_array($tag, array_keys($current)))) { //Insert New tag
                    $current[$tag] = $result;
                    if ($attributes_data) $current[$tag . '_attr'] = $attributes_data;
                                        //print_r($current[$tag . '_attr']);
                    $repeated_tag_index[$tag . '_' . $level] = 1;
                    $current = & $current[$tag];
                }
                else { //There was another element with the same tag name
                    if (isset($current[$tag][0])) { //If there is a 0th element it is already an array
                        $current[$tag][$repeated_tag_index[$tag . '_' . $level]] = $result;
                        $repeated_tag_index[$tag . '_' . $level]++;
                    }
                    else { //This section will make the value an array if multiple tags with the same name appear together
                        $current[$tag] = array(
                            $current[$tag],
                            $result
                        ); //This will combine the existing item and the new item together to make an array
                        $repeated_tag_index[$tag . '_' . $level] = 2;
                        if (isset($current[$tag . '_attr'])) { //The attribute of the last(0th) tag must be moved as well
                            $current[$tag]['0_attr'] = $current[$tag . '_attr'];
                            unset($current[$tag . '_attr']);
                        }
                    }
                    $last_item_index = $repeated_tag_index[$tag . '_' . $level] - 1;
                    $current = & $current[$tag][$last_item_index];
                }
            }
            elseif ($type == "complete") { //Tags that ends in 1 line '<tag />'
                // See if the key is already taken.
                if (!isset($current[$tag])) { //New Key
                    $current[$tag] = $result;
                    $repeated_tag_index[$tag . '_' . $level] = 1;
                    if ($priority == 'tag' and $attributes_data) $current[$tag . '_attr'] = $attributes_data;
                }
                else { //If taken, put all things inside a list(array)
                    if (isset($current[$tag][0]) and is_array($current[$tag])) { //If it is already an array...
                        // ...push the new element into that array.
                        $current[$tag][$repeated_tag_index[$tag . '_' . $level]] = $result;
                        if ($priority == 'tag' and $get_attributes and $attributes_data) {
                            $current[$tag][$repeated_tag_index[$tag . '_' . $level] . '_attr'] = $attributes_data;
                        }
                        $repeated_tag_index[$tag . '_' . $level]++;
                    }
                    else { //If it is not an array...
                        $current[$tag] = array(
                            $current[$tag],
                            $result
                        ); //...Make it an array using using the existing value and the new value
                        $repeated_tag_index[$tag . '_' . $level] = 1;
                        if ($priority == 'tag' and $get_attributes) {
                            if (isset($current[$tag . '_attr'])) { //The attribute of the last(0th) tag must be moved as well
                                $current[$tag]['0_attr'] = $current[$tag . '_attr'];
                                unset($current[$tag . '_attr']);
                            }
                            if ($attributes_data) {
                                $current[$tag][$repeated_tag_index[$tag . '_' . $level] . '_attr'] = $attributes_data;
                            }
                        }
                        $repeated_tag_index[$tag . '_' . $level]++; //0 and 1 index is already taken
                    }
                }
            }
            elseif ($type == 'close') { //End of tag '</tag>'
                $current = & $parent[$level - 1];
            }
        }
        return ($xml_array);
    }
    
    // Let's call the this above function xml2array
    
    xml2array($xmlContent, $get_attributes = 3, $priority = 'tag'); // it will work 100% if not ping me @skype: sapan.mohannty
    
//  Enjoy coding
htngapi
fuente
0

Me gustó esta pregunta y algunas respuestas me ayudaron, pero necesito convertir el xml en una matriz de dominación, por lo que publicaré mi solución, tal vez alguien la necesite más tarde:

<?php
$xml = json_decode(json_encode((array)simplexml_load_string($xml)),1);
$finalItem = getChild($xml);
var_dump($finalItem);

function getChild($xml, $finalItem = []){
    foreach($xml as $key=>$value){
        if(!is_array($value)){
            $finalItem[$key] = $value;
        }else{
            $finalItem = getChild($value, $finalItem);
        }
    }
    return $finalItem;
}
?>  
Mohammad Alabed
fuente