¿Cómo se puede analizar HTML / XML y extraer información de
¿Cómo se puede analizar HTML / XML y extraer información de
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 6 años . Mejora esta...
Busqué una solución pero nada era relevante, así que aquí está mi problema: Quiero analizar una cadena que contiene texto HTML. Quiero hacerlo en JavaScript. Probé esta biblioteca pero parece que analiza el HTML de mi página actual, no de una cadena. Porque cuando pruebo el siguiente código,...
Parece que cada pregunta en stackoverflow donde el autor de la pregunta está utilizando expresiones regulares para obtener cierta información de HTML inevitablemente tendrá una "respuesta" que dice no usar expresiones regulares para analizar HTML. Por qué no? Soy consciente de que existen...
Tal como está actualmente, esta pregunta no es adecuada para nuestro formato de preguntas y respuestas. Esperamos que las respuestas sean respaldadas por hechos, referencias o experiencia, pero esta pregunta probablemente solicitará debate, argumentos, encuestas o discusión
Estoy buscando un módulo HTML Parser para Python que pueda ayudarme a obtener las etiquetas en forma de listas / diccionarios / objetos de Python. Si tengo un documento de la forma: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div...
¿Cuál es la mejor manera de seleccionar todo el texto entre 2 etiquetas? Por ejemplo: el texto entre todas las etiquetas 'pre' de la
Veo preguntas todos los días que preguntan cómo analizar o extraer algo de alguna cadena HTML y la primera respuesta / comentario es siempre "¡No use RegEx para analizar HTML, no sea que sienta la ira!" (esa última parte a veces se omite). Esto es bastante confuso para mí, siempre pensé que, en...
Necesito analizar (del lado del servidor) grandes cantidades de páginas HTML. Todos estamos de acuerdo en que regexp no es el camino a seguir aquí. Me parece que javascript es la forma nativa de analizar una página HTML, pero esa suposición se basa en que el código del lado del servidor tiene...
Tengo un archivo que se parece a esto: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items"
Las etiquetas pueden tener varios atributos. El orden en que aparecen los atributos en el código no importa. Por ejemplo: <a href="#" title="#"> <a title="#" href="#"> ¿Cómo puedo "normalizar" el HTML en Javascript, para que el orden de los atributos sea siempre el mismo? No me...