Preguntas etiquetadas con beautifulsoup

Beautiful Soup es un paquete de Python para analizar HTML / XML. La última versión de este paquete es la versión 4, importada como bs4.

386
Cómo encontrar elementos por clase

Tengo problemas para analizar elementos HTML con el atributo "class" usando Beautifulsoup. El código se ve así soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div Recibo un error en la misma línea "después" de que finaliza...

224
bs4.FeatureNotFound: No se pudo encontrar un generador de árboles con las características que solicitó: lxml. ¿Necesita instalar una biblioteca de analizador?

... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Las salidas anteriores en...

105
¿Podemos usar xpath con BeautifulSoup?

Estoy usando BeautifulSoup para raspar una URL y tenía el siguiente código import urllib import urllib2 from BeautifulSoup import BeautifulSoup url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html" req = urllib2.Request(url) response = urllib2.urlopen(req) the_page =...

89
Python BeautifulSoup tabla de análisis

Estoy aprendiendo Python requestsy BeautifulSoup. Como ejercicio, he optado por escribir un analizador rápido de multas de estacionamiento de la ciudad de Nueva York. Puedo obtener una respuesta html que es bastante fea. Necesito agarrar lineItemsTabley analizar todas las entradas. Puedes...