He instalado BeautifulSoup usando easy_install e intentando ejecutar el siguiente script
from BeautifulSoup import BeautifulSoup
import re
doc = ['<html><head><title>Page title</title></head>',
'<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
'<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
'</html>']
soup = BeautifulSoup(''.join(doc))
print soup.prettify()
Pero no estoy seguro de por qué está pasando esto
Traceback (most recent call last):
File "C:\Python27\reading and writing xml file from web1.py", line 49, in <module>
from BeautifulSoup import BeautifulSoup
ImportError: No module named BeautifulSoup
Podrias ayudarme por favor. Gracias
python
beautifulsoup
Muhammad Imran
fuente
fuente
easy_install
para usar Python2.7 o la versión incorporada de Python que venía con el sistema operativo que esté usando? Si no especificó 2.7, intente hacer Python2,4 o Python2.6Respuestas:
Prueba esto
from bs4 import BeautifulSoup
Esto podría ser un problema con Beautiful Soup, versión 4 y los días beta. Acabo de leer esto de la página de inicio.
fuente
En Ubuntu 14.04 lo instalé desde apt-get y funcionó bien:
sudo apt-get install python-beautifulsoup
Entonces solo haz:
from BeautifulSoup import BeautifulSoup
fuente
C:\Python27
en cuenta la ruta en su rastreo). Esta respuesta es inútil para él.Prueba esto, el mío funcionó de esta manera. Para obtener cualquier dato de etiqueta, simplemente reemplace la "a" con la etiqueta que desee.
from bs4 import BeautifulSoup as bs import urllib url="http://currentaffairs.gktoday.in/month/current-affairs-january-2015" soup = bs(urllib.urlopen(url)) for link in soup.findAll('a'): print link.string
fuente
puede importar bs4 en lugar de BeautifulSoup. Dado que bs4 es un módulo integrado, no se requiere instalación adicional.
from bs4 import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup = BeautifulSoup(''.join(doc)) print soup.prettify()
Si desea solicitar, utilice el módulo de solicitudes. solicitud está utilizando
urllib
,requests
módulos. pero personalmente recomiendo usar elrequests
módulo en lugar deurllib
instalación del módulo para usar:
A continuación, le indicamos cómo utilizar el módulo de solicitudes:
import requests as rq res = rq.get('http://www.example.com') print(res.content) print(res.status_code)
fuente
bs4
no es un módulo incorporado.Primero instale beautiful soup versión 4. escriba el comando en la ventana de terminal:
luego importe la biblioteca BeutifulSoup
fuente
si tienes dos versiones de python, tal vez mi situación pueda ayudarte
esta es mi situación
1-> mac osx
2-> tengo dos versiones de python, (1) versión predeterminada del sistema 2.7 (2) versión 3.6 instalada manualmente
3-> he instalado el beautifulsoup4 con
sudo pip install beautifulsoup4
4-> ejecuto el archivo python con
python3 /XXX/XX/XX.py
así que esta situación 3 y 4 son la parte clave, instalé beautifulsoup4 con "pip" pero este módulo se instaló para python verison 2.7, y ejecuté el archivo python con "python3". por lo que debería instalar beautifulsoup4 para python 3.6;
con el
sudo pip3 install beautifulsoup4
puedes instalar el módulo para python 3.6fuente
si lo instaló de esta manera (si no, instale de esta manera):
y si usó este código (si no, use este código):
from bs4 import BeautifulSoup
Si usa el sistema Windows, verifique si hay un módulo, podría guardar una ruta diferente a su módulo
fuente
Tuve el mismo problema con eclipse en Windows 10.
Lo instalé como se recomienda en la ventana de comandos de Windows (cmd) con:
C:\Users\NAMEOFUSER\AppData\Local\Programs\Python\beautifulsoup4-4.8.2\setup.py install
BeautifulSoup se instaló así en mi directorio de Python:
C:\Users\NAMEOFUSE\AppData\Local\Programs\Python\Python38\Lib\site-packages\beautifulsoup4-4.8.2-py3.8.egg
Después de copiar manualmente las carpetas bs4 y EGG-INFO en la carpeta site-packages, todo comenzó a funcionar, también el ejemplo:
from bs4 import BeautifulSoup html = """ <html> <body> <p> Ich bin ein Absatz!</p> </body> </html> """ print(html) soup = BeautifulSoup(html, 'html.parser') print(soup.find_all("p"))
fuente