Cómo abrir el archivo HTML en Python
file = codecs.open("sample.html", "r", "utf-8")
Exuberant Elephant
file = codecs.open("sample.html", "r", "utf-8")