Convierta páginas web en un archivo para ebook

23

Quiero descargar HTML (ejemplo: http://www.brpreiss.com/books/opus6/ ) y unirlo a un HTML u otro formato que pueda usar en el lector de libros electrónicos. Los sitios con libros gratuitos no tienen paginación estándar, no son blogs o foros, por lo que no saben cómo rastrear y fusionar automáticamente.

Hrvoje Hudo
fuente

Respuestas:

13

Puede usar Calibre para sus necesidades de conversión de libros electrónicos. Puede hacer que cree un solo libro electrónico de múltiples archivos HTML al vincularlos desde un único archivo HTML que configure como una tabla de contenido como esta .

Señor alfa
fuente
Estoy usando Sigil para la conversión a EPUB, pero no sabía que Cailbre puede hacer un ebook a partir de un montón de htmls vinculados. Lo intentaré, gracias!
Hrvoje Hudo
1
Puede usar httrack.com para descargar las páginas web, luego usar Calibre para convertirlas a un formato ePub.
에이 바
3
Mi proceso es (usando Chrome) para usar el marcador de texto Instapaper Text para limpiar un poco, luego haga clic derecho -> Guardar como, elija guardar como una sola página web, solo HTML, luego abra esto en Calibre, convierta a EPub, luego use la funcionalidad Editar libro para ordenar cualquier trozo de marcado desordenado adicional que se detenga.
El Yobo
6

La forma en que solía hacer esto era Calibre.

Sin embargo, eso se volvió demasiado doloroso, así que construí una extensión de Chrome para que sea más fácil.

Se llama EpubPress ( http://epub.press ).

Le permite crear un libro electrónico desde sus pestañas de Chrome.

¡Espero que ayude!

HaroldT
fuente
3
El sitio web en su enlace sugiere que el empaque se produce en un servidor de terceros, la privacidad NO está garantizada con este método.
Burgi
¿Tiene sugerencias de cambios que lo hagan sentir más seguro? He hecho todo lo posible para requerir solo la información mínima necesaria para crear un libro, pero estoy abierto a recibir más comentarios. Si observa cualquier servicio comparable, encontrará que cualquier contenido que desee guardar se envía a un servidor. La diferencia es que esos servicios también requieren una cuenta y tienen todo el contenido asociado a su nombre. Tampoco proporcionan el código fuente de sus sitios web para permitirle ver lo que recopilan. La extensión es de código abierto y estoy feliz de responder cualquier pregunta sobre ese código.
HaroldT
¡Qué gran herramienta! ¡Muchas gracias por proporcionarlo a la comunidad de forma gratuita!
vonjd
5

Pandoc puede tomar un enlace a una página (o un archivo html) y convertirlo a pdf / epub ...

No estoy seguro de si se arrastraría. Si no lo hace, puede rastrear páginas primero con wget o algo (o simplemente recopilar enlaces) y dárselo a pandoc.

ananth.p
fuente
de acuerdo con la página del comando man: "En lugar de un archivo, se puede proporcionar un URI absoluto. En este caso, pandoc buscará el contenido usando HTTP"
jopasserat
1

Puede usar https://getpocket.com y la receta de bolsillo en calibre accesible a través del menú "Obtener noticias".

ingrese la descripción de la imagen aquí

gagarina
fuente
1

HTTrack es una buena opción: creará un libro electrónico desde un sitio web: está disponible para descargar desde aquí: https://www.httrack.com/ HTTrack "le permite descargar un sitio de la World Wide Web de Internet a un local directorio, construyendo recursivamente todos los directorios, obteniendo HTML, imágenes y otros archivos del servidor a su computadora. HTTrack organiza la estructura de enlaces relativa del sitio original ".

Luego puede convertir el HTML en un EPUB, AZW3 o PDF usando Calibre, o cualquier otro software de conversión de HTML a epub.

Una segunda opción para convertir directamente a EPUB es EpubPress: tiene extensiones para permitir el uso desde Firefox (solo v44.0 +) o Chrome. Para utilizar este software, debe abrir una ventana del navegador. Cada pestaña es esencialmente un 'capítulo' en su libro electrónico. Organice las pestañas en el orden de aparición deseado, luego active epubpress: descargará y organizará las pestañas en su orden de aparición, en formato .epub. ¡Espero que esto ayude!

* Sin embargo, tenga en cuenta que EpubPress descarga páginas web discretas, no un "sitio web", en HTTrack sí. Para descargar un sitio web con EpubPress, debe abrir cada enlace en el sitio web como una pestaña separada, luego usar Epubpress para recopilar estos enlaces en formato .epub.

str8arrow
fuente