Quiero descargar HTML (ejemplo: http://www.brpreiss.com/books/opus6/ ) y unirlo a un HTML u otro formato que pueda usar en el lector de libros electrónicos. Los sitios con libros gratuitos no tienen paginación estándar, no son blogs o foros, por lo que no saben cómo rastrear y fusionar automáticamente.
ebook
web-crawler
Hrvoje Hudo
fuente
fuente
La forma en que solía hacer esto era Calibre.
Sin embargo, eso se volvió demasiado doloroso, así que construí una extensión de Chrome para que sea más fácil.
Se llama EpubPress ( http://epub.press ).
Le permite crear un libro electrónico desde sus pestañas de Chrome.
¡Espero que ayude!
fuente
Pandoc puede tomar un enlace a una página (o un archivo html) y convertirlo a pdf / epub ...
No estoy seguro de si se arrastraría. Si no lo hace, puede rastrear páginas primero con wget o algo (o simplemente recopilar enlaces) y dárselo a pandoc.
fuente
Puede usar https://getpocket.com y la receta de bolsillo en calibre accesible a través del menú "Obtener noticias".
fuente
HTTrack es una buena opción: creará un libro electrónico desde un sitio web: está disponible para descargar desde aquí: https://www.httrack.com/ HTTrack "le permite descargar un sitio de la World Wide Web de Internet a un local directorio, construyendo recursivamente todos los directorios, obteniendo HTML, imágenes y otros archivos del servidor a su computadora. HTTrack organiza la estructura de enlaces relativa del sitio original ".
Luego puede convertir el HTML en un EPUB, AZW3 o PDF usando Calibre, o cualquier otro software de conversión de HTML a epub.
Una segunda opción para convertir directamente a EPUB es EpubPress: tiene extensiones para permitir el uso desde Firefox (solo v44.0 +) o Chrome. Para utilizar este software, debe abrir una ventana del navegador. Cada pestaña es esencialmente un 'capítulo' en su libro electrónico. Organice las pestañas en el orden de aparición deseado, luego active epubpress: descargará y organizará las pestañas en su orden de aparición, en formato .epub. ¡Espero que esto ayude!
* Sin embargo, tenga en cuenta que EpubPress descarga páginas web discretas, no un "sitio web", en HTTrack sí. Para descargar un sitio web con EpubPress, debe abrir cada enlace en el sitio web como una pestaña separada, luego usar Epubpress para recopilar estos enlaces en formato .epub.
fuente