¿Cómo convierto un archivo Safari Webarchive en una carpeta?

16

Entiendo que Safari Webarchive es un archivo único con el código fuente y otros recursos de una página web concatenados en un solo archivo. Encontré un artículo de Macworld de 2006 que describe un programa que hace exactamente esto, pero el enlace al programa ya no está actualizado.

¿Existe algún software actualmente disponible que pueda convertir un archivo de almacenamiento web de Safari a un formato más estándar?

Daniel
fuente

Respuestas:

7

WebArchiveExtractor

Recomiendo WebArchiveExtractor. Puede arrastrar archivos .webarchive a esta aplicación que extraerá el archivo en sus archivos individuales en una carpeta.

Puede personalizar la salida en Preferencias, incluida la configuración de un nombre de archivo de índice personalizado:

WebArchiveExtractor es de código abierto en GitHub

grg
fuente
WebArchive Extractor no funciona para mí a partir del 9 de diciembre de 2019. Estoy usando macOS 10.14.4 (18E226) Mojave en un archivo .webarchive de Safari.
Merchako
11

¿Existe algún software actualmente disponible que pueda convertir un archivo de almacenamiento web de Safari a un formato más estándar?

Si se siente cómodo con la línea de comandos, hay una herramienta textutilen Mac OS para convertir archivos de almacenamiento web a txt, html, rtf, rtfd, doc, docx, wordml o odt.

Ejemplo:
textutil -convert html /Users/USERNAME/NAME.webarchive


Para convertir archivos webarchive a pdf, intente "Wondershare PDF Editor for Mac". http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

Ivan Chau
fuente
44
La textutilherramienta de línea de comandos solo extrae el archivo html de nivel superior, y no el CSS o los scripts que también forman parte de la webarchive. (Lo cual es realmente el objetivo del archivo web). No he encontrado una buena forma alternativa de hacerlo desde la línea de comandos.
Stephen Harrison el
1
@Stephen WebArchiveExtractor tiene una acción de Automator que puede ser programada a través del shell.
grg
A pesar de las advertencias, ese es el tipo de respuesta que estaba buscando. Una solución de bases GUI es bastante inútil cuando desea convertir cientos de archivos web en un servidor.
Siete
Esto ni siquiera extrae el archivo HTML original, sino que lo convierte. Realmente es más como abrir un archivo HTML en TextEdit y reexportarlo.
sam