He estado tratando de usar s3fs en un servidor EC2 pero es muy lento. Pasé las últimas 5 horas cargando 100 MB de archivos pequeños.
¿Hay algo que pueda hacer para mejorar el rendimiento o está relacionado con S3fs? Si no, ¿qué alternativa podría usar?
amazon-ec2
s3fs
MEGABYTE.
fuente
fuente
Respuestas:
S3FS puede no ser la mejor opción para una gran cantidad de archivos más pequeños. La sobrecarga con S3FS también es bastante alta. Sugeriría usar algo como S3Curl
Incluso puede obtener transferencias paralelas. Solo recuerde que nunca será rápido como EBS / almacenamiento local.
Si necesita tenerlo como un almacenamiento 'montable', las únicas alternativas a S3FS que conozco son S3Backer o s3ql
fuente
s3ql
?Acabo de comparar los riofs en comparación con s3fs. Mi caso de prueba fue un script bash relativamente simple que ejecutó pngquant en cada .png que encontró. En un testbucket con ~ 70 imágenes de las cuales ~ 20 donde png (repartidas en muchos subdirectorios, que probablemente ralentizan las cosas) los resultados donde:
s3fs: 3m54
riofs: 15.9s
¡Entonces, para este caso de prueba, riofs es ~ 15 veces más rápido! La configuración también fue muy sencilla, aunque los documentos son algo breves.
Con respecto al hecho de que el script aún tardó 15.9s: no es muy eficiente, también ejecutar pngquant en png es un proceso intensivo de CPU.
fuente
AWS message: The authorization mechanism you have provided is not supported. Please use AWS4-HMAC-SHA256.
Solo agrego riofs a la mezcla. No pude ver ningún punto de referencia por ahora, pero hay un problema / solicitud que cualquiera puede hacer.
fuente
Acabo de lanzar la v0.0.1 de https://github.com/kahing/goofys que fue en parte motivada por problemas de rendimiento en s3fs. La aceleración de la creación de archivos es de 3-6x y el tiempo para el primer byte es de 58x. Comentarios bienvenidos!
fuente
Solía [1] y es muy bueno. Es una gran cantidad de comandos y facilita el acceso a aws y s3.
fuente
Comparé s3fs con riofs, y casi cambié debido a un rendimiento notablemente mejor. El problema es que riofs todavía no se actualiza a las firmas v4, lo que significa que no funcionará con los buckets s3 de Frankfurt o China. Según el propietario, hay una actualización en camino. Si no usa Frankfurt o China, riofs es una mejor opción.
fuente
Esto es bastante viejo, pero puede ayudar a quien llegue aquí.
Estoy usando aws cli y funciona muy bien (3 Mb / s)
fuente