Conozco du -sh
los sistemas de archivos comunes de Linux. ¿Pero cómo hacer eso con HDFS?
hadoop
command-line
directory
hdfs
Cheng
fuente
fuente
hadoop fs -du -s -h /path/to/dir
muestra el tamaño de un directorio en forma legible.fuente
hdfs -du -s -h /path/to/dir
es más apropiado.Extendiéndose a Matt D y otras respuestas, el comando puede ser hasta Apache Hadoop 3.0.0
El du devuelve tres columnas con el siguiente formato:
Comando de ejemplo:
Código de salida: devuelve 0 en caso de éxito y -1 en caso de error.
fuente: Apache doc
fuente
Con esto obtendrás tamaño en GB
fuente
Al intentar calcular el total de un grupo particular de archivos dentro de un directorio, la
-s
opción no funciona (en Hadoop 2.7.1). Por ejemplo:Estructura de directorios:
Suponga que cada archivo tiene un tamaño de 1 KB. Puede resumir todo el directorio con:
Sin embargo, si quiero la suma de todos los archivos que contienen "contar", el comando se queda corto.
Para evitar esto, generalmente paso la salida a través de awk.
fuente
Para obtener el tamaño del directorio, se puede usar hdfs dfs -du -s -h / $ yourDirectoryName . hdfs dfsadmin -report se puede utilizar para ver un informe rápido de almacenamiento a nivel de clúster.
fuente
% de espacio utilizado en el clúster de Hadoop
sudo -u hdfs hadoop fs –df
Capacidad en carpeta específica:
sudo -u hdfs hadoop fs -du -h /user
fuente
hadoop fs -du -h /user
(no necesitaba usarsudo
)sudo
no es necesario y debe usarse con moderación.hadoop versión 2.3.33:
fuente
hdfs dfs -count <dir>
información de la página del manual:
fuente
El comando debe ser
hadoop fs -du -s -h \dirPath
-du [-s] [-h] ...: muestra la cantidad de espacio, en bytes, utilizado por los archivos que coinciden con el patrón de archivo especificado.
-s : en lugar de mostrar el tamaño de cada archivo individual que coincide con el
patrón, muestra el tamaño total (resumen).
-h : Formatea los tamaños de los archivos de una manera legible por humanos en lugar de una cantidad de bytes. (Ex MB / GB / TB, etc.)
Tenga en cuenta que, incluso sin la opción -s, esto solo muestra resúmenes de tamaño en un nivel de profundidad en un directorio.
La salida tiene el tamaño del formulario (ruta completa)
fuente