Por alguna razón, cuando hago un archivo de texto en OS X, siempre es de al menos 4kB, a menos que esté en blanco. ¿Por qué es esto? ¿Podría haber 4.000 bytes de metadatos sobre 1 byte de texto sin formato?
filesystems
disk-usage
tkbx
fuente
fuente
:P
Respuestas:
El tamaño del bloque del sistema de archivos debe ser de 4 kB. Cuando los datos se escriben en un archivo que está contenido en un sistema de archivos, el sistema operativo debe asignar bloques de almacenamiento para contener los datos que se escribirán en el archivo.
Por lo general, cuando se crea un sistema de archivos, el almacenamiento contenido en ese sistema de archivos se segmenta en bloques de un tamaño fijo. Este artículo de Wikipedia explica brevemente este proceso.
El tamaño de bloque subyacente del sistema de archivos para este archivo debe tener un tamaño de bloque de 4 bytes. Este archivo está usando 1 bloque 4K y solo un byte dentro de ese bloque contiene datos reales.
fuente
Todos los sistemas de archivos tienen un tamaño de clúster o bloque, o la menor cantidad de espacio en disco que se puede asignar para contener un archivo. Incluso si el tamaño real del archivo es menor que el tamaño del clúster / bloque, seguirá consumiendo un clúster o 4K en su sistema de archivos. El tamaño del clúster depende del sistema de archivos y las opciones del sistema de archivos.
Si contiene cero bytes, como señaló Gilles , utiliza cero bloques / agrupaciones pero un inodo en los sistemas de archivos típicos * nix, que responde mejor a la advertencia, "a menos que esté en blanco".
fuente
Un pequeño experimento para ayudar a ilustrar esto:
Primero, veamos cuál es el tamaño de bloque real de mi partición root ext4 (LVM):
Es 4096 (4 KiB), como se esperaba. Ahora, creemos tres archivos: el primero es cero bytes, el segundo es solo un byte y el tercero es 4 KiB (el tamaño del bloque):
Ahora, nosotros
ls
el directorio. Usamos la-s
opción para ver el tamaño asignado (la columna más a la izquierda), en número de "bloques" de 1024 bytes.(ls no sabe que el tamaño real del bloque es 4096; podríamos especificarlo,
--block-size
pero eso escala todo por ese valor, y también queremos ver el tamaño real del archivo en bytes) .Aquí se pueden observar dos cosas:
Archivos dispersos
Los archivos dispersos son archivos con grandes bloques de ceros. Debido a que se sabe que los datos son todos cero, no tiene sentido almacenarlos en el disco. De esta manera, el tamaño aparente de un archivo puede ser mayor que el tamaño en disco.
Datos en linea
Tenga en cuenta que algunos sistemas de archivos permiten almacenar el contenido de archivos muy pequeños en el propio inodo . Consulte ¿Es posible almacenar datos directamente dentro de un inodo en un sistema de archivos Unix / Linux? .
fuente