Necesitaría un programa, que muestre el número de los diferentes caracteres en un archivo. Ejemplo:
> stats testfile
' ': 207
'e': 186
'n': 102
Existe alguna herramienta, que haga esto?
command-line
files
text-processing
Mnementh
fuente
fuente
sed 's/\(.\)/\1\'$'\n/g' text.txt
sed
esto, pero la solución Python de Jacob Vlijm funcionó bien para mí.La solución de Steven es buena y simple. No es tan eficaz para archivos muy grandes (archivos que no caben cómodamente en aproximadamente la mitad de su RAM) debido al paso de clasificación. Aquí hay una versión awk. También es un poco más complicado, ya que trata de hacer lo correcto para algunos caracteres especiales (saltos de línea,
'
,\
,:
).Aquí hay una solución de Perl con el mismo principio. Perl tiene la ventaja de poder clasificar internamente. Además, esto no contará correctamente una nueva línea adicional si el archivo no termina en un carácter de nueva línea.
fuente
Una versión lenta pero relativamente amigable con la memoria, que usa ruby. Alrededor de una docena de MB de RAM, independientemente del tamaño de entrada.
fuente