Muchas de las soluciones a continuación solo funcionan para un archivo (por ejemplo foo.c). ¿Alguna idea sobre el número total de líneas en un proyecto (por ejemplo, muchos archivos en la estructura de directorios y excluyendo archivos binarios)?
resolvePuzzles
55
@solvingPuzzles Creo que puedo responder esa parte. Para cualquier solución que funcione en un archivo, por ejemplo, "cat FILE | sed blah", puede trabajar en muchos archivos reemplazando "cat FILE" con un comando que enumera los nombres de archivo para operar, por ejemplo, "find. -Name '* .py '", y póngalo en" xargs cat ". por ejemplo, "find. -name '* .py' | xargs cat | sed '/ ^ \ s * $ / d' | wc -l"
Jonathan Hartley
2
@JonathanHartley @solvingPuzzles también hay programas como slocy clocque están aquí para hacer esos recuentos de líneas de código.
ASTOR
OP aquí: cuando pregunté por primera vez este problema, 'cloc' no hizo un muy buen trabajo en el código Python. Hoy en día es genial.
Jonathan Hartley
cloc también está disponible como módulo npm y ahorra mucho tiempo.
No estoy seguro de por qué estás usando gato allí. Use foo.c o foo.pl como nombre de archivo para pasar a sed. sed '/ ^ \ s * $ / d' foo.c | wc -l
Andy Lester
28
Solo hábito. Leo las canalizaciones de izquierda a derecha, lo que significa que generalmente empiezo con cat, luego acción, acción, acción, etc. Claramente, el resultado final es el mismo.
Michael Cramer
32
Para hacer esto para todos los archivos en todas las subcarpetas y para excluir comentarios con '//', extienda este comando a esto: find. -tipo f -name '* .c' -exec cat {} \; El | sed '/ ^ \ s * # / d; / ^ \ s * $ / d; / ^ \ s * \ / \ // d' | wc -l
Benjamin Intal
11
Usted puede leer de izquierda a derecha sin UUOC: < foo.pl sed 'stuff' | wc -l.
jw013
22
En términos generales, UUOC no es importante, pero la legibilidad sí lo es.
Lo anterior le dará el recuento total de líneas de código (líneas en blanco eliminadas) para un proyecto (carpeta actual y todas las subcarpetas de forma recursiva).
En el "./blog" "./punbb" "./js/3rdparty" y "./pma" anteriores están las carpetas que incluí en la lista negra ya que no escribí el código en ellas. También .php, .as, .sql, .css, .js son las extensiones de los archivos que se están mirando. Cualquier archivo con una extensión diferente se ignora.
Debe agregar un $a grep ( ...\.js$|...) de lo contrario coincidirá feature.js.swp.
Xeoncross
Olvidó el anclaje, por lo que incluye archivos incorrectos. Y una versión aún más simple con anclaje:find . | egrep '.\.c$|.\.h$' | xargs cat | sed '/^\s*$/d' | wc -l
Mark Jeronimus
36
Si desea utilizar algo más que un script de shell, intente CLOC :
cloc cuenta líneas en blanco, líneas de comentarios y líneas físicas de código fuente en muchos lenguajes de programación. Está escrito completamente en Perl sin dependencias fuera de la distribución estándar de Perl v5.6 y superior (el código de algunos módulos externos está incrustado dentro de cloc) y, por lo tanto, es bastante portátil.
Cuando hice esta pregunta por primera vez, 'cloc' contaba las cadenas de documentos de Python como líneas de código, lo cual era un IMO subóptimo. Las versiones modernas de 'cloc' ahora cuentan las cadenas de documentos de Python como comentarios, lo que me gusta mucho más.
Jonathan Hartley
¡Esta es la respuesta correcta! Acabo de intentar salir y funciona bien.
LeeMobile
31
Hay muchas maneras de hacer esto, utilizando utilidades de shell comunes.
Mi solución es:
grep -cve '^\s*$'<file>
Esto busca líneas en <archivo> las líneas que no coinciden (-v) que coinciden con el patrón (-e) '^ \ s * $', que es el comienzo de una línea, seguido de 0 o más espacios en blanco, seguidos al final de una línea (es decir, sin contenido que no sea el espacio en blanco) y muestre un recuento de líneas coincidentes (-c) en lugar de las líneas coincidentes.
Una ventaja de este método sobre los métodos que involucran la conexión wces que puede especificar varios archivos y obtener un recuento separado para cada archivo:
¡Gracias! Por cierto, wc proporciona un recuento para cada archivo dado, más un total.
Jonathan Hartley
1
Sin embargo, no si lo está conectando, como estándar en cuentas como un solo archivo.
SpoonMeiser
Esta es la mejor respuesta en mi opinión.
simhumileco
-eno es necesario. Esa es la ubicación posicional normal del patrón y no estás haciendo nada raro con él. Pero no tiene nada de malo ser explícito, si ese es tu estilo.
Jacktose
13
'wc' cuenta líneas, palabras, caracteres, así que para contar todas las líneas (incluidas las en blanco) use:
wc *.py
Para filtrar las líneas en blanco, puede usar grep:
grep -v '^\s*$'*.py | wc
'-v' le dice a grep que muestre todas las líneas excepto aquellas que coinciden con '^' es el comienzo de una línea '\ s *' es cero o más espacios en blanco '$' es el final de una línea * .py es mi ejemplo para Todos los archivos que desea contar (todos los archivos de Python en el directorio actual) se envían a wc. Ya te vas.
Estoy respondiendo mi propia pregunta (genuina). No se pudo encontrar una entrada de stackoverflow que cubriera esto.
\ W no es una coincidencia para espacios en blanco, coincide con caracteres que no son palabras. Es lo opuesto a \ w, caracteres de palabras. \ W Emparejará todo lo que no sea alfanumérico o subrayado, y por lo tanto no hará lo que usted dice que hace aquí. Quieres decir \ s
SpoonMeiser
9
Este comando cuenta el número de líneas no en blanco. cat fileName | grep -v ^$ | wc -l grep -v ^ $ la función de expresión regular es ignorar líneas en blanco.
Yo votaría por esto solo porque literalmente nunca he visto a nadie usar preincrement en un script awk, pero desafortunadamente esto solo cuenta las líneas en blanco. :) ¿Quieres decir awk '!/^[[:space:]]*$/{++x} END{print x}'? O, si realmente odias los negativos awk '{y++} /^[[:space:]]*$/{++x} END{print y-x}',;)
dannysauer
4
grep -cvE '(^\s*[/*])|(^\s*$)' foo
-c = count
-v = exclude
-E = extended regex
'(comment lines) OR (empty lines)'
where
^= beginning of the line
\s = whitespace
*= any number of previous characters or none
[/*]= either / or *|= OR
$ = end of the line
Publico esto porque otras opciones me dieron respuestas incorrectas. Esto funcionó con mi fuente de Java, donde las líneas de comentarios comienzan con / o * (uso * en cada línea en comentarios de varias líneas).
Esta es una solución viable. Lo único a tener en cuenta: no cuenta los comentarios de varias líneas
Amol
2
Aquí hay un script Bash que cuenta las líneas de código en un proyecto. Atraviesa un árbol de origen de forma recursiva y excluye las líneas en blanco y los comentarios de una sola línea que usan "//".
# $excluded is a regex for paths to exclude from line counting
excluded="spec\|node_modules\|README\|lib\|docs\|csv\|XLS\|json\|png"
countLines(){# $total is the total lines of code counted
total=0# -mindepth exclues the current directory (".")for file in`find . -mindepth 1 -name "*.*" |grep -v "$excluded"`;do# First sed: only count lines of code that are not commented with //# Second sed: don't count blank lines# $numLines is the lines of code
numLines=`cat $file | sed '/\/\//d' | sed '/^\s*$/d' | wc -l`# To exclude only blank lines and count comment lines, uncomment this:#numLines=`cat $file | sed '/^\s*$/d' | wc -l`
total=$(($total + $numLines))
echo " " $numLines $file
done
echo " " $total in total
}
echo Source code files:
countLines
echo Unit tests:
cd spec
countLines
. coincide con espacios en blanco. Esta solución solo funciona si considera que una línea que contiene solo espacios en blanco no está en blanco, lo que técnicamente es, aunque probablemente no sea lo que busca.
SpoonMeiser
1
Script para contar recursivamente todas las líneas no en blanco con una determinada extensión de archivo en el directorio actual:
#!/usr/bin/env bash(
echo 0;for ext in"$@";dofor i in $(find .-name "*$ext");do
sed '/^\s*$/d' $i | wc -l ## skip blank lines#cat $i | wc -l; ## count all lines
echo +;donedone
echo p q;)| dc;
\ W es caracteres que no son palabras; esto no coincidirá con una línea como ${-[*]} + $@, por ejemplo. Que seguramente es un código válido en algún lugar del mundo. ;) Te refieres a \ s para el espacio.
dannysauer
0
Esto proporciona el recuento de la cantidad de líneas sin contar las líneas en blanco:
Oye. 'wc' por sí solo no busca subdirecciones, y no filtra las líneas en blanco, ambas solicitadas explícitamente en la pregunta.
Jonathan Hartley
wccuenta líneas en blanco. El OP quiere contar líneas no en blanco. Es cierto que tendrá que usar wc, pero sólo después de que ha sido corriente editada usandosed
foo.c
). ¿Alguna idea sobre el número total de líneas en un proyecto (por ejemplo, muchos archivos en la estructura de directorios y excluyendo archivos binarios)?sloc
ycloc
que están aquí para hacer esos recuentos de líneas de código.Respuestas:
Y si considera comentarios líneas en blanco:
Aunque, eso depende del idioma.
fuente
< foo.pl sed 'stuff' | wc -l
.Lo anterior le dará el recuento total de líneas de código (líneas en blanco eliminadas) para un proyecto (carpeta actual y todas las subcarpetas de forma recursiva).
En el "./blog" "./punbb" "./js/3rdparty" y "./pma" anteriores están las carpetas que incluí en la lista negra ya que no escribí el código en ellas. También .php, .as, .sql, .css, .js son las extensiones de los archivos que se están mirando. Cualquier archivo con una extensión diferente se ignora.
fuente
$
a grep (...\.js$|...
) de lo contrario coincidiráfeature.js.swp
.find . | egrep '.\.c$|.\.h$' | xargs cat | sed '/^\s*$/d' | wc -l
Si desea utilizar algo más que un script de shell, intente CLOC :
fuente
Hay muchas maneras de hacer esto, utilizando utilidades de shell comunes.
Mi solución es:
Esto busca líneas en <archivo> las líneas que no coinciden (-v) que coinciden con el patrón (-e) '^ \ s * $', que es el comienzo de una línea, seguido de 0 o más espacios en blanco, seguidos al final de una línea (es decir, sin contenido que no sea el espacio en blanco) y muestre un recuento de líneas coincidentes (-c) en lugar de las líneas coincidentes.
Una ventaja de este método sobre los métodos que involucran la conexión
wc
es que puede especificar varios archivos y obtener un recuento separado para cada archivo:fuente
-e
no es necesario. Esa es la ubicación posicional normal del patrón y no estás haciendo nada raro con él. Pero no tiene nada de malo ser explícito, si ese es tu estilo.'wc' cuenta líneas, palabras, caracteres, así que para contar todas las líneas (incluidas las en blanco) use:
Para filtrar las líneas en blanco, puede usar grep:
'-v' le dice a grep que muestre todas las líneas excepto aquellas que coinciden con '^' es el comienzo de una línea '\ s *' es cero o más espacios en blanco '$' es el final de una línea * .py es mi ejemplo para Todos los archivos que desea contar (todos los archivos de Python en el directorio actual) se envían a wc. Ya te vas.
Estoy respondiendo mi propia pregunta (genuina). No se pudo encontrar una entrada de stackoverflow que cubriera esto.
fuente
Este comando cuenta el número de líneas no en blanco.
cat fileName | grep -v ^$ | wc -l
grep -v ^ $ la función de expresión regular es ignorar líneas en blanco.
fuente
cat
en esta cadena:grep -v ^$ fileName | wl -l
wc -l
porque grep tiene-c
:grep -vc ^$ fileName
fuente
debería hacer el truco bien
fuente
fuente
awk '!/^[[:space:]]*$/{++x} END{print x}'
? O, si realmente odias los negativosawk '{y++} /^[[:space:]]*$/{++x} END{print y-x}'
,;)Publico esto porque otras opciones me dieron respuestas incorrectas. Esto funcionó con mi fuente de Java, donde las líneas de comentarios comienzan con / o * (uso * en cada línea en comentarios de varias líneas).
fuente
Aquí hay un script Bash que cuenta las líneas de código en un proyecto. Atraviesa un árbol de origen de forma recursiva y excluye las líneas en blanco y los comentarios de una sola línea que usan "//".
Así es como se ve la salida para mi proyecto :
¡Disfrutar! - Curran
fuente
Depende un poco de la cantidad de archivos que tenga en el proyecto. En teoría podrías usar
Donde puede llenar la lista de archivos utilizando la utilidad find.
Te daría un recuento de líneas por archivo.
fuente
Script para contar recursivamente todas las líneas no en blanco con una determinada extensión de archivo en el directorio actual:
Uso de la muestra:
fuente
Si desea la suma de todas las líneas que no están en blanco para todos los archivos de una extensión de archivo dada en un proyecto:
El primer argumento es el directorio base del proyecto, el segundo es la extensión del archivo. Uso de la muestra:
Es poco más que una colección de soluciones anteriores.
fuente
da un recuento agregado para todos los archivos en el directorio actual y sus subdirectorios.
HTH!
fuente
${-[*]} + $@
, por ejemplo. Que seguramente es un código válido en algún lugar del mundo. ;) Te refieres a \ s para el espacio.Esto proporciona el recuento de la cantidad de líneas sin contar las líneas en blanco:
fuente
da el recuento de líneas no en blanco en el directorio de trabajo actual.
fuente
Ya hay un programa para esto en Linux llamado 'wc'.
Sólo
y le da el total de líneas y las líneas para cada archivo.
fuente
wc
cuenta líneas en blanco. El OP quiere contar líneas no en blanco. Es cierto que tendrá que usarwc
, pero sólo después de que ha sido corriente editada usandosed