awk -F '|' '$1 ~ /smiths/ {sum += $3} END {print sum}' inputfilename
- La
-F
bandera establece el separador de campo; Lo pongo entre comillas simples porque es un personaje especial de shell.
- Luego
$1 ~ /smiths/
aplica el siguiente {bloque de código} solo a las líneas donde el primer campo coincide con la expresión regular /smiths/
.
- El resto es igual a tu código.
Tenga en cuenta que dado que realmente no está usando una expresión regular aquí, solo un valor específico, podría usar con la misma facilidad:
awk -F '|' '$1 == "smiths" {sum += $3} END {print sum}' inputfilename
Que verifica la igualdad de la cadena. Esto es equivalente a usar la expresión regular /^smiths$/
, como se menciona en otra respuesta, que incluye el ^
ancla para que solo coincida con el inicio de la cadena (el inicio del campo 1) y el $
ancla para que solo coincida con el final de la cadena. No estoy seguro de qué tan familiarizado está con las expresiones regulares. Son muy potentes, pero para este caso podría usar una verificación de igualdad de cadena con la misma facilidad.
unzip -lv /appl/tmp/data.lar | grep documentlibrary | awk '{sum += $1} END {print sum/1024/1024}'
Otro enfoque es utilizar matrices asociativas awk, más información aquí . Esta línea produce la salida deseada:
Como efecto secundario, la matriz almacena todos los demás valores:
Salida:
fuente
Muy bien hasta ahora. Todo lo que necesita hacer es agregar un selector antes del bloque para agregar la suma. Aquí comprobamos que el primer argumento contiene solo "herreros":
Puede acortar esto un poco especificando el separador de campo como una opción. En
awk
general, es una buena idea inicializar variables en la línea de comando:fuente
-F
opción para especificar separador.$NF
es para la "última columna".fuente
cat
ygrep
son innecesarios aquí/smiths/{...}
si la llamada grep no está allí. Esta es una modificación trivial, pero proporciona beneficios significativos: disminuye el número de procesos en ejecución, simplifica el control de errores y aclara el código.Personalmente, preferiría mantener la
awk
sección lo más simple posible y hacer todo lo que pueda sin ella. La lógica combinada no aprovecha el poder de las tuberías de Unix y, por lo tanto, es más difícil de entender, depurar o modificar para casos de uso estrechamente relacionados.fuente