Patrones de diseño o mejores prácticas para scripts de shell [cerrado]

167

¿Alguien sabe de algún recurso que hable sobre las mejores prácticas o patrones de diseño para scripts de shell (sh, bash, etc.)?

usuario14437
fuente
2
Anoche escribí un pequeño artículo sobre el patrón de plantilla en BASH . Mira lo que piensas.
quickshiftin

Respuestas:

222

Escribí scripts de shell bastante complejos y mi primera sugerencia es "no". La razón es que es bastante fácil cometer un pequeño error que obstaculiza tu script, o incluso hacerlo peligroso.

Dicho esto, no tengo otros recursos para pasarte sino mi experiencia personal. Esto es lo que normalmente hago, que es exagerado, pero tiende a ser sólido, aunque muy detallado.

Invocación

Haz que tu script acepte opciones largas y cortas. tenga cuidado porque hay dos comandos para analizar opciones, getopt y getopts. Use getopt mientras enfrenta menos problemas.

CommandLineOptions__config_file=""
CommandLineOptions__debug_level=""

getopt_results=`getopt -s bash -o c:d:: --long config_file:,debug_level:: -- "$@"`

if test $? != 0
then
    echo "unrecognized option"
    exit 1
fi

eval set -- "$getopt_results"

while true
do
    case "$1" in
        --config_file)
            CommandLineOptions__config_file="$2";
            shift 2;
            ;;
        --debug_level)
            CommandLineOptions__debug_level="$2";
            shift 2;
            ;;
        --)
            shift
            break
            ;;
        *)
            echo "$0: unparseable option $1"
            EXCEPTION=$Main__ParameterException
            EXCEPTION_MSG="unparseable option $1"
            exit 1
            ;;
    esac
done

if test "x$CommandLineOptions__config_file" == "x"
then
    echo "$0: missing config_file parameter"
    EXCEPTION=$Main__ParameterException
    EXCEPTION_MSG="missing config_file parameter"
    exit 1
fi

Otro punto importante es que un programa siempre debe devolver cero si se completa con éxito, no cero si algo salió mal.

Llamadas a funciones

Puede llamar a funciones en bash, solo recuerde definirlas antes de la llamada. Las funciones son como scripts, solo pueden devolver valores numéricos. Esto significa que debe inventar una estrategia diferente para devolver valores de cadena. Mi estrategia es usar una variable llamada RESULTADO para almacenar el resultado y devolver 0 si la función se completó limpiamente. Además, puede generar excepciones si devuelve un valor diferente de cero y luego establecer dos "variables de excepción" (mine: EXCEPTION y EXCEPTION_MSG), la primera contiene el tipo de excepción y la segunda un mensaje legible por humanos.

Cuando llama a una función, los parámetros de la función se asignan a los vars especiales $ 0, $ 1, etc. Le sugiero que los ponga en nombres más significativos. declare las variables dentro de la función como locales:

function foo {
   local bar="$0"
}

Situaciones propensas a errores

En bash, a menos que declare lo contrario, una variable no establecida se usa como una cadena vacía. Esto es muy peligroso en caso de error tipográfico, ya que la variable mal escrita no se informará y se evaluará como vacía. utilizar

set -o nounset

para evitar que esto suceda. Sin embargo, tenga cuidado, porque si hace esto, el programa abortará cada vez que evalúe una variable indefinida. Por esta razón, la única forma de verificar si una variable no está definida es la siguiente:

if test "x${foo:-notset}" == "xnotset"
then
    echo "foo not set"
fi

Puede declarar variables como de solo lectura:

readonly readonly_var="foo"

Modularización

Puede lograr una modularización "similar a Python" si usa el siguiente código:

set -o nounset
function getScriptAbsoluteDir {
    # @description used to get the script path
    # @param $1 the script $0 parameter
    local script_invoke_path="$1"
    local cwd=`pwd`

    # absolute path ? if so, the first character is a /
    if test "x${script_invoke_path:0:1}" = 'x/'
    then
        RESULT=`dirname "$script_invoke_path"`
    else
        RESULT=`dirname "$cwd/$script_invoke_path"`
    fi
}

script_invoke_path="$0"
script_name=`basename "$0"`
getScriptAbsoluteDir "$script_invoke_path"
script_absolute_dir=$RESULT

function import() { 
    # @description importer routine to get external functionality.
    # @description the first location searched is the script directory.
    # @description if not found, search the module in the paths contained in $SHELL_LIBRARY_PATH environment variable
    # @param $1 the .shinc file to import, without .shinc extension
    module=$1

    if test "x$module" == "x"
    then
        echo "$script_name : Unable to import unspecified module. Dying."
        exit 1
    fi

    if test "x${script_absolute_dir:-notset}" == "xnotset"
    then
        echo "$script_name : Undefined script absolute dir. Did you remove getScriptAbsoluteDir? Dying."
        exit 1
    fi

    if test "x$script_absolute_dir" == "x"
    then
        echo "$script_name : empty script path. Dying."
        exit 1
    fi

    if test -e "$script_absolute_dir/$module.shinc"
    then
        # import from script directory
        . "$script_absolute_dir/$module.shinc"
    elif test "x${SHELL_LIBRARY_PATH:-notset}" != "xnotset"
    then
        # import from the shell script library path
        # save the separator and use the ':' instead
        local saved_IFS="$IFS"
        IFS=':'
        for path in $SHELL_LIBRARY_PATH
        do
            if test -e "$path/$module.shinc"
            then
                . "$path/$module.shinc"
                return
            fi
        done
        # restore the standard separator
        IFS="$saved_IFS"
    fi
    echo "$script_name : Unable to find module $module."
    exit 1
} 

luego puede importar archivos con la extensión .shinc con la siguiente sintaxis

importar "AModule / ModuleFile"

Que se buscará en SHELL_LIBRARY_PATH. Como siempre importa en el espacio de nombres global, recuerde prefijar todas sus funciones y variables con un prefijo apropiado, de lo contrario corre el riesgo de conflictos de nombres. Yo uso doble guión bajo como el punto de python.

Además, ponga esto como lo primero en su módulo

# avoid double inclusion
if test "${BashInclude__imported+defined}" == "defined"
then
    return 0
fi
BashInclude__imported=1

Programación orientada a objetos

En bash, no puedes hacer programación orientada a objetos, a menos que construyas un sistema bastante complejo de asignación de objetos (pensé en eso. Es factible, pero loco). En la práctica, sin embargo, puede hacer "programación orientada a Singleton": tiene una instancia de cada objeto, y solo una.

Lo que hago es: defino un objeto en un módulo (ver la entrada de modularización). Luego defino vars vacíos (análogos a las variables miembro) una función init (constructor) y funciones miembro, como en este código de ejemplo

# avoid double inclusion
if test "${Table__imported+defined}" == "defined"
then
    return 0
fi
Table__imported=1

readonly Table__NoException=""
readonly Table__ParameterException="Table__ParameterException"
readonly Table__MySqlException="Table__MySqlException"
readonly Table__NotInitializedException="Table__NotInitializedException"
readonly Table__AlreadyInitializedException="Table__AlreadyInitializedException"

# an example for module enum constants, used in the mysql table, in this case
readonly Table__GENDER_MALE="GENDER_MALE"
readonly Table__GENDER_FEMALE="GENDER_FEMALE"

# private: prefixed with p_ (a bash variable cannot start with _)
p_Table__mysql_exec="" # will contain the executed mysql command 

p_Table__initialized=0

function Table__init {
    # @description init the module with the database parameters
    # @param $1 the mysql config file
    # @exception Table__NoException, Table__ParameterException

    EXCEPTION=""
    EXCEPTION_MSG=""
    EXCEPTION_FUNC=""
    RESULT=""

    if test $p_Table__initialized -ne 0
    then
        EXCEPTION=$Table__AlreadyInitializedException   
        EXCEPTION_MSG="module already initialized"
        EXCEPTION_FUNC="$FUNCNAME"
        return 1
    fi


    local config_file="$1"

      # yes, I am aware that I could put default parameters and other niceties, but I am lazy today
      if test "x$config_file" = "x"; then
          EXCEPTION=$Table__ParameterException
          EXCEPTION_MSG="missing parameter config file"
          EXCEPTION_FUNC="$FUNCNAME"
          return 1
      fi


    p_Table__mysql_exec="mysql --defaults-file=$config_file --silent --skip-column-names -e "

    # mark the module as initialized
    p_Table__initialized=1

    EXCEPTION=$Table__NoException
    EXCEPTION_MSG=""
    EXCEPTION_FUNC=""
    return 0

}

function Table__getName() {
    # @description gets the name of the person 
    # @param $1 the row identifier
    # @result the name

    EXCEPTION=""
    EXCEPTION_MSG=""
    EXCEPTION_FUNC=""
    RESULT=""

    if test $p_Table__initialized -eq 0
    then
        EXCEPTION=$Table__NotInitializedException
        EXCEPTION_MSG="module not initialized"
        EXCEPTION_FUNC="$FUNCNAME"
        return 1
    fi

    id=$1

      if test "x$id" = "x"; then
          EXCEPTION=$Table__ParameterException
          EXCEPTION_MSG="missing parameter identifier"
          EXCEPTION_FUNC="$FUNCNAME"
          return 1
      fi

    local name=`$p_Table__mysql_exec "SELECT name FROM table WHERE id = '$id'"`
      if test $? != 0 ; then
        EXCEPTION=$Table__MySqlException
        EXCEPTION_MSG="unable to perform select"
        EXCEPTION_FUNC="$FUNCNAME"
        return 1
      fi

    RESULT=$name
    EXCEPTION=$Table__NoException
    EXCEPTION_MSG=""
    EXCEPTION_FUNC=""
    return 0
}

Señales de captura y manejo

Encontré esto útil para atrapar y manejar excepciones.

function Main__interruptHandler() {
    # @description signal handler for SIGINT
    echo "SIGINT caught"
    exit
} 
function Main__terminationHandler() { 
    # @description signal handler for SIGTERM
    echo "SIGTERM caught"
    exit
} 
function Main__exitHandler() { 
    # @description signal handler for end of the program (clean or unclean). 
    # probably redundant call, we already call the cleanup in main.
    exit
} 

trap Main__interruptHandler INT
trap Main__terminationHandler TERM
trap Main__exitHandler EXIT

function Main__main() {
    # body
}

# catch signals and exit
trap exit INT TERM EXIT

Main__main "$@"

Consejos

Si algo no funciona por alguna razón, intente reordenar el código. El orden es importante y no siempre es intuitivo.

ni siquiera consideres trabajar con tcsh. no admite funciones, y es horrible en general.

Espero que ayude, aunque tenga en cuenta. Si tiene que usar el tipo de cosas que escribí aquí, significa que su problema es demasiado complejo para resolverlo con Shell. usa otro idioma Tuve que usarlo debido a factores humanos y legado.

Stefano Borini
fuente
77
Wow, y pensé que iba a exagerar en bash ... Tiendo a usar funciones aisladas y abusar de subcapas (por lo tanto, sufro cuando la velocidad es relevante de alguna manera). Nunca hay variables globales, ni dentro ni fuera (para preservar los restos de la cordura). Todo vuelve a través de stdout o salida de archivo. set -u / set -e (un set demasiado malo -e se vuelve inútil tan pronto como primero, y la mayoría de mi código a menudo está allí). Argumentos de función tomados con [algo local = "$ 1"; shift] (permite reordenar fácilmente al refactorizar). Después de un guión bash de 3000 líneas, tiendo a escribir incluso los guiones más pequeños de esta manera ...
Eugene
Pequeñas correcciones para la modularización: 1 necesita un retorno después. "$ script_absolute_dir / $ module.shinc" para evitar advertencias faltantes. 2 debe establecer IFS = "$ saved_IFS" antes de su retorno al módulo de búsqueda en $ SHELL_LIBRARY_PATH
Duff
Los "factores humanos" son los peores. Las máquinas no luchan contigo cuando les das algo mejor.
jeremyjjbrown
1
¿Por qué getoptvs getopts? getoptses más portátil y funciona en cualquier shell POSIX. Especialmente dado que la pregunta es las mejores prácticas de shell en lugar de las mejores prácticas de bash específicamente, apoyaría el cumplimiento de POSIX para admitir múltiples shells cuando sea posible.
Wimateeka
1
gracias por ofrecer todos los consejos para las secuencias de comandos de shell aunque sea honesto: "Espero que ayude, aunque tenga en cuenta. Si tiene que usar el tipo de cosas que escribí aquí, significa que su problema es demasiado complejo para resolverlo". shell. use otro idioma. Tuve que usarlo debido a factores humanos y legado ".
dieHellste
25

Eche un vistazo a la Guía avanzada de secuencias de comandos Bash para obtener mucha sabiduría sobre las secuencias de comandos de shell, no solo Bash, tampoco.

No escuches a las personas que te dicen que mires a otros idiomas, posiblemente más complejos. Si las secuencias de comandos de shell satisfacen tus necesidades, úsalas. Desea funcionalidad, no fantasía. Los nuevos idiomas brindan nuevas y valiosas habilidades para su currículum, pero eso no ayuda si tiene trabajo que debe hacerse y ya conoce shell.

Como se indicó, no hay muchas "mejores prácticas" o "patrones de diseño" para el script de shell. Los diferentes usos tienen diferentes directrices y sesgos, como cualquier otro lenguaje de programación.

jtimberman
fuente
9
Tenga en cuenta que para los guiones de incluso leve complejidad, esa NO es una práctica recomendada. La codificación no se trata solo de hacer que algo funcione. Se trata de construirlo de manera rápida, fácil y ser confiable, reutilizable y fácil de leer y mantener (especialmente para otros). Los scripts de shell no se escalan bien a ningún nivel. Los lenguajes más robustos son mucho más simples para proyectos con cualquier lógica.
drifter
20

El script de shell es un lenguaje diseñado para manipular archivos y procesos. Si bien es excelente para eso, no es un lenguaje de propósito general, así que siempre trate de pegar la lógica de las utilidades existentes en lugar de recrear una nueva lógica en el script de shell.

Aparte de ese principio general, he recopilado algunos errores comunes de script de shell .

pixelbeat
fuente
11

Sepa cuándo usarlo. Para comandos de pegado rápido y sucio, está bien. Si necesita tomar más que pocas decisiones no triviales, bucles, cualquier cosa, vaya a Python, Perl y modularice .

El mayor problema con el caparazón es a menudo que el resultado final se ve como una gran bola de barro, 4000 líneas de golpe y crecimiento ... y no puedes deshacerte de él porque ahora todo tu proyecto depende de ello. Por supuesto, comenzó en 40 líneas de hermosa fiesta.

Paweł Hajdan
fuente
9

Fácil: use python en lugar de scripts de shell. Obtiene un aumento de casi 100 veces en la legibilidad, sin tener que complicar nada que no necesita, y preservando la capacidad de desarrollar partes de su script en funciones, objetos, objetos persistentes (zodb), objetos distribuidos (pyro) casi sin ningún tipo de código extra


fuente
77
se contradice diciendo "sin tener que complicarse" y luego enumerando las diversas complejidades que cree que agregan valor, mientras que en la mayoría de los casos se abusa de monstruos feos en lugar de usarse para simplificar los problemas y la implementación.
Evgeny
3
esto implica un gran inconveniente, sus scripts no serán portables en sistemas donde python no está presente
astropánico
1
Me doy cuenta de que esto fue respondido en el '08 (ahora son dos días antes del '12); sin embargo, para aquellos que lo vean años más tarde, advertiría a cualquiera que no le dé la espalda a lenguajes como Python o Ruby, ya que es más probable que esté disponible y, de lo contrario, es un comando (o un par de clics) lejos de ser instalado . Si necesita más portabilidad, piense en escribir su programa en Java, ya que será difícil encontrar una máquina que no tenga una JVM disponible.
Wil Moore III
@astropanic casi todos los puertos Linux con Python hoy en día
Pithikos
@Pithikos, claro, y juega con la molestia de python2 vs python3. Hoy en día escribo todas mis herramientas con go, y no puedo estar más feliz.
Astropanic
9

use set -e para no avanzar después de los errores. Intente hacerlo compatible con sh sin depender de bash si desea que se ejecute en no Linux.

usuario10392
fuente
7

Para encontrar algunas "mejores prácticas", observe cómo las distribuciones de Linux (por ejemplo, Debian) escriben sus scripts de inicio (generalmente se encuentran en /etc/init.d)

La mayoría de ellos no tienen "bash-isms" y tienen una buena separación de los ajustes de configuración, los archivos de la biblioteca y el formato de origen.

Mi estilo personal es escribir un script maestro que defina algunas variables predeterminadas y luego intente cargar ("fuente") un archivo de configuración que puede contener nuevos valores.

Intento evitar las funciones, ya que tienden a hacer que el script sea más complicado. (Perl fue creado para ese propósito).

Para asegurarse de que el script sea portátil, pruebe no solo con #! / Bin / sh, sino que también use #! / Bin / ash, #! / Bin / dash, etc. Pronto detectará el código específico de Bash.

Willem
fuente
-1

O la cita anterior similar a lo que dijo Joao:

"Usa perl. Querrás saber bash pero no usarlo".

Lamentablemente olvidé quién dijo eso.

Y sí, en estos días recomendaría Python sobre Perl.

Sarien
fuente