Restando enteros de 8 bits empaquetados en un entero de 64 bits por 1 en paralelo, SWAR sin SIMD de hardware

Si tengo un entero de 64 bits que estoy interpretando como una matriz de enteros de 8 bits con 8 elementos. Necesito restar la constante1 de cada entero empaquetado mientras manejo el desbordamiento sin que el resultado de un elemento afecte el resultado de otro elemento. Tengo este código en este...