Error de copia de seguridad de SQL Server. Error: 3041, gravedad: 16, estado: 1

11

En primer lugar, soy muy nuevo en stackexchange, así que tengan paciencia conmigo.

Estoy ejecutando un SQL Server 9.0.4060.

Mi problema es: mi copia de seguridad de SQL Server sigue fallando en muchas bases de datos.

El plan de mantenimiento se ejecuta en diferentes trabajos de copia de seguridad:

Copia de seguridad DIFF todos los días a las 20:30 y copia de seguridad COMPLETA todos los domingos a las 20:30.

Recibo estos dos errores para cada base de datos que no puede completar la copia de seguridad:

Date        06-11-2012 20:31:06
Log     SQL Server (Current - 07-11-2012 11:43:00)
Source      Backup
Message
BACKUP failed to complete the command BACKUP DATABASE (dbname) WITH DIFFERENTIAL. Check the backup application log for detailed messages.

Date        06-11-2012 20:31:06
Log     SQL Server (Current - 07-11-2012 11:43:00)
Source      Backup
Message
Error: 3041, Severity: 16, State: 1.

Errores extra

Date     06-11-2012 17:53:27 
Log      SQL Server (Current - 07-11-2012 11:43:00) 
Source   Logon 
Message  Error: 18456, Severity: 14, State: 16.

Date     06-11-2012 17:53:27 
Log      SQL Server (Current - 07-11-2012 11:43:00) 
Source   Logon 
Message  Login failed for user 'sa'. [CLIENT: <local machine>]

Date     06-11-2012 20:30:11
Log      SQL Server (Current - 09-11-2012 11:27:00)
Source   spid15s
Message
SQL Server has encountered 2 occurrence(s) of cachestore flush for the 'Bound Trees' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.

Hay otros errores similares al anterior, con 'Planes SQL' y 'Planes de objetos'. En lugar de 'árboles encuadernados'.

Si ustedes necesitan alguna otra información, solo digan la palabra.

Arviddk
fuente
¿Hay errores anteriores al 3041 en el registro de errores del servidor sql? (no el registro de Windows)
Alex K.
Sí, existen estos dos errores: "Fecha 06-11-2012 17:53:27 Log SQL Server (Actual - 07-11-2012 11:43:00) Error de mensaje de inicio de sesión de origen: 18456, Gravedad: 14, Estado: 16. "" Fecha 06-11-2012 17:53:27 Log SQL Server (Actual - 07-11-2012 11:43:00) Fuente Inicio de sesión Mensaje Error de inicio de sesión para el usuario 'sa'. [CLIENTE: <máquina local> ] "
¿Hay más errores que eso?
swasheck el
Sí @swasheck, agregué algunos errores más en la descripción
Arviddk
¿son estas copias de seguridad nativas o está utilizando otro software de copia de seguridad?
swasheck el

Respuestas:

4

Como señaló Max, el error de inicio de sesión sa no se correlaciona con el tiempo de respaldo, ya que ocurre varias horas antes, sin embargo, el segundo sí lo hace. ¿Has buscado en: http://blogs.msdn.com/b/sqlprogrammability/archive/2007/01/17/10-0-plan-cache-flush.aspx

http://www.sqlservercentral.com/Forums/Topic377116-146-1.aspx#bm380502

¿Alguno de los elementos en el blog de MSDN juega un factor en su entorno? La más común sería AUTO_CLOSE ON. Háganos saber, gracias.

Ali Razeghi
fuente
AUTO_CLOSE está habilitado en 10 de 164 DB's. Conté 70 ocurrencias de 'Bound Trees', 'SQL Plans' y 'Object Plans' el 13/11/2012 21:45:24. El 13/11/2012 21:53:15 se restableció a 1 aparición de cada uno. Espero que esto ayude.
Arviddk
¿Le ayuda esto a identificar el error @ SQL-Learner? Le pregunté a los otros equipos de TI en mi departamento si sabían si alguno de los otros comandos mencionados en el blog de MSDN.
Arviddk
Hola Arviddk, ¡déjame investigarlo más hoy! Gracias.
Ali Razeghi
Bien, ¡espero su respuesta!
Arviddk
2

Por favor, eche un vistazo aquí: Cómo solucionar problemas de "Msg 3041" en SQL Server

Extracto de la página:

El mensaje 3041 es un informe genérico sobre la falla de la copia de seguridad. Para comprender la causa del error y resolverlo, debe usar las entradas del registro de errores de SQL Server que se producen antes de la entrada del evento 3041. Por lo general, 3041 está precedido por un mensaje de error detallado que indica la verdadera razón del error de la copia de seguridad. Los mensajes de error detallados se escriben solo en el registro de errores de SQL Server y en la aplicación cliente. El mensaje detallado no se informa en el registro de la aplicación en Windows.

Actualización (después de leer el comentario de @dezso)
He visto el "error adicional" informado, pero no estoy seguro de que estén relacionados con el error de la copia de seguridad. El error de copia de seguridad está fechado a las 20:31:06, pero el "error adicional" está fechado a las 17:53:27, por lo que el error adicional ocurrió aproximadamente 2 horas y 40 minutos antes del error de copia de seguridad real. Y estos errores adicionales están relacionados con un problema de inicio de sesión.

No creo que un problema de inicio de sesión que ocurra a las 17:53:27 pueda resultar en una falla de la copia de seguridad a las 20:31:06. Entonces, piense que el error de copia de seguridad y que el "error adicional" no están relacionados.

Tampoco creo que un error genérico que ocurra a las 17:53:27 pueda resultar en una falla de la copia de seguridad a las 20:31:06 (a menos que la base de datos sea realmente grande). @Arviddk informa que "mi copia de seguridad de SQL Server sigue fallando en muchas bases de datos " Creo que es seguro asumir que "mucho" significa más de 10 DB.
Por lo tanto, creo que si una sola copia de seguridad de una única base de datos toma más de 2 horas y 40 minutos, no puede tener 10 o 20 bases de datos como esa en un solo servidor ... o su servidor pasará su vida haciendo solo copias de seguridad. Por lo tanto, supuse que la copia de seguridad individual lleva mucho menos de 2 horas y 40 minutos, por lo que creo que el error de copia de seguridad y el error adicional no están relacionados.

Y el último error de "descarga de caché / 'Árboles enlazados'" informado está fechado en 06-11-2012 20:30:11, por lo que es algo que sucedió después del error de copia de seguridad. De todos modos, un problema relacionado con el caché no debería dar lugar a un error (evento si puede ralentizar algo).

Algunas preguntas
Algunas preguntas que podrían ayudar a identificar el problema:

  • ¿Cuánto tiempo lleva ejecutar una copia de seguridad COMPLETA?
  • ¿Cuánto tiempo lleva ejecutar una copia de seguridad DIFF?
  • ¿El error ocurre solo en la copia de seguridad DIFF?
  • ¿Qué porcentaje de respaldo falla? (1%? 10% 50%)
  • ¿Quizás pueda intentar hacer una copia de seguridad COMPLETA para verificar si se trata de un problema relacionado con la copia de seguridad DIFF? (Nunca he hecho ninguna copia de seguridad DIFF en SQL Server, no tengo experiencia con ellos)

Según el sitio web de MS en el registro de SQL Server, debería haber otros errores relacionados con la copia de seguridad fallida, pero espero algo más cercano, a tiempo, al momento en que falla la copia de seguridad.

Max
fuente
OP ya ha incluido mensajes de error anteriores a 3041, ¿cree que todavía no es suficiente? En caso afirmativo, modifique su publicación en consecuencia.
dezso
La copia de seguridad falla tanto para DIFF como para FULL. La copia de seguridad finaliza en promedio entre 2 y 3 minutos. (El último error se registra 2-3 minutos después del inicio de la copia de seguridad). Conté 100 de estos errores en la copia de seguridad DIFF del 13/11/2012 - "BACKUP no pudo completar el comando BACKUP DATABASE (dbname) WITH DIFFERENTIAL ....."
Arviddk
@Arviddk hablas de 164 DB, pero ¿están todas esas DB en un solo servidor? ¿Cómo se programan las copias de seguridad de la base de datos? ¿Quizás el error que ve puede estar relacionado con algún tipo de superposición de copias de seguridad programadas? (No sé si la ejecución simultánea de 2 o más copias de seguridad T-Sql puede crear errores ... nunca lo he intentado) Si las copias de seguridad se superponen a tiempo, tal vez sea posible obligarlas a ejecutar 1 por 1 en serie ¿camino? (En mi servidor tengo un solo script que respalda todos mis DB's, por lo que no hay superposición en la ejecución de la copia de seguridad)
Max
Sí, hay 164 DB en el servidor. Pero 99 de ellos están fuera de línea. La función 'Auto_close' está habilitada en algunas de las bases de datos, de modo que se cierran cuando no está en uso. (por lo que yo entiendo?)
Arviddk