Cómo forzar el error ECC [cerrado]

10

Estoy buscando una manera de forzar un error ECC en un DRAM DIMM para probar algún código asociado con la recuperación de estos errores. Creo que Intel hace una plantilla de prueba por varios miles de dólares, pero estoy buscando algo un poco más barato.

Intenté comprar un emisor Beta (Strontium 90, 0.01uCi) conectado al DIMM para forzar un "cambio de bit" en el hardware. Después de dos semanas de ejecución, no recibo ningún error de ECC.

Mi próximo paso es comprar un emisor más fuerte ... o ver si alguien más lo ha resuelto de otra manera.

Pregunta : ¿Alguien ha encontrado una manera de forzar fallas de ECC en un DIMM para fines de prueba (aparte de encontrar un DIMM fallido y usar eso ... que era nuestra técnica anterior hasta que el DIMM abandonó el fantasma por completo)

albiglan
fuente
1
Necesitarás algo un poco más fuerte que eso. Pop up a Fermilab y ver lo que tienen. :)
Michael Hampton
44
Estoy votando para cerrar esta pregunta como fuera de tema porque esta no es una pregunta de administración del sistema. Es adecuado para la migración a otro sitio SE, aunque no estoy completamente seguro de cuál sería el adecuado.
kasperd
2
¿ Ayudan estos ejemplos de inyección de error ? ¿O necesita fallas de hardware reales?
ckujau
1
¿Sería posible simular errores de ECC con una capa de virtualización de algún tipo? Solo un pensamiento
Molomby
2
@Molomby lo haría. La inyección de fallas para máquinas virtuales es una disciplina de investigación en CS. Se ha publicado algo de trabajo decente a lo largo de los años.
the-wabbit

Respuestas:

1

El problema se resolvió agregando cables a un solo DIMM (destruyéndolo para uso normal) y generando errores ECC aleatorios con el DIMM que nos permitieron probar el sistema.

albiglan
fuente