Me han dicho que acepte un error con Memtest86 +

52

Compré una nueva computadora en agosto con 4x4 GB de RAM. Tuve problemas con la RAM. Me enviaron cuatro nuevos palos, lo que también generó errores. Destacó cuatro palos (de los ocho que tenía ahora) que no generaron ningún error. Descubierto por coincidencia un nuevo error de RAM la semana pasada (esta vez sin BSOD). Contactado con la empresa. Según ellos, ha habido problemas con un mal stock del verano pasado, así que me enviaron dos unidades de prueba de 8 GB. He estado ejecutando Memtest86 + durante el fin de semana. Después de 20 horas recibí un error (ver foto adjunta). La prueba ha estado ejecutándose durante 37 horas, pero hasta ahora solo este error. Me puse en contacto con la compañía donde compré la computadora. Ellos respondieron:

No me preocuparía si uno falla.

Hemos tenido situaciones similares aquí en las que pasa varias veces pero luego falla una vez. Creemos que es un problema con memtest, después de que toda la memoria es defectuosa o no lo es, por lo que no puede pasarla varias veces, fallar la próxima vez y luego volver a pasar.

Confíe en mí y continúe con la memoria que le enviamos, y si sus problemas continúan, buscaremos reemplazarlo nuevamente.

De otras publicaciones del foro deduzco que muchas personas no aceptan un solo error. ¿Qué podría significar este error único, RAM defectuosa o una falla en el programa MEMTEST (u otro)?

Actualización: De los comentarios útiles a continuación, concluyo que un error "aleatorio" ocasional (y raro) podría ocurrir y ser aceptable, pero los errores repetidos en la misma dirección indicarían un mal funcionamiento. Memtest ha funcionado durante 45 horas y todavía tengo un solo error. Para información de todos, seguiré ejecutando la prueba. En menos de dos días me voy a ir por un mes. Lo más probable es que deje Memtest funcionando. Como no tengo un UPS, existe el riesgo de que un corte de energía arruine el experimento. La computadora es una computadora de escritorio, por lo que no puedo llevarla conmigo (lo que curiosamente la habría expuesto a más rayos cósmicos, ya que estaré volando;)).

Memtest

DustByte
fuente
+1; Personalmente, creo que es una gran pregunta, lo siento, no puedo ayudar con una respuesta. ¡Actualicé su pregunta ligeramente para asegurarme de que no esté fuera de tema!
Dave
19
Personalmente, no sudaría uno, y solo uno, falla ... la RAM sin corrección de errores ocasionalmente puede tener un problema, no es perfecto. Ahora, si puede duplicar esto en el mismo rango de direcciones, entonces hay algo mal con eso.
Shinrai
Es muy simple. El error que publicó significa que su memoria no tiene el valor correcto en esa dirección dada
Ramhound
44
¿Estás seguro de que no es tu computadora la que corrompe tu ram?
sanny Sin
55
De acuerdo con @Shinrai: si no hubiera fallas ocasionales intermitentes con RAM normal, no habría mercado para errores al corregir la RAM . Los errores repetidos en la misma dirección es un asunto diferente, que indicaría una celda de memoria defectuosa.
jg-faustus

Respuestas:

41

Directamente del autor Memtest86. Los empujaría a reemplazarlo. Realmente no debería haber errores en absoluto.

Si tiene un número relativamente pequeño de direcciones erróneas y solo uno o dos bits de error, puede estar seguro de que los errores son válidos. También los errores intermitentes son, sin excepción, válidos. Con frecuencia, los proveedores de memoria preguntan si Memtest86 admite su tipo de memoria particular o un conjunto de chips. Memtest86 está diseñado para funcionar con todos los tipos de memoria y todos los conjuntos de chips.

Todos los errores de memoria válidos deben corregirse. Es posible que un error particular nunca aparezca en operación normal. Sin embargo, operar con memoria marginal es arriesgado y puede provocar la pérdida de datos e incluso la corrupción del disco. Incluso si no hay una indicación abierta de problemas, no puede suponer que su sistema no se ve afectado. A veces, los errores intermitentes pueden causar problemas que no aparecen durante mucho tiempo. Puede estar seguro de que Murphy lo atrapará si conoce un error de memoria y lo ignora.

BroScience
fuente
44
Omitió la parte donde se implica una definición limitada de "válido": "A menudo se nos pregunta sobre la fiabilidad de los errores informados por Mestest86. En la gran mayoría de los casos, los errores informados por la prueba son válidos. Hay algunos sistemas que causan Memtest86 debe confundirse sobre el tamaño de la memoria y tratará de probar la memoria inexistente. Esto provocará que un gran número de direcciones consecutivas sean reportadas como incorrectas y generalmente habrá muchos bits por error ".
Horacio
3
Significa válido como en "los errores intermitentes son errores reales, no un artefacto de Memtest". Pero eso no necesariamente se traduce en RAM defectuosa. Se producen errores de RAM intermitentes, por eso existe la RAM de corrección de errores . Google lo midió en sus servidores: "un DIMM promedio experimenta casi 4000 errores corregibles por año" . Ver también ZDNet
jg-faustus
28

Parece que solo se está corrompiendo un solo bit (es decir, no se establece en la lógica 1 cuando se esperaba) en esa dirección. Si puede reproducir el error, la RAM está defectuosa. Incluso un error reproducible de 1 bit sigue siendo un error y puede causar problemas al usar la computadora.

La memoria de trabajo adecuada * nunca ** debe tener errores, como lo espera una computadora (y es por eso que se bloquean cuando tiene mala memoria, como protección; no puede ejecutar de manera confiable una máquina con mala memoria, ya que la computadora puede ejecutarse corrupta instrucciones o proporcionar / almacenar datos corruptos ).


* durante un período de tiempo suficientemente largo, es posible que los bits de DRAM se corrompan de fuentes externas como la radiación de fondo; el evento suele ser tan raro que la mayoría de las computadoras ejecutan Memtest durante semanas sin error. También vea la pregunta de desbordamiento de pila, " Rayos cósmicos: ¿cuál es la probabilidad de que afecten a un programa? ".

Gran descubrimiento o desarrollo, progreso, ruptura, penetracion
fuente
Hasta ahora no hay más errores. La prueba aún se está ejecutando. En este punto, quizás sea hipotético preguntar "¿y si este es el único error que obtengo después de ejecutar la prueba durante una semana?"
DustByte
66
@DustByte, entonces asumiría que está bien. Solo sería una preocupación si ocurriera el mismo error en la misma ubicación de memoria, lo que indicaría una celda DRAM defectuosa. Muchas cosas pueden cambiar la tasa de error de RAM, incluida la radiación de fondo (por ejemplo, de tormentas de rayos cósmicos u otras fuentes de radiación).
Avance el
55
en un caso, Fermilab midió 2.5 "Trastornos de evento único" por día en múltiples máquinas con 160 Gbits combinados. Atribuyeron esto a la radiación de fondo. La altitud importa en este caso: Boulder Colorado verá esto más a menudo que en el Valle de la Muerte
horatio
Esa pregunta desbordamiento de pila era muy perspicaz - No me di cuenta la tasa de error debido a la radiación cósmica fue bastante que alta.
Shinrai