¿Cuántos pases son suficientes con Memtest?

52

Mi computadora se cuelga al azar en múltiples ocasiones y en diferentes sistemas operativos hoy, lo que me obliga a presionar el botón de reinicio. Sospecho que podría ser un problema de memoria y lo hice memtestcon memtest86 .

Pasó por dos pases sin errores. ¿Es eso suficiente o necesito pasar la noche hasta que vea un error?

¿Qué pasa si se trata de un problema con la placa base o la CPU? ¿Cómo lo sé sin obtener una nueva placa base?

Especificaciones del Sistema:

  • Memoria: 2.0GiB
  • Procesador Pentium (R) CPU de doble núcleo E5300 @ 2.60GHz x 2
  • Placa base: EPU ASUS P5KPL-AM
Desbordamiento de preguntas
fuente
Probablemente ya haya resuelto esto, pero la próxima vez eche un vistazo al registro del kernel en Linux después de que se cuelgue. Eso te dará una idea de lo que está sucediendo.
scottkosty
@CarComp: publique los resultados fallidos de memtest.
harrymc

Respuestas:

25

Las pruebas no pueden probar la ausencia de errores, solo su presencia

Memtest es excelente para encontrar errores en la RAM. La tasa a la que se encuentran los errores es necesariamente inversamente proporcional a lo rota que está la RAM. Cuanto más roto está, más rápido encuentra errores.

El 90% del tiempo, si la RAM tiene un problema, memtest lo encontrará en 10 segundos, el 99% del tiempo, una pasada será suficiente para encontrar el problema. Cuanto más se demore en encontrar el problema, más sutil es y menos probable es que sea la causa de un problema con su PC (pero aún debería obtener una nueva memoria RAM si recibe un solo error)

Como su computadora se bloquea con bastante frecuencia y ha ejecutado algunos pases, probablemente no sea su RAM. Como siguiente paso, debe probar su disco duro y luego la CPU con una herramienta como Ultimate Boot CD o Hiren's. (La mayoría de los BIOS modernos también tienen una función de prueba HDD incorporada)

David
fuente
2
Sugiero tratar de limpiar las RAM y el zócalo y volver a probarlas primero (use alcohol isopropílico; hizo una experiencia positiva con el aerosol de desinfección como reemplazo; pero no rocíe el último directamente sobre la RAM, solo sobre la tela, ya que solo servirá como resolutivo y eventualmente dejará algunos residuos cuando se use en cantidades demasiado altas)
SDwarfs
3
Entonces, si alguien recibe al menos un error: ¿tiraría su RAM, iría a comprar uno nuevo? ¿Estás seguro?
Tarasovych
1
@Tarasovych: Depende de cuán importante sea la estabilidad del sistema para usted. En las PC que mantengo en el trabajo, haría exactamente eso (tirar toda la RAM y comprar una nueva), porque (1) la RAM es barata y (2) el tiempo del desarrollador de software es costoso. De hecho, incluso tirar la PC completa y comprar una nueva podría resultar más barata que la pérdida de productividad / trabajo debido a PC poco confiables.
Heinzi
@Heinzi eche un vistazo al precio de RAM hoy y hace un año ... Pero tal vez en su localidad haya RAM barata. Pero estoy de acuerdo en que una buena RAM sin errores es necesaria para el desarrollo. A nadie le gustan los fallos de RAM / BSOD mientras se codifica)
Tarasovych
1
El overclocking también puede causar estos errores, pero eso no significa que deba tirar su ram, simplemente reduzca el overclocking o aumente el voltaje dramático en un rango seguro.
M.kazem Akhgary
21

Ejecuté memtest y vi 6 pases sin errores, con más de 4 errores por pase después de eso. Normalmente solo ejecuto 3-4 pases, pero ciertamente es posible perder errores haciendo solo un par de pases. Me imagino que algunos errores solo aparecen cuando los módulos de memoria se calientan, causando problemas con la memoria funcionando a un alto voltaje.

Jeff
fuente
si se trata de un problema relacionado con el calor, ¿no sería prime95 un mejor vector de prueba para generar mucho más calor en el sistema?
Jeff Atwood
@JeffAtwood No hay ningún experto aquí, pero prime95 no necesariamente apunta a errores de RAM, ¿verdad?
Hele
Para probar los errores relacionados con el calor, ejecute una instancia de memtest por núcleo de CPU. Seleccione su perfil de rendimiento en administración de energía. Para computadoras portátiles, no las coloque en soportes de enfriamiento. Deje que memtest se ejecute durante 24 horas. Si no hay errores, no tiene problemas con el ram.
user986363
12

En el trabajo, generalmente dejábamos las máquinas funcionando durante la noche, pero para ser justos, cada vez que he podido mostrar un problema de memoria con memtest ha pasado unos segundos de haberlo iniciado.

Nunca he visto una máquina hacer 1 pase completo para fallar en uno de los siguientes. (No es que sea necesariamente imposible, solo para demostrar que es raro).

Solía ​​trabajar en una tienda de computadoras donde comenzamos a realizar pruebas en máquinas nuevas más o menos a diario.

Sin suficiente información para decirlo realmente, todavía adivinaría que su problema es más probable que sea un sobrecalentamiento o un mal controlador.

Como ha probado más de un sistema operativo, la parte del controlador parece poco probable. A menos que, por ejemplo, solo haya probado diferentes versiones de Windows que usan el mismo controlador.

azzid
fuente
3
De hecho, vi errores que comenzaron en el paso 3. Supongo que esto tiene que ver con el calentamiento de la RAM, la CPU y / o el controlador de memoria. Todos mis problemas de este tipo estaban relacionados con la conexión incorrecta de la RAM al zócalo, el zócalo a la placa base o los desechos en la RAM (cuando saqué la RAM, limpié el conector RAM + Socket y volví a colocar la RAM en la que finalmente se resolvió el problema). problema).
SDwarfs
PD: sugiero al menos 3 pases. Mientras que durante la noche con ~ 5-8 pases es más confiable.
SDwarfs
1
He visto errores aparecer en una tercera pasada, creo que debido al calor.
benallansmith
1
He visto un problema mostrado después de 2-3 horas de memtest86 +. La misma memoria durante 30 minutos fue "ok".
i486
12

http://hcidesign.com/memtest/manual.html

El 100% de cobertura representa un paso completo de probar su memoria. En general, es mejor ejecutar múltiples pases. Aquí hay tres longitudes típicas de pruebas que puede usar:

  1. Pruebe hasta el 100% de cobertura (una prueba rápida para asegurarse de que su RAM esté funcionando razonablemente)
  2. Prueba durante 1 hora (esto detectará todo excepto los errores intermitentes)
  3. Pruebe durante la noche (recomendado; su computadora no está haciendo nada más por la noche de todos modos, ¿por qué no estar absolutamente seguro de que su RAM es buena?)
yaccz
fuente
7

He visto a RAM pasar los primeros 6 pases de memtest y luego fallar pases posteriores, y al ejecutar un sistema operativo Linux con esa RAM vería bloquearse después de 6-8 horas. Otra RAM en la misma placa base funcionó bien, por lo que aparentemente la RAM defectuosa era sensible a la temperatura.

Cuando sospecho que hay un problema de RAM (por ejemplo, computadoras Dell con luces de diagnóstico) ejecuto memtest en un módulo de RAM a la vez en la primera ranura durante 8-16 horas. Si pasa, eso confirma que tanto la ranura como el módulo RAM son buenos y puedo (más) usar esa ranura con confianza para probar otros módulos RAM.

usuario254993
fuente
¿Estás seguro de que Memtest86 prueba las ranuras de RAM? No sabía que lo hiciera.
Hashim
6

Mi experiencia con memtest86 + difiere un poco de la mayoría de las personas aquí. memtest86 me ha ayudado mucho a lo largo de los años, pero desafortunadamente a veces no puede detectar errores.

Aunque memtest funciona la mayoría de las veces, me falló un par de veces. La primera vez que no detectó errores tuve una PC con 1x 4GB DDR3 que me daba BSOD relacionados con la memoria. Ejecuté memtest durante todo un día, estamos hablando de más de 15 pases pero no de errores. Luego lo probé en una computadora completamente diferente, lo mismo, sin errores. El sistema operativo era completamente inestable pero no había errores en memtest. Luego utilicé un software diferente llamado "PC-Check" de Eurosoft, que es muy similar a memtest pero utiliza algoritmos diferentes. También es de arranque, no necesita ningún sistema operativo. Detectó errores en menos de 5 minutos. Luego pude enviar el módulo a Corsair RMA y obtener un reemplazo.

Entonces, memtest es muy bueno pero no siempre es suficiente. Actualmente uso memtest y PC-check para verificar la memoria. Si memtest no puede detectar errores, la verificación de PC ciertamente lo hará y viceversa. Y créanme, sucede con más frecuencia de lo que uno pensaría.


fuente
4

MemTest86 intenta hacer una prueba completa de la RAM. Al hacerlo, también se ha convertido en una buena prueba general, ya que algunas de las pruebas también se refieren al controlador de memoria de la placa base y la CPU.

La RAM ha aumentado mucho, hasta el punto de que un teléfono portátil puede contener más RAM que en una unidad central de hace 20 años. Las pruebas se han multiplicado a medida que MemTest86 ha evolucionado, y también lo ha hecho la RAM. Aunque la RAM se ha vuelto más rápida, las pruebas aún requieren mucho tiempo, medidas en horas o incluso días.

Ahora para las malas noticias : he encontrado al menos dos fuentes respetables, Diez foros y wiki Cómo dan el mismo consejo. Cito de diez foros:

MemTest86 + debe ejecutarse durante al menos 8 pases para estar cerca de ser concluyente , cualquier cosa menos no dará un análisis completo de la RAM.

Si un miembro de Ten Forums le pide que ejecute MemTest86 +, asegúrese de ejecutar los 8 pases completos para obtener resultados concluyentes. Si ejecuta menos de 8 pases, se le pedirá que lo ejecute nuevamente.

Debo señalar que MemTest86 tiene dos versiones, la Free y la Pro, donde la versión Pro tiene varias pruebas más que la versión Free y las opciones de configuración. Puede ver las diferencias en el artículo Comparación de características .

Se puede obtener más información sobre el número óptimo de pases en el artículo Información técnica de MemTest86 de la descripción del archivo de configuración MemTest86 mt86.cfg, disponible solo en la versión Pro:

PASS1FULL

Especifica si el primer pase ejecutará la prueba completa o reducida. Por defecto, el primer pase ejecutará una prueba reducida (es decir, menos iteraciones) para detectar los errores más obvios lo antes posible.

Conclusión 1 : La primera pasada es más corta y más rápida, destinada principalmente a detectar errores duros. El hecho de que el primer pase haya pasado sin error es alentador, pero los usuarios de la versión gratuita deben esperar al segundo pase para obtener toda la gama de pruebas.

El mayor número de pases que he encontrado fue en esta prueba:

Prueba 7 [Inversiones en movimiento, patrón de 32 bits]

Esta es una variación del algoritmo de inversiones en movimiento que desplaza el patrón de datos a la izquierda un bit para cada dirección sucesiva. La posición del bit inicial se desplaza hacia la izquierda para cada pasada. Para utilizar todos los patrones de datos posibles, se requieren 32 pases . Esta prueba es bastante efectiva para detectar errores sensibles a los datos, pero el tiempo de ejecución es largo.

Conclusión 2 : La prueba 7 necesita 32 pases para estar totalmente completa, lo que considero como límite superior en la cantidad de pases necesarios para una prueba realmente exhaustiva.

También observo que muchas de las pruebas usan un patrón aleatorio, con un patrón diferente para cada pase, lo que significa que cada pase es diferente. Llevándolo a alturas absurdas, podríamos concluir que no hay un límite superior para el número de pases requeridos para un resultado absolutamente concluyente.

Mi opinión

Mi opinión con respecto al número de pases es que uno debe ejecutar tantos pases como tenga tiempo para esperar. El límite inferior parece ser dos pases, ya que solo el segundo será una prueba completa. Pero la pregunta de "cuánto es suficiente" no tiene una respuesta real. Observo nuevamente que para las dos referencias técnicas que cité anteriormente, el número mínimo de pases requeridos para un resultado bueno y concluyente es de 8 pases (quizás para que la Prueba 7 haga un byte completo de 8 bits, entre otras razones).

Por otro lado, los errores encontrados por MemTest86 deben tomarse muy en serio. Como aquí se planteó la pregunta sobre la cantidad aceptable de fallas, mi respuesta es que incluso una falla es demasiado y no es aceptable.

harrymc
fuente
Su respuesta transmite ideas que van más allá de las demás.
CarComp
1

Hago un pase para ver si hay algún error obvio.

Si hay un error, no se necesitan más pases.

Si el problema con la computadora es extraño, lo dejo pasar durante la noche o durante el día durante ~ 10 horas solo para estar seguro.

Robert Niestroj
fuente
1

Por lo general, ejecuto memtest CADA VEZ que cambio la CPU, la memoria o noto problemas extraños. La razón es que memtest no solo prueba la memoria. Se producirá un error en otros tres casos importantes:

1) Si hay problemas debido al sobrecalentamiento de la CPU o la memoria. Normalmente, memtest carga CPU para varias de las pruebas a casi el 100%.

2) si la CPU no puede acceder a la memoria correctamente. La mayoría de las pruebas leen y escriben en todas las ubicaciones de la memoria.

3) si hay problemas con el poder. Es decir, una fuente de alimentación débil o condensadores defectuosos causan demasiados picos que compensan bits aleatorios.

Si veo al menos un solo error rojo, empiezo a buscar lo que debería eliminarse / repararse antes de usar el hardware.

Nikolai
fuente
1
Si bien esta puede ser información útil, no responde la pregunta original.
blm
0

Dado que, después de una pasada, se muestra Pass complete, no errors, press Esc to exit, siempre supuse que era suficiente.

ingrese la descripción de la imagen aquí

Der Hochstapler
fuente
66
Err, si ese es realmente el caso, ¿no se detendría automáticamente memtest después de una pasada en lugar de permitirnos continuar las pruebas para siempre?
Pregunta Desbordamiento
@QuestOverflow: No sé, ¿verdad?
Der Hochstapler