¿Cómo hacer que la unidad de disco duro de la máquina de fábrica sea más duradera? ¿Cuánto cuesta su vida útil estimada?

9

Me pregunto cómo puedo hacer que la unidad de disco duro sea más duradera. Específicamente, trabajo en un entorno de fábrica. Y casi cada pocos meses, la unidad de disco duro en algunas de las máquinas de fábrica está dañada e incluso es irreparable. Ya implementamos varios SSD en algunos de ellos, pero eso no es de mucha ayuda. También están siendo corrompidos en máquinas de fábrica con tareas pesadas.

Entonces, cada vez que sucedió, siempre restauramos usando nuestra imagen de respaldo. Y ya conectamos toda la unidad de disco duro con un amortiguador para reducir la sacudida.

¿Hay alguna otra opción o prevención que podamos usar? ¿Quizás agregar algún material anti imán para evitar la fricción del imán, o algo más? ¿Y qué material necesitamos?

Editar: Máquina de fábrica con tareas pesadas que menciono anteriormente, básicamente máquina para crear carrocerías metálicas y moldes de marcos de automóviles.

Y cuando quise decir que el disco está dañado, significa ilegible. Todo el disco No los archivos de programa o software relacionado. Entonces no arrancará en absoluto.

adadion
fuente
10
Los SSD no deberían verse afectados por los imanes. Los problemas más probables son la temperatura, la humedad, la contaminación química (que conduce a la corrosión de las conexiones eléctricas, etc.), el polvo y la suciedad (que impiden el enfriamiento adecuado del aire) o el suministro de energía eléctrica que no cumple las especificaciones, por ejemplo, picos de potencia causados ​​por motores eléctricos grandes. deteniéndose y comenzando. Sin saber más sobre la "fábrica", es imposible adivinar cuál es el más importante.
alephzero
@alephzero Lo siento, la máquina de tareas pesadas que mencioné anteriormente es una máquina de fábrica para hacer la carrocería del automóvil y el molde del marco. ¿Puedes compartir una posible solución basada en tu experiencia con respecto a mis problemas? Porque solo le sucede a la máquina con tareas pesadas.
adadion
66
Los discos duros contienen componentes mecánicos muy sensibles, por lo que también recomendaría definitivamente el uso de unidades de estado sólido para todas las ubicaciones de movimiento / vibración. Sin embargo, al leer su problema, creo que su problema principal también tiene la posibilidad de ser un problema de alto voltaje. Si su entrada de energía no es estable, afectará la lectura y escritura, y eventualmente dañará algunos componentes.
Jonathan
44
¿Estás seguro de que esto es realmente un problema de hardware y no está relacionado con el software? Entiendo los problemas con las unidades de disco duro, pero los SSD deberían ser inmunes a la mayoría de esos problemas. ¿Puede proporcionar más detalles sobre la "corrupción" que ve?
jcaron
1
Además de un UPS, considere usar dos (o más) SSD en una configuración RAID1. Si configura la supervisión de errores RAID, eso debería permitirle reemplazar una unidad fallida sin tener que restaurar desde la copia de seguridad.
Tor Klingberg

Respuestas:

14

Muy probablemente, el asesino de SSD es eléctrico. No podemos descartar por completo la vibración mecánica, pero los SSD son bastante robustos mecánicamente. Un simple montaje de goma aumentaría la resistencia aún más. También asegúrese de que tanto los cables de alimentación como los de datos tengan suficiente holgura. La vibración puede hacer que se suelten cuando están bajo tensión.

Entonces, para abordar la confiabilidad eléctrica, tenemos que considerar dos factores. En primer lugar, la maquinaria pesada puede extraer grandes corrientes de la fuente de alimentación. Esto podría causar caídas de voltaje, que a su vez pueden afectar negativamente al SSD. Esto se resuelve fácilmente con un UPS en línea. Esencialmente, este tipo de UPS alimenta la computadora con una batería, mientras que la alimentación principal se usa para cargar la batería.

Un problema más inusual podría ser la radiación electromagnética. La maquinaria de alta potencia tendrá grandes corrientes en funcionamiento, a menudo a 50 o 60 Hz. Sin querer, esto hará que los cables actúen como antenas. Los cables grandes en la máquina actúan como emisores, y los cables al SSD pueden actuar como receptores. La solución aquí es tener una jaula de Faraday adecuada, idealmente conectada a tierra. Es por eso que las carcasas normales de PC están hechas de metal; funcionan como jaulas de Faraday, evitando la radiación EM en bandas de frecuencia entre 50 Hz y varios GHz.

MSalters
fuente
55
+1 por mencionar efectos electromagnéticos. (No sé qué tan grave sería para los casos de PC que estamos considerando).
Gürkan Çetin
Creo que también es la respuesta del problema, pero no de la pregunta del título :) de todos modos, obtengo mi voto.
Jonathan
Es muy probable que la maquinaria pesada esté causando problemas con el suelo que podrían aliviarse con terrenos aislados.
chrylis -on strike-
1
Parece que las caídas de voltaje son los principales problemas. Implementamos algunos UPS en línea para algunos de ellos, y el medidor muestra un excelente resultado estable. Y además, pusimos la jaula de Faraday a tierra a 2 de ellos (los viejos). ¡¡Soberbio!! Will proyectó SSD instalado en todos ellos, y hará que el viejo sea una copia de seguridad.
adadion
11

En primer lugar, los problemas eléctricos y magnéticos no son tan graves como los problemas de vibraciones y contaminación del aire. La humedad del aire más el polvo o los productos químicos pueden corroerse o cortocircuitarse con bastante facilidad, y en nuestras instalaciones son las principales razones de fallas si los dispositivos no están protegidos adecuadamente.

La mejor opción es mantener todo lo que no es necesario en el piso de producción fuera del sitio. Mantenga los controladores integrados minimalistas junto a las máquinas, mantenga las PC en una oficina ordenada comunicándose con los controladores a través de LAN.

Si eso no es posible, necesita cajas selladas. Posiblemente con elementos de transferencia de calor, si es necesario; Las cajas herméticas que evitan la mayor parte de la humedad, algo de sílice en el interior para absorber el resto de la humedad; ni el polvo seco ni la humedad del aire limpio son un gran problema, pero combinados conducen rápidamente a la oxidación de los contactos, otros problemas relacionados con la corrosión.

En mi experiencia, las alteraciones EM rara vez son lo suficientemente potentes como para causar un daño duradero. Pueden noquear un dispositivo, forzando un reinicio, pero un dispositivo bien construido se recuperará de eso. Las sobretensiones son una cuestión diferente; sin una buena protección contra sobretensiones, puede ver daños aleatorios en las piezas.

Finalmente, vibración. La vibración conducida por el piso se reduce fácilmente a niveles insignificantes a través de una estera de esponja o similar. La vibración de una máquina, en caso de que el dispositivo esté conectado directamente a la máquina ... hay poco que se pueda hacer al respecto. Hay sistemas de amortiguación, pero solo son eficientes contra ciertas escalas de vibración ... realmente, solo mueva esa caja de control a 2 metros de distancia.

Además, el rango de temperatura debe estar "dentro de niveles aceptables". Verá corrupción en los dispositivos de sobrecalentamiento y la humedad se condensará en los demasiado fríos. Esto rara vez es una preocupación en un piso de producción, donde muchas máquinas dependen de él, pero a medida que se sella el disco (intencionalmente o no, por ejemplo, a través del polvo) verá un sobrecalentamiento.

SF.
fuente
2
Puede usar los extensores KVM y los extensores USB para alejar las máquinas de las fuentes de calor / vibración / contaminación, incluido el otro lado de la pared.
Chris H
@ Chrish: Nunca hice eso, pero debería funcionar. En nuestros casos, el controlador integrado mínimo en una caja herméticamente sellada se encuentra justo al lado de maquinaria pesada en las profundidades de la mina, proporcionando una pequeña consola para control inmediato utilizando un teclado de membrana hermético instalado en la parte frontal de la caja, mientras que una PC para todos Las operaciones y el monitoreo están en un centro de control a varios kilómetros de distancia. Hay un interruptor de ethernet con enchufes de repuesto en esa caja, por lo que si necesita control en el sitio por cualquier razón, puede traer una computadora portátil. Pero eso es solo para servicio, no para uso regular.
SF.
He ejecutado USB sobre CAT5 (extensor patentado) para teclado, mouse y una cámara web y VGA sobre otro CAT5 (otra caja patentada) durante 100m para permitir que un sistema (un espectrómetro acoplado a fibra) sea controlado desde dos ubicaciones. Funcionó muy bien. En distancias más largas, Ethernet real funcionaría, o mejor aún, haría todo sobre fibra y optoaislamiento al mismo tiempo. Sin embargo, las comunicaciones con la maquinaria real pueden ser un problema
Chris H
2
Tibbo fabrica dispositivos de puente "RS232 sobre TCP / IP". Son un poco molestos, pero hay redes de controladores de semáforos en toda la ciudad que dependen de ellos; "centro de comando" que ejecuta un puente de software (docenas de puertos virtuales RS232 en una PC) y los controladores de toda la ciudad, conectados a fibra, controlados a través de las pequeñas cajas de puentes. Enfoque muy anticuado, si me preguntas, pero funciona, y estos no son casos herméticos. Entonces, si la máquina se controla a través de RS232 / 485, puede usar este tipo de dispositivo.
SF.
3

La vida útil estimada es dada por el fabricante generalmente como "MTBF = 2000hrs" pero en "condiciones normales" - lo que usted describe no es normal.

¿Por qué fallan las unidades SSD? Daño físico o conexiones deficientes.

Un montaje antichoque utilizado en el pasado fue un baño de mercurio, ¡pero probablemente no se le permitirá eso! Pero podrías hacer una versión de baño de aceite ...

Mike solar
fuente
Creo que es porque el choque producido por la tarea es bastante difícil, por lo que el montaje anticolisión normal no ayudará. ¿Cómo puedo hacer la versión de baño de aceite? Créeme, cuando busco en Google baño de aceite antichoque, Google me proporciona una imagen tonta. Ahora estoy siendo tonto.
adadion
Una bandeja rectangular que contiene el aceite (de suficiente profundidad) y una bandeja más pequeña que flota en la superficie que sostiene la unidad de disco tienen un bucle en el cable para absorber el movimiento. Pequeños resortes suaves para evitar que la bandeja flotante toque los lados; los resortes de bolígrafo o biro pueden ser buenos. Elija el aceite para que no sea demasiado viscoso.
Solar Mike
1
Para la segunda versión, puede considerar una tapa ... buena suerte
Solar Mike
1
@adadion Si no tiene un sensor / medidor de vibración, hay algunas aplicaciones para teléfonos inteligentes que le darán una idea: la precisión puede ser un problema, pero puede ser suficiente para la comparación.
Solar Mike
1
@adadion: Si está dispuesto a experimentar, puede probar algo como esta configuración de montaje antivibraciones de disco duro de bricolaje . Está diseñado para evitar que la vibración del disco llegue al gabinete, pero debería funcionar igual de bien en ambos sentidos. Por supuesto, puede que no sirva de mucho contra los choques de alta frecuencia y baja amplitud (como lo que podría experimentar al conducir rápido en una carretera llena de baches) que podría hacer que el disco golpee contra el soporte de montaje, pero si tiene muchos de esos , tienes problemas más grandes de todos modos.
Ilmari Karonen
3

Realmente un comentario pero demasiado largo:

He tratado con PC en la fábrica (carpintería), demostraron ser bastante resistentes.

Nuestra configuración inicial, que era básicamente libre de problemas: montamos las PC dentro de un gabinete, la parte delantera era de listones de plástico transparente (piense en lo que a veces se ve en un refrigerador con cámara). La intención original era mantener una ligera presión positiva con aire limpio, pero esto nunca se hizo y se demostró que no era necesario.

Desafortunadamente, después de eso, muchas máquinas se instalaron con menos cuidado. El modo de "falla" habitual era el apagado térmico, quitar la tapa y apagarla, funcionaría bien, aunque resultó ser más problemático ya que el polvo causó algunos daños.

Los principales problemas, sin embargo, vinieron de sus cables. Especificamos cables blindados, pero la administración se volvió barata para nosotros, el edificio estaba conectado con cables de red ordinarios y las modificaciones posteriores a menudo las realizaban electricistas en lugar de informáticos. Esto causó mucha interferencia y probablemente fue responsable de la alta tasa de falla de las tarjetas de red. (¿Realmente, ahora, un Cat-5 arrojado sobre un 480V, 400? ¿Un bus de alimentación principal? O incluso más extremo, una conexión Y en un cat 5, ¡que realmente funcionó, aunque con problemas de error de red!) No coloque una computadora en el mismo circuito que un motor pesado. No conecte ningún cable de computadora en paralelo a cables de alimentación pesados, incluso si están en circuitos separados.

Las máquinas iniciales estaban todas sin disco (no era una opción en estos días) e incluso después de eso, todo lo importante se almacenaba en la red, por lo que si una máquina funcionaba, se podía cambiar muy rápidamente; tomaría más tiempo llevar la nueva máquina a la estación que ponerla en marcha en lugar de la problemática.

Lección principal: no dejes que los electricistas sean nada más que asistentes cuidadosamente vigilados al cablear las cosas.

Loren Pechtel
fuente
2

Asumimos que el problema es causado por golpes o vibraciones. Puede haber varias otras causas, como la temperatura, la humedad, la corrosión, los productos químicos, como lo señalan otros.

Un enfoque más sería llevar las unidades a un lugar no hostil y extender la conexión con cables. Esto puede necesitar que sus computadoras se ejecuten desde unidades externas.

Si no puede llevar los discos externos muy lejos, puede colocarlos en un cojín (material similar a una esponja) para evitar golpes.

Si aún no puede escapar de la vibración o el choque, investigue si ha cambiado sus computadoras por otras difíciles. Esto probablemente le costará a su empresa algunos dólares, pero probablemente sea mejor que detener la producción.

Gürkan Çetin
fuente
Como dijo el OP "reducir la sacudida", la mayoría parecía haber asumido que el problema se debía a la vibración ...
Solar Mike
1
De acuerdo en que la vibración fue la principal / gran causa, sin embargo, probablemente la segunda causa ahora está en su lugar. Que puede ser eléctrico o cualquier otro, como sugiere Jonathan. Aislar los discos de la PC también evitaría esta opción, ya que la alimentación del USB es más tranquila que la placa principal.
Gürkan Çetin
¿No sería demasiado arriesgado colocar el camino fuera de la estación? El error humano no se puede evitar. :(
adadion
1
Eso es una cuestión de ergonomía, y si la fuente es la estación en sí, y no el entorno circundante, este puede ser el camino a seguir. Para errores humanos, ¿te refieres a cables en las pasarelas? También podría considerar simplemente levantarlos sin tocar la máquina. También puedo pensar en discos inalámbricos, lo que probablemente causaría varias otras preocupaciones. :)
Gürkan Çetin
2

Como otros dijeron, los SSD son resistentes a las vibraciones: no hay partes móviles, a diferencia de las unidades de disco duro magnéticas.

Sin embargo, ambas tecnologías son vulnerables a los campos electromagnéticos, como también lo han señalado otras. Proporcionar protección contra eso puede ayudar.

Sin embargo, tampoco debe descartar otros factores.

(Una nota rápida: esta lista definitivamente no está completa. Solo mire el alcance de las otras respuestas, desde los niveles de voltaje hasta el calor y el software; hay MUCHO que puede causar estos problemas. A menos que tenga confianza en la informática, es posible que desee considerar contratar a alguien para que se dé cuenta de esto, porque podrían estar observando diferentes factores en el sitio en los que no pensó. Dicho esto, aquí hay algunos factores que también debe considerar).

  • Puede haber un problema con el cable, y tales errores pueden ser muy sutiles ya que solo aparecen esporádicamente. Pruebe los discos duros "defectuosos" en un entorno normal en una PC diferente, con diferentes cables, para asegurarse de que realmente tengan daños físicos.

  • Puede ser tu memoria también. A menos que esté utilizando la memoria ECC, esto puede ser difícil de identificar. Si sus bits se voltean en la memoria, y eso es donde reside su programa, el sistema operativo o sus controladores, entonces todas las apuestas están desactivadas. Es posible que no haga nada, que se bloquee o que simplemente escriba basura en todo el disco.

  • Puede que no sea un problema de hardware en absoluto. Un error de software también puede dañar los datos. Tener una pila de controladores exóticos puede hacer que su sistema sea más propenso a corromper los datos.

Dependiendo de cuál es exactamente la causa (¡debe determinar eso primero!) Podemos recomendar posibles soluciones. Hay muchas soluciones, desde aislamiento, RAID, hasta sistemas de archivos de suma de comprobación como ZFS, pero primero debe determinar la causa.

Aaa
fuente
2

Además de las otras respuestas: en el entorno que menciona, es posible que haya polvo metálico en el aire. Cuando eso entra en la computadora, puede obtener cortocircuitos eléctricos. Una caja sellada (o ventilación con filtro de aire de alta calidad) puede ayudar si ese es el caso.

Hobbes
fuente