¿Qué archivos relacionados con Windows no tienen valor para los usuarios de * nix?

10

He acumulado, desde mi tiempo en Windows, una buena cantidad de copias retenidas del sistema de archivos y archivos del sistema y unidades de datos. Estoy tratando de destilarlos a las partes utilizables mientras descarto todo lo que probablemente no tenga valor.

Al ver un montón de dichos archivos desplazarse mientras copiaba, una vez más, desde una unidad de retención a una unidad de trabajo, creo que tengo una lista de inicio de archivos "buenos" e "inútiles", pero me preguntaba si hay ¿Algún tipo autorizado de lista de archivos (que provenga de un entorno anterior de Windows) que debe descartarse inmediatamente como inútil?

Ganadores: (Sé que esta lista probablemente se convertiría en un desastre si se hiciera algún esfuerzo para que sea completa, por lo que no es lo que estoy buscando, a menos que probablemente estén rodeados de basura que podría destruirlos inadvertidamente) ( editar: si la ÚNICA forma es un método súper completo basado en una lista blanca, que así sea. Preferiría que ese no fuera el caso, pero los mendigos no pueden elegir ... la mayoría de las veces. )

*.tar.*, *.rar, *.zip
*.mp(e)g, *.avi, *.mkv, *.wmv, *.asf

Perdedores: (Esto es lo que realmente estoy buscando)

*.exe, *.bat, *.dll, *.com, *.lnk

También sé que habrá excepciones. Al igual que los archivos .exe del instalador, se utilizan para instalar algo en Wine. Para los propósitos de esta pregunta, esta preocupación no es una. Todos los archivos en cuestión son copias (de copias, posiblemente de incluso más copias), por lo que los instaladores que realmente quiero conservar están en un lugar agradable, seguro y probablemente protegido contra escritura.

asesino
fuente
66
¿Por qué haces esto por extensión? ¿No debería guardarse casi todo en su carpeta de usuario y no todo lo que está fuera de ella?
Michael Mrozek
Al no haber usado Windows en bastante tiempo, no estoy al tanto de saber qué directorios no tienen valor y, además, al haber usado directorios no estándar para almacenar cosas, como colocar archivos en Archivos de programa u ocultarlos en el directorio de Windows, no No los descarte como lugares donde se pueden esconder gemas. Sé que algunos archivos generalmente tienen más valor innato que otros, por eso estoy tratando de abordar esto desde el "largo camino".
killermist
Le pregunté a SU sobre la migración, pero no estaban interesados . No estoy seguro de que alguien haya hecho una lista como esta; Siempre he guardado ciertas carpetas, no ciertos tipos de archivos
Michael Mrozek
@MichaelMrozek Agradezco la pregunta. ¿Se enfadarían si lo publicara de todas formas? ¿O eso solo alteraría las cosas? ¿O sería (posiblemente adicionalmente) marcado / cerrado como no-en-tema y / o no-bien?
Killermist
Probablemente; si no querían que se migrara era porque no encajaba bien
Michael Mrozek

Respuestas:

3

Probablemente, la forma más sencilla de eliminar la basura sería la fecha de creación o última modificación (es posible que deba experimentar para determinar cuál es mejor): solo use la fecha en que se instaló el sistema como punto de partida.

Según el principio de Pareto, ese filtro simple probablemente le proporcionará el 80% del efecto que busca.

(Por supuesto, puede, o incluso debería, combinar este con las listas en blanco y negro que ha comenzado a armar).

Alexander Shcheblikin
fuente
Esto parece ser la base de una buena idea. La mayoría de los archivos del sistema operativo conservan su fecha de modificación / creación desde la primera vez que se almacenaron en un CD o se empaquetaron en un archivo de actualización.
Killermist
¿Tiene un comando de búsqueda recomendado para hacer esto? Lo que he encontrado que parece ser un buen comienzo es find . -type f -mtime +572w -exec ls -l {} \; mirar a través de la salida y posiblemente marcar el tiempo de corte objetivo, y luego usar -delete en lugar de -exec para eliminar en masa los mensajes no deseados. Seguido con un find . -empty -deletepara borrar directorios y archivos vacíos. A continuación, utilice el nombre de archivo selectivo / depuración de extensión. ¿Alguna idea mejor?
killermist
Una findbandera útil aquí se -newerusa así:find /mnt/windowsfs \! -newer "/mnt/windowsfs/reference/filename" | xargs rm -f
Alexander Shcheblikin
8

Solo tú sabes lo que necesitas / quieres conservar. Sin embargo, puede, hasta cierto punto , identificar los archivos del sistema de Windows y otros archivos de programa instalados.

Instale Windows y esos programas nuevamente en una máquina virtual, luego haga dos listas de todos los nombres de archivo en la VM;

  1. En la máquina virtual, haga la primera lista del sistema recién instalado

      dir /S /B /A-D C:\ >vmlist.1

  2. En la VM, haga la segunda lista del sistema después de las actualizaciones.

      dir /S /B /A-D C:\ >vmlist.2  

  3. De vuelta en * nix, combine estos dos archivos y elimine las líneas duplicadas.

      sort -u vmlist.1 vmlist.2 >vmlist  

  4. La lista ahora se verá así (pero mucho más larga, por supuesto):

      C:\name with 6 special chars [$.^|]
      C:\Windows\System32\asr_fmt.exe
      C:\Windows\System32\asr_ldm.exe
      C:\Windows\System32\asr_pfu.exe
     

  5. Ahora convierta la lista en regexpatrones adecuados paragrep

    sed -r 's/\\/\//g; s/[]$.^|[]/\\&/g; s/^[[:alpha:]]:/^.*/; s/$/$/' vmlist >vmlist.rex

  6. La lista de expresiones regulares se verá así.

      ^.*/name with 6 special chars \[\$\.\^\|\]$
      ^.*/Windows/System32/asr_fmt\.exe$
      ^.*/Windows/System32/asr_ldm\.exe$
      ^.*/Windows/System32/asr_pfu\.exe$

  7. Haga una lista de archivos contenidos en el directorio de archivo de destino

      find '/my/archive/dir' -type f >arclist

  8. Ahora haga una sub-lista de arclisllos archivos que coinciden con los patrones de expresiones regulares.

      <arclist grep -f vmlist.rex >arcmatches  

  9. arcmatchescontiene los archivos de Windows coincidentes. Verifíquelos y elimínelos cuando esté satisfecho con lo que ve. Aquí está el comando eliminar (eliminar).

      <arcmatches xargs -d'\n' rm -v


Peter.O
fuente
Si bien esto muestra buena delicadeza al "eliminar ventanas de los archivos", sería poco práctico (en el mejor de los casos) en este caso, ya que algunas de ellas tienen más de una década y la versión de las ventanas utilizadas sería difícil de determinar, si está disponible en absoluto. Finesse sería bueno, si fuera posible, pero creo que a medida que avance en esto, será la fuerza bruta la que termine gobernando los días.
killermist
¿Es posible que alguna persona intrépida (o plural) se haya sentado y creado versiones publicadas de vmlist para que Win95 las actualice (tal vez pueda detenerse en WinXP, no estoy seguro ...)?
Killermist
En caso de que quiera seguir esta ruta, aquí hay una lista de máquinas virtuales ofrecidas por Microsoft, incluyendo XP, Vista y 7.
phunehehe
3

El thumbs.dbarchivo es inútil en sistemas similares a Unix, que yo sepa.

Es un archivo (probablemente oculto) creado para almacenar en miniatura las imágenes en miniatura en los sistemas Windows. Dado que cada carpeta de imágenes tiene su propio thumbs.dbaspecto al visualizar las imágenes de la carpeta, es posible que haya algunas de estas cosas en su disco duro, dependiendo de la cantidad de carpetas de imágenes.

No sé cómo cada * nix trata con las miniaturas, pero al menos en mi caso (Ubuntu / GNOME), todas las miniaturas se mantienen juntas de forma predeterminada en un solo lugar: la .thumbnails/carpeta en mi directorio de inicio (y en subcarpetas como .thumbnails/normaly .thumbnails/large) . Cuando migré de Windows a Linux, por lo tanto, eliminé todos esos thumbs.dbarchivos.

Anju Fabulina
fuente
1

Lista de archivos de Windows que son inútiles para Unix

  • Thumbs.db, ehthumbs.db, ehthumbs_vista.db
  • * .ini ejemplo, desktop.ini
  • * .dll: significa biblioteca de enlaces dinámicos. Todo software usa y necesita estos archivos para ejecutarse. Estos archivos pueden causar muchos problemas, especialmente si desinstala un software antivirus y luego instala uno diferente.
  • * .sys ejemplo, C: /pagefile.sys
  • * .old: los archivos con esta extensión generalmente son dejados por el software antivirus especialmente para definiciones antiguas, etc.
  • * .bak– los archivos de respaldo generados por el software antivirus o el software del sistema al verificar el disco duro.
  • También aquellas extensiones * .tmp, * .temp, chk *, * .gid, .nch *, * .wbk, .fts *, * .FTG, *. $$$, .err *, * .-, . ~ , ~ . PS _ , *. ~ mp, * ._ mp, * .prv, * .sik, CHKLIST.MS, * .ilk, * .aps, * .mcp, * .pch, *. $ db, *.? $? *. ?? ~, *.? ~ ?, * .db $, *. ^, * ._ dd, * ._ detmp, 0 * .nch, chklist. *, mscreate.dir, * .diz, * .syd, * .grp, * .cnt, *. ~ mp
  • accesos directos rotos: algunas veces, al desinstalar un programa con agregar / quitar predeterminado, dejará atajos para ese programa.
  • minidumps antiguos: los minidumps son archivos que Windows registra cuando el sistema tiene una pantalla azul.

Pasos

  • Si ya está en Windows (Ejecute la herramienta de desfragmentación y la herramienta cleanmgr). Eliminará muchos archivos innecesarios.
  • Elimine esos archivos no necesarios en Unix.
Md Mahbubur Rahman
fuente
0
C:/pagefile.sys

En el directorio raíz de C: /, pagefile.sys debería ser un archivo bastante grande que ya no necesita.

En la mayoría de los casos, todo el directorio de Windows no es útil, excepto con un emulador, una máquina virtual.

Las fuentes pueden ser una excepción (* .ttf / * .TTF al menos).

usuario desconocido
fuente
El archivo de paginación fue uno de los primeros objetivos. El directorio de Windows a menudo es un buen objetivo, a menos que los usuarios lo usen para ocultar archivos en ... lo que a veces es un caso, y no se puede descartar. Las fuentes son un buen objetivo para guardar, pero pueden estar cargadas de licencia.
Killermist
1
@killermist: Bueno, si tienes la licencia de Windows, entonces puedes usar las fuentes. Si no, no.
usuario desconocido el