324 palabras
2 minutos
Borrar archivos duplicados en Linux con rdfind

Enlaces#

¿Qué es rdfind?#

Rdfind (Redundant Data Find) es una herramienta para encontrar archivos duplicados en tu sistema operativo. rdfind analiza el contenido real de los archivos para determinar si son idénticos, lo que la hace extremadamente confiable para liberar espacio en disco.

¿Cómo funciona?#

  1. Tamaño del archivo: Compara el tamaño de los archivos
  2. Primeros bytes: Compara el inicio de los archivos
  3. Últimos bytes: Compara el final de los archivos
  4. Checksum (Hash): Si todo lo anterior coincide, calcula una firma digital (como MD5 o SHA1) de todo el contenido para confirmar que son idénticos
  5. Genera un reporte: Crea un archivo llamado results.txt con la lista de los duplicados encontrados.

Opciones para procesar los resultados#

  • Borrar: Eliminar los archivos redundantes de forma automática.
  • Hardlinks: Reemplazar los duplicados con links físicos (hard links). Esto ahorra espacio pero mantiene el archivo accesible desde múltiples rutas.
  • Symlinks: Reemplazar los duplicados con links simbólicos.

¿Cómo instalar?#

Terminal window
sudo apt install rdfind

Ejecución#

Terminal window
rdfind folder
  • Creará el archivo results.txt

Modo seguro, dryrun#

Terminal window
rdfind -dryrun true folder
  • Te muestra lo que haría con los archivos, es decir, te muestra cuáles estaría borrando sin borrarlos.

Borrar duplicados#

Terminal window
rdfind -deleteduplicates true folder
  • Se elimina directamente, NO va a la papelera de reciclaje

Crea hardlinks#

Terminal window
rdfind -makehardlinks true folder
  • Un hardlink hace que dos o más nombres de archivo apunten al mismo contenido físico en el disco (el mismo inode)
  • Resultado: Si tenías dos archivos de 1GB que eran iguales, tras este comando seguirás viendo dos archivos, peroen el disco solo ocuparán 1GB en total. Si borras uno, el otro sigue funcionando perfectamente.

Crea syslinks#

Terminal window
rdfind -makesymlinks true folder
  • El archivo duplicado se convierte en un pequeño puntero que indica dónde está el archivo original
  • Resultado: El archivo duplicado ahora es solo un “alias”. Si borras el archivo original, el enlace simbólico quedará “roto” y no podrás acceder al contenido desde esa ruta
Nota final

¡Gracias por terminar de leer este artículo! uwur

— El Capitán

¿Tienes alguna duda o te gustaría comentar algo sobre este artículo?

Puedes encontrarme en:

Borrar archivos duplicados en Linux con rdfind
https://elcaza.github.io/posts/sysadmin/rdfind/
Autor
El Capitán
Publicado el
2025-12-24
Licencia
CC BY-NC-SA 4.0