LinuxParty
Organizar su directorio personal o incluso su sistema puede ser particularmente difícil si tiene la costumbre de descargar todo tipo de cosas de Internet.
A menudo puede encontrar que ha descargado el mismo arrchivo, mp3, pdf, epub (y todo tipo de otras extensiones de archivo) y lo ha copiado en diferentes directorios. Esto puede hacer que sus directorios se llenen de todo tipo de cosas duplicadas inútiles.
En este tutorial, aprenderá cómo encontrar y eliminar archivos duplicados en Linux utilizando las herramientas de línea de comandos rdfind y fdupes , así como las herramientas GUI llamadas DupeGuru y FSlint .
Una nota de precaución: siempre tenga cuidado con lo que elimina en su sistema, ya que esto puede provocar la pérdida de datos no deseados. Si está utilizando una nueva herramienta, primero pruébela en un directorio de prueba donde eliminar archivos no será un problema.
1. rdfind - Encuentra archivos duplicados en Linux
Rdfind proviene de la búsqueda de datos redundantes. Es una herramienta gratuita utilizada para encontrar archivos duplicados en varios directorios o dentro de ellos. Utiliza la suma de comprobación y encuentra duplicados basados en archivos que no solo contienen nombres.
Rdfind usa un algoritmo para clasificar los archivos y detecta cuál de los duplicados es el archivo original y considera el resto como duplicados. Las reglas de clasificación son:
- Si A fue encontrado durante la exploración de un argumento de entrada antes de lo que B , A está en el puesto más alto.
- Si A se encuentra a una profundidad menor que B , A está en el puesto más alto.
- Si A se encontró antes que B , A está en el puesto más alto.
La última regla se usa particularmente cuando se encuentran dos archivos en el mismo directorio.
Para instalar rdfind en Linux, use el siguiente comando según su distribución de Linux.
$ sudo apt-get install rdfind [En Debian/Ubuntu ] $ sudo yum install epel-release && $ sudo yum install rdfind [En CentOS/RHEL ] $ sudo dnf install rdfind [En Fedora 22+ ] $ sudo pacman -S rdfind [En Arch Linux]
Para ejecutar rdfind en un directorio simplemente escriba rdfind y el directorio de destino. Aquí hay un ejemplo:
$ rdfind /home/usuario
Como puede ver, rdfind guardará los resultados en un archivo llamado results.txt ubicado en el mismo directorio desde donde ejecutó el programa. El archivo contiene todos los archivos duplicados que rdfind ha encontrado. Puede revisar el archivo y eliminar los archivos duplicados manualmente si lo desea.
Otra cosa que puede hacer es usar la opción -dryrun
que proporcionará una lista de duplicados sin realizar ninguna acción:
$ rdfind -dryrun true /home/user
Cuando encuentre los duplicados, puede elegir reemplazarlos con enlaces duros.
$ rdfind -makehardlinks true /home/user
Y si desea eliminar los duplicados, puede ejecutar.
$ rdfind -deleteduplicates true /home/user
Para verificar otras opciones útiles de rdfind puede usar el manual de rdfind con.
$ man rdfind
2. Fdupes - Escanear en busca de archivos duplicados en Linux
El comando fdupes es otro programa que le permite identificar archivos duplicados en su sistema. Es gratuito y de código abierto y está escrito en C. Utiliza los siguientes métodos para determinar archivos duplicados:
- Comparación de firmas parciales md5sum
- Comparación de firmas md5sum completas
- verificación de comparación byte por byte
Al igual que rdfind , tiene opciones similares:
- Busca recursivamente
- Excluir archivos vacíos
- Muestra el tamaño de los archivos duplicados.
- Eliminar duplicados inmediatamente
- Excluir archivos con un propietario diferente
Para instalar fdupes en Linux, use el siguiente comando según su distribución de Linux.
$ sudo apt-get install fdupes [En Debian/Ubuntu ] $ sudo yum install epel-release && $ sudo yum install fdupes [En CentOS/RHEL ] $ sudo dnf install fdupes [En Fedora 22+ ] $ sudo pacman -S fdupes [En Arch Linux]
La sintaxis de Fdupes es similar a la de rdfind . Simplemente escriba el comando seguido del directorio que desea escanear.
$ fdupes <dir>
Para buscar archivos de forma recursiva, deberá especificar -r
una opción como esta.
$ fdupes -r <dir>
También puede especificar varios directorios y especificar un directorio para buscar de forma recursiva.
$ fdupes <dir1> -r <dir2>
Para que fdupes calcule el tamaño de los archivos duplicados, use la -S
opción
$ fdupes -S <dir>
Para recopilar información resumida sobre los archivos encontrados, use la -m
opción
$ fdupes -m <dir>
Finalmente, si desea eliminar todos los duplicados, use -d
una opción como esta.
$ fdupes -d <dir>
Fdupes le preguntará cuál de los archivos encontrados debe eliminar. Deberá ingresar el número de archivo:
Una solución que definitivamente no se recomienda es usar la -N
opción que dará como resultado la preservación del primer archivo solamente.
$ fdupes -dN <dir>
Para obtener una lista de las opciones disponibles para usar con fdupes, revise la página de ayuda ejecutando.
$ fdupes -help
3. dupeGuru - Encuentra archivos duplicados en un Linux
dupeGuru es una herramienta de código abierto y multiplataforma que se puede utilizar para encontrar archivos duplicados en un sistema Linux. La herramienta puede escanear nombres de archivos o contenido en una o más carpetas. También le permite encontrar el nombre de archivo que es similar a los archivos que está buscando.
dupeGuru viene en diferentes versiones para plataformas Windows, Mac y Linux. Su rápida función de algoritmo de coincidencia difusa le ayuda a encontrar archivos duplicados en un minuto. Es personalizable, puede extraer los archivos duplicados exactos que desee y eliminar los archivos no deseados del sistema.
Para instalar dupeGuru en Linux, use el siguiente comando según su distribución de Linux.
--------------- En Debian/Ubuntu/Mint --------------- $ sudo add-apt-repository ppa: dupeguru/ppa $ sudo apt-get update $ sudo apt-get install dupeguru
--------------- En Arch Linux --------------- $ sudo pacman -S dupeguru
4. FSlint - Buscador de archivos duplicados para Linux
FSlint es una utilidad gratuita que se utiliza para buscar y limpiar varias formas de pelusa en un sistema de archivos. También informa archivos duplicados, directorios vacíos, archivos temporales, nombres duplicados/conflictivos (binarios), enlaces simbólicos incorrectos y muchos más. Tiene modos de línea de comandos y GUI.
Para instalar FSlint en Linux, use el siguiente comando según su distribución de Linux.
$ sudo apt-get install fslint [En Debian/Ubuntu ] $ sudo yum install epel-release && $ sudo yum install fslint [En CentOS/RHEL ] $ sudo dnf install fslint [En Fedora 22+ ] $ sudo pacman -S fslint [En Arch Linux]
Conclusión
Estas son las herramientas muy útiles para encontrar archivos duplicados en su sistema Linux, pero debe tener mucho cuidado al eliminar dichos archivos.
Si no está seguro de si necesita un archivo o no, sería mejor crear una copia de seguridad de ese archivo y recordar su directorio antes de eliminarlo. Si tiene alguna pregunta o comentario, envíelos en la sección de comentarios a continuación.
-
Linux
- Cambiar la Hora y la Fecha al sistema Linux
- Montar un directorio remoto, vía NFS, en Linux
- Predicciones de Linux para 2025
- Elementary OS 8: una distribución de Linux para usuarios de Windows y macOS
- Renombrar multiples archivos masivamente en Linux (quitar espacios, cambiar mayúsculas) a la vez en Linux
- He utilizado Linux durante 30 años. Aquí hay 5 razones por las que nunca cambiaré a Windows o MacOS
- Mis predicciones sobre Linux para 2025: será un buen año
- ¿Por qué Torvalds eliminó a los encargados rusos del mantenimiento del núcleo de Linux?
- 10 cosas que siempre hago después de instalar Linux (y por qué tú también deberías hacerlo)
- 7 cosas que nunca hago después de instalar Linux (y por qué tú tampoco deberías)
- Detección de Intrusos: Snort, Base, MySQL, y Apache2 en Ubuntu Linux 7.10
- ¿Por qué no más personas usan Linux en el escritorio? Tengo una teoría que quizás no te guste.
- Los países occidentales ricos lideran la expansión mundial del petróleo y el gas
- Systemd 256.1 aborda la queja de que 'systemd-tmpfiles' podría eliminar inesperadamente su directorio /home
- Por qué un kernel Linux de distribución 'congelada' no es la mejor opción para la seguridad