[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Deduplicator tabajara!
From: |
ainda_uso_win311 |
Subject: |
Deduplicator tabajara! |
Date: |
Wed, 10 Apr 2013 14:45:59 -0000 |
User-agent: |
eGroups-EW/0.82 |
Srs, estou tentando montar um script que localize arquivos identicos, apague os
duplicados e crie hardlinks para o mesmo inode.
Sem usar programas próprios, como o dedup, queria fazer algo com o md5sum. Eu
cheguei aqui e empaquei:
find . -type f -exec md5sum {} \; | sort -t" " -k1,1
A ideia é fazer com que ele crie hardlinks com as linhas que tenham o md5sum
duplicado.
Por favor, sem passar o código pronto, poderiam me "assoprar" por onde devo
começar a pesquisar? O intuito desse script é apenas para meu estudo mesmo.
Obs.: Sim, o filesystem é ext4.
Att.
Tiago Tarifa Munhoz.
- Deduplicator tabajara!,
ainda_uso_win311 <=