Toon posts:

Dubbele bestandsnamen verwijderen?

Pagina: 1
Acties:

Verwijderd

Topicstarter
Weet er iemand hoe je het Linux file system kan afzoeken naar dubbele bestandsnamen en die tegelijkertijd verwijderen? :? Eventueel oook bestanden die meer dan twee keer voorkomen. Ik dacht dat het met het find commando kon?

  • Kees
  • Registratie: Juni 1999
  • Laatst online: 19:45

Kees

Serveradmin / BOFH / DoC
zomaar verwijderen wil je niet :)
Verder wordt het wel redelijk lastig, zowiezo; welke moet verwijderd worden?

Waarschijnlij is het makkelijker om het handmatig te doen, trouwens; waarom zou je dat willen doen?

"Een serveradmin, voluit een serveradministrator, is dan weer een slavenbeheerder oftewel een slavendrijver" - Rataplan


  • sebas
  • Registratie: April 2000
  • Laatst online: 16-12-2025
Find (bash) kun je gebruiken, perl ook. Ik denk dat een aantal talen hier wel geschikt voor zijn. Een comando "removefilewithdoublename" bestaat echter volgens mij niet.

Wat heb jij al geprobeerd, waar gezocht?

Everyone complains of his memory, no one of his judgement.


Verwijderd

Regelmatig zul je symlinks tegenkomen met dezelfde naam. Die dingen staan er het merendeel van de tijd niet voor niks ;)

Kortom, zoals Kees al zegt; waarom wil je gaan verwijderen? En zoals Kees ook al zegt, kun je dat soort dingen veel beter met de hand doen, dan geautomatiseerd (tenzij je ergens binnen wat "eigen" sub-dirs continue dezelfde bestanden hebt staan o.i.d.)

Verwijderd

Topicstarter
Ik dacht dat dit kon door het file system af te zoeken. Onder Windows heb je ook programma's die dit konden. Is makkelijk als de de dubbel bestanden kon verwijderen die zijn tenslotte overbodig.

Verwijderd

Ochja dat 3 personen die verstand van zaken hebben zeggen dat het onder GNU/Linux vrij normaal is dat je op sommige plaatsen dezelfde namen tegenkomt (symlinks, Makefiles etc) en dat je die niet wil verwijderen, maakt natuurlijk niets uit he? :+

Nogmaals het kan wel, maar je wil het echt niet doen hoor ;)

[ Voor 3% gewijzigd door Verwijderd op 15-05-2003 18:19 ]


  • Wilke
  • Registratie: December 2000
  • Nu online
Verwijderd schreef op 15 May 2003 @ 18:17:
Ik dacht dat dit kon door het file system af te zoeken. Onder Windows heb je ook programma's die dit konden. Is makkelijk als de de dubbel bestanden kon verwijderen die zijn tenslotte overbodig.
Een bestand met dezelfde filename, heeft tenslotte ook per definitie dezelfde inhoud, nietwaar?

Nog een laatste maal: wil je dit toepassen op een of andere subdirectory-tree, met laten we zeggen foto's of MP3's waar een zooi dubbele tussenstaan ofzo, of ben je er engere dingen mee van plan? Want dan ben ik bij deze de 4e persoon met enige Linux-ervaring die je dit van harte afraadt.

Als het je er dus om gaat om een paar bytes te besparen op "onnodige" systeembestanden: als je niet weet waar je mee bezig bent (en als je dit gaat automatiseren dan weet je dat duidelijk niet) dan wens ik je 5 minuten later veel succes met de reinstall :)

Verwijderd

Topicstarter
De bedoeling is eigenlijk dat ik een map heb waar mp3-tjes in staan. In een ander map heb ik van sommigen dezelfde mp3-tjes. Die wil ik natuurlijk niet dubbel hebben omdat dat schijfruimte zou besparen. Ik wil van ieder mp3-tje maar 1 exemplaar hebben.

  • A_L
  • Registratie: Juni 2001
  • Niet online

A_L

Verwijderd schreef op 15 May 2003 @ 20:37:
De bedoeling is eigenlijk dat ik een map heb waar mp3-tjes in staan. In een ander map heb ik van sommigen dezelfde mp3-tjes. Die wil ik natuurlijk niet dubbel hebben omdat dat schijfruimte zou besparen. Ik wil van ieder mp3-tje maar 1 exemplaar hebben.
Het python-script fixdupes lijkt hieraan te kunnen voldoen.
fixdupes.py - what is it?
This is a simple python program that takes a list of directories as command line argument. It goes through the directories, collecting the md5 checksum. It gives a list of files which are determined to be the same, and prompts which of the list is to be kept, then deletes the rest. There is the option to skip deletion.

This is handy for sorting through a large collections of mp3s, etc, and removing duplicates. ...

  • Kees
  • Registratie: Juni 1999
  • Laatst online: 19:45

Kees

Serveradmin / BOFH / DoC
Bash:
1
2
3
4
find . -type f -exec md5sum {} \; | \
sort | \
tee /tmp/find.result | \
uniq -c -w 32 -d /tmp/find.result


Deze vind ook alle duplicates voor je. daarna kan je zelf met grep in /tmp/find.result zoeken op de md5sum naar duplicates.

[ Voor 5% gewijzigd door Kees op 15-05-2003 21:20 ]

"Een serveradmin, voluit een serveradministrator, is dan weer een slavenbeheerder oftewel een slavendrijver" - Rataplan


Verwijderd

Topicstarter
Bedankt voor de tip. Dit is net wat ik nodig heb :)
Pagina: 1