एक स्क्रिप्ट के साथ osx में डुप्लिकेट फ़ाइलों को खोजना और निकालना


11

प्रेषक: http://www.chriswrites.com/2012/02/how-to-find-and-delete-duplicate-files-in-mac-os-x/ मैं इसे कैसे संशोधित करता हूं केवल पहले संस्करण को हटाने के लिए फ़ाइल यह देखता है।

स्पॉटलाइट या यूटिलिटीज़ फ़ोल्डर से टर्मिनल खोलें निर्देशिका (फ़ोल्डर) में बदलें जिसे आप सीडी कमांड का उपयोग करके (उप-फ़ोल्डर्स सहित) से खोजना चाहते हैं। उदाहरण के लिए कमांड प्रॉम्प्ट cd पर cd ~ / डॉक्युमेंट्स को डायरेक्टरी बदलने के लिए अपने होम डॉक्यूमेंट्स फोल्डर कमांड प्रॉम्प्ट पर, निम्न कमांड टाइप करें:

find . -size 20 \! -type d -exec cksum {} \; | sort | tee /tmp/f.tmp | cut -f 1,2 -d ' ' | uniq -d | grep -hif  /tmp/f.tmp > duplicates.txt

यह विधि यह निर्धारित करने के लिए एक साधारण चेकसम का उपयोग करती है कि क्या फाइलें समान हैं। डुप्लिकेट आइटमों के नाम मौजूदा निर्देशिका में डुप्लिकेट। Txt नामक एक फ़ाइल में सूचीबद्ध होंगे। समान फ़ाइलों के नाम देखने के लिए इसे खोलें डुप्लिकेट को हटाने के लिए अब विभिन्न तरीके हैं। कमांड प्रॉम्प्ट पर, टेक्स्ट फाइल की सभी फाइलें हटाने के लिए:

while read file; do rm "$file"; done < duplicates.txt

जवाबों:


4

सबसे पहले, आपको पहली कमांड लाइन को फिर से व्यवस्थित करना होगा ताकि फाइंड कमांड द्वारा मिली फाइलों का क्रम बना रहे:

find . -size 20 ! -type d -exec cksum {} \; | tee /tmp/f.tmp | cut -f 1,2 -d   | sort | uniq -d | grep -hif  /tmp/f.tmp > duplicates.txt

(नोट: मेरे द्वारा उपयोग की गई मशीन में परीक्षण के प्रयोजनों के लिए find . -type f -exec cksum {} \;)

दूसरे, सभी को प्रिंट करने का एक तरीका लेकिन पहला डुप्लिकेट एक सहायक फ़ाइल के उपयोग से है, आइए बताते हैं /tmp/f2.tmp। तब हम कुछ ऐसा कर सकते थे:

while read line; do
    checksum=$(echo "$line" | cut -f 1,2 -d' ')
    file=$(echo "$line" | cut -f 3 -d' ')

    if grep "$checksum" /tmp/f2.tmp > /dev/null; then
        # /tmp/f2.tmp already contains the checksum
        # print the file name
        # (printf is safer than echo, when for example "$file" starts with "-")
        printf %s\\n "$file"
    else
        echo "$checksum" >> /tmp/f2.tmp
    fi
done < duplicates.txt

यह सुनिश्चित करने के लिए कि यह /tmp/f2.tmpमौजूद है, और उदाहरण के लिए, निम्न आदेशों के माध्यम से बस खाली होना सुनिश्चित करें :

rm /tmp/f2.tmp
touch /tmp/f2.tmp

आशा है कि यह मदद करता है =)


39

एक अन्य विकल्प fdupes का उपयोग करना है:

brew install fdupes
fdupes -r .

fdupes -r .वर्तमान निर्देशिका के तहत डुप्लिकेट फ़ाइलों को पुन: खोजता है। -dडुप्लिकेट को हटाने के लिए जोड़ें - आपको संकेत दिया जाएगा कि कौन सी फाइलें रखें; यदि आप इसके बजाय जोड़ते हैं -dN, तो fdupes हमेशा पहली फ़ाइल रखेगा और अन्य फ़ाइलों को हटा देगा।


7
fdupesकमाल है! एक जादू की तरह काम किया! धन्यवाद भाई।!
racl101

3

मैंने एक स्क्रिप्ट लिखी थी जो आपकी सामग्री के हैश से मेल करने के लिए आपकी फ़ाइलों का नाम बदल देती है।

यह फ़ाइल के बाइट्स के सबसेट का उपयोग करता है, इसलिए यह तेज़ है, और यदि कोई टक्कर होती है तो यह एक काउंटर को नाम की तरह जोड़ता है:

3101ace8db9f.jpg
3101ace8db9f (1).jpg
3101ace8db9f (2).jpg

इससे आपको अपनी तस्वीरों के साथ किसी और के सॉफ़्टवेयर पर भरोसा करने की आवश्यकता के बिना, अपने दम पर डुप्लिकेट की समीक्षा करना और हटाना आसान हो जाता है।

स्क्रिप्ट: https://gist.github.com/SimplGy/75bb4fd26a12d4f16da6df1c4e506562

यहाँ छवि विवरण दर्ज करें


+1 सिर्फ GIF डिस्प्ले के लिए !!
NoobEditor

0

यह माइकल त्साई द्वारा विकसित ईगलफाइलर ऐप की मदद से किया गया है ।

tell application "EagleFiler"

      set _checksums to {}
      set _recordsSeen to {}
      set _records to selected records of browser window 1
      set _trash to trash of document of browser window 1
      repeat with _record in _records
          set _checksum to _record's checksum
          set _matches to my findMatch(_checksum, _checksums, _recordsSeen)
          if _matches is {} then
              set _checksums to {_checksum} & _checksums
              set _recordsSeen to {_record} & _recordsSeen
          else
              set _otherRecord to item 1 of _matches
              if _otherRecord's modification date > _record's modification date 
then

            set _record's container to _trash
            else
                set _otherRecord's container to _trash
                set _checksums to {_checksum} & _checksums
                set _recordsSeen to {_record} & _recordsSeen
            end if
        end if
    end repeat
end tell

on findMatch(_checksum, _checksums, _recordsSeen)

    tell application "EagleFiler"
        if _checksum is "" then return {}
        if _checksums contains _checksum then
            repeat with i from 1 to length of _checksums
                if item i of _checksums is _checksum then
                    return item i of _recordsSeen
                end if
            end repeat
        end if
        return {}
    end tell

end findMatch

आप इस पोस्ट में सुझाए गए डुप्लिकेट फ़ाइल रिमूवर के साथ डुप्लिकेट को स्वचालित रूप से हटा सकते हैं ।


1
(१) "ईगलफाइलर" क्या है? क्या यह macOS का हिस्सा है? यदि नहीं, तो आप इसे कहाँ प्राप्त करते हैं? (२) क्या इसका मतलब कोड का एक लंबा ब्लॉक होना है (जिस तरह से मैंने इसे तय किया है)? (३) कृपया अपना इंडेंटेशन ठीक करें। (४) वास्तव में कोई इसका उपयोग कैसे करता है?
स्कॉट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.