[ EDIT # 1 ओपी द्वारा: इस प्रश्न का उत्तर दिया गया है जो एक्सफ़ाल्ट फ़ोरम पर डुप्लिकेट थ्रेड में एक्सफ़िल्टल निर्माता / अनुरक्षक फिल हार्वे द्वारा बहुत अच्छी तरह से उत्तर दिया गया है ]
[ OPIT # 2 EDIT से : ExifTool FAQ से : ExifTool सभी मेटाडेटा को हटाने का प्रयास करते समय फ़ाइल से मेटाडेटा को पूरी तरह से हटाने की गारंटी नहीं है । देखें 'लेखक की सीमाएँ']
मैं अपने पुराने हार्ड ड्राइव को उन तस्वीरों के लिए खोजना चाहता हूं जो मेरे वर्तमान बैकअप ड्राइव पर नहीं हैं। प्रारूप में jpg, png, tif, आदि शामिल हैं ... और साथ ही विभिन्न कच्चे प्रारूप (विभिन्न कैमरा मॉडल और निर्माता) भी शामिल हैं।
मुझे केवल छवि की अद्वितीयता में दिलचस्पी है और अंतर के कारण विशिष्टता नहीं है, कहते हैं, exif टैग के मूल्य, किसी दिए गए exif टैग की उपस्थिति / अनुपस्थिति, एम्बेडेड थंबनेल, आदि ...
भले ही मुझे अन्यथा समान छवियों की विभिन्न प्रतियों के बीच किसी भी भ्रष्टाचार / डेटा-रोट की तलाश करने की उम्मीद नहीं है, मैं इसका पता लगाना चाहता हूं, साथ ही आकार बदलने और रंग बदलने के कारण अंतर भी।
[ ओपी द्वारा # ३ संपादित करें: स्पष्टीकरण के लिए: झूठी सकारात्मकता का एक छोटा प्रतिशत सहनीय है (ऐसा नहीं होने पर एक फ़ाइल अद्वितीय होने के लिए निष्कर्ष निकाला जाता है) और झूठे नकारात्मक अत्यधिक अवांछनीय होते हैं (एक फ़ाइल को डुप्लिकेट होने के लिए गलत तरीके से निष्कर्ष निकाला जाता है)। ]
मेरी योजना किसी भी और सभी मेटाडेटा को हटाने के बाद md5sums के आधार पर विशिष्टता की पहचान करना है।
मैं मेटाडेटा कैसे छीन सकता हूं?
विल exiftool -all= <filename>
पर्याप्त?
find $dir -type f -regextype posix-extended -regex ".*\.(jpg|png|<...>|cr2|raw|raf|orf)"
जहां <...>
अन्य प्रत्ययों का एक गुच्छा मतलब का उपयोग कर रहा हूँ ।
convert image.jpg - | md5sum
(ImageMagick) आपको उपयुक्त MD5 रकम दें।
file
रॉ छवि स्वरूपों की खोज करने में विफल रहेगा औरfind
केवल एक्सटेंशन पर काम करेगा (यह आपके लिए बेहतर वर्णन करने के लिए उपयोगी हो सकता है)