[ EDIT # 1 ओपी द्वारा: इस प्रश्न का उत्तर दिया गया है जो एक्सफ़ाल्ट फ़ोरम पर डुप्लिकेट थ्रेड में एक्सफ़िल्टल निर्माता / अनुरक्षक फिल हार्वे द्वारा बहुत अच्छी तरह से उत्तर दिया गया है ]
[ OPIT # 2 EDIT से : ExifTool FAQ से : ExifTool सभी मेटाडेटा को हटाने का प्रयास करते समय फ़ाइल से मेटाडेटा को पूरी तरह से हटाने की गारंटी नहीं है । देखें 'लेखक की सीमाएँ']
मैं अपने पुराने हार्ड ड्राइव को उन तस्वीरों के लिए खोजना चाहता हूं जो मेरे वर्तमान बैकअप ड्राइव पर नहीं हैं। प्रारूप में jpg, png, tif, आदि शामिल हैं ... और साथ ही विभिन्न कच्चे प्रारूप (विभिन्न कैमरा मॉडल और निर्माता) भी शामिल हैं।
मुझे केवल छवि की अद्वितीयता में दिलचस्पी है और अंतर के कारण विशिष्टता नहीं है, कहते हैं, exif टैग के मूल्य, किसी दिए गए exif टैग की उपस्थिति / अनुपस्थिति, एम्बेडेड थंबनेल, आदि ...
भले ही मुझे अन्यथा समान छवियों की विभिन्न प्रतियों के बीच किसी भी भ्रष्टाचार / डेटा-रोट की तलाश करने की उम्मीद नहीं है, मैं इसका पता लगाना चाहता हूं, साथ ही आकार बदलने और रंग बदलने के कारण अंतर भी।
[ ओपी द्वारा # ३ संपादित करें: स्पष्टीकरण के लिए: झूठी सकारात्मकता का एक छोटा प्रतिशत सहनीय है (ऐसा नहीं होने पर एक फ़ाइल अद्वितीय होने के लिए निष्कर्ष निकाला जाता है) और झूठे नकारात्मक अत्यधिक अवांछनीय होते हैं (एक फ़ाइल को डुप्लिकेट होने के लिए गलत तरीके से निष्कर्ष निकाला जाता है)। ]
मेरी योजना किसी भी और सभी मेटाडेटा को हटाने के बाद md5sums के आधार पर विशिष्टता की पहचान करना है।
मैं मेटाडेटा कैसे छीन सकता हूं?
विल exiftool -all= <filename>पर्याप्त?
find $dir -type f -regextype posix-extended -regex ".*\.(jpg|png|<...>|cr2|raw|raf|orf)"जहां <...>अन्य प्रत्ययों का एक गुच्छा मतलब का उपयोग कर रहा हूँ ।
convert image.jpg - | md5sum(ImageMagick) आपको उपयुक्त MD5 रकम दें।
fileरॉ छवि स्वरूपों की खोज करने में विफल रहेगा औरfindकेवल एक्सटेंशन पर काम करेगा (यह आपके लिए बेहतर वर्णन करने के लिए उपयोगी हो सकता है)