Deduplicate छवियाँ विभिन्न प्रस्तावों में उपकरणों के बीच समन्वयित होती हैं


1

वर्तमान में मेरे पास कुछ स्क्रिप्ट और एंड्रॉइड ऐप हैं जो एक साथ मेंबर डिवाइस (स्मार्टफ़ोन, पीसी, डिजिटल कैमरा) के एक सेट के लिए करते हैं:

  • सभी सदस्य उपकरणों द्वारा ली गई सभी तस्वीरें स्वचालित रूप से ड्रॉपबॉक्स के साथ सिंक की जाती हैं
    • स्मार्टफ़ोन के लिए, यह Dropync ऐप का उपयोग करके किया जाता है
    • डिजिटल कैमरों के लिए, जैसे ही USB के माध्यम से कैमरा कनेक्ट होता है, एक स्क्रिप्ट चलाई जाती है
  • सप्ताह में एक बार, सभी सदस्यों के इस तरह से सिंक किए गए सभी चित्रों को ड्रॉपबॉक्स पर एक अलग निर्देशिका में ले जाया जाता है, दीर्घकालिक भंडारण के लिए।
  • इस कदम के बाद, एक समर्पण होता है - यह संग्रह निर्देशिका (इसे कॉल करें Dropbox/PicsArchive/) स्कैन किया जाता है, और सभी डुप्लिकेट का पता लगाया जाता है और हटा दिया जाता है। वर्तमान में, मैं fdupesडुप्लिकेट का पता लगाने के लिए उपयोग करता हूं , लेकिन मेरी जानकारी के लिए, यह केवल सटीक डुप्लिकेट का पता लगाता है , अर्थात, समान चेकसम की फाइलें।

समस्या

हालांकि, सभी सदस्यों के बीच निर्विवाद संबंध है।

उदाहरण के लिए, इन लिपियों को चलाने वाले पीसी के एक विशेष प्रकार के डिजिटल कैमरा को USB से कनेक्ट करते समय, इसके मेमोरी कार्ड पर चित्रों को ड्रॉपबॉक्स में ले जाया जाता है, और डाउनसाइज़ की गई प्रतियां जनरेट की जाती हैं और फिर स्मार्टफोन सदस्यों के सबसेट पर भेज दी जाती हैं (उपयोग करके) शानदार ऑटोरेमोट ऐप)। ये रिसाइज्ड कॉपियाँ बहुत आसानी से स्मार्टफोन के किसी स्थान पर समाप्त हो सकती हैं, जिसे ड्रॉप्स सिंक द्वारा सिंक भी किया जा रहा है। इसलिए, कैमरे की तस्वीरें, साथ ही साथ इन आकार की प्रतियां, फिर दोनों अंततः में सिंक किए गए हैं Dropbox/PicsArchive/

एक और उदाहरण स्मार्टफोन के कैमरे (उच्च रिज़ॉल्यूशन) के साथ एक तस्वीर ले रहा है और इसे व्हाट्सएप संपर्क में साझा कर रहा है - अक्सर, व्हाट्सएप उस छवि के संकल्प को कम कर देता है। लेकिन मैं चाहता हूं कि दोनों स्थान सिंक किए गए हों (कैमरा और प्रासंगिक व्हाट्सएप मीडिया निर्देशिका), जिसका अर्थ है, ड्रॉपसिंक ड्रॉपबॉक्स में दो चित्रों (उच्च और कम रिज़ॉल्यूशन के साथ एक) को सिंक करेगा, और दोनों अंततः समाप्त हो जाएंगे Dropbox/PicsArchive/

जाहिर है, मैं केवल उच्चतम रिज़ॉल्यूशन / गुणवत्ता वाली छवियां रखना चाहता हूं। शायद एक बेहतर बैकअप रणनीति वही है जो यहां जरूरी है, न कि गंदगी को साफ करने के लिए अधिक सामान्य उपकरण जो किसी भी तरह से रोकने योग्य है।

यहां वर्तमान सेटअप के कुछ कच्चे चित्र हैं। यहाँ मूल उपयोग मामला है:

मैंने तब लिंकेज को लागू किया, ताकि उपयोगकर्ताओं को डिजिटल कैमरा के साथ उच्च गुणवत्ता वाली छवियां बनाने के लिए उत्तेजित किया जा सके, जबकि अभी भी उन उपयोगकर्ताओं को व्हाट्सएप उपयोगकर्ताओं को आसानी से भेजने में सक्षम है:

यह भी ध्यान दें कि पथ फोन कैमरा → व्हाट्सएप फोन पर एक डुप्लिकेट बनाता है (फोन कैमरा निर्देशिका और व्हाट्सएप मीडिया निर्देशिका दोनों को सिंक किया जाता है, जो निश्चित रूप से आवश्यक है कि तस्वीरों को व्हाट्सएप के रूप में अच्छी तरह से सिंक किया जाए)।

तो, मैं इन सभी चित्रों को कैसे काट सकता हूं?



सॉफ्टवेयर सिफारिशों पर इसे फिर से पूछने के लिए स्वतंत्र महसूस करें । जैसा कि यह खड़ा है, यह सूची सॉफ्टवेयर के लिए सिर्फ एक अनुरोध है जो एक्सवाईजेड करता है । एक वैध विकल्प सिर्फ यह होगा कि आपने जो भी प्रयास किया है और उस वास्तविक समस्या का वर्णन करें जिसे आप हल करने की कोशिश कर रहे हैं। आपको बहुत से लोग मिलेंगे जो किसी चीज़ को एक साथ हैक करने के लिए तैयार हैं (यहां तक ​​कि आपके द्वारा शुरू की गई कुछ चीज़ों के आधार पर), लेकिन मुझे यहां जेक के साथ सहमत होना होगा कि यह एक जादू कार्यक्रम के लिए एक whishlist जैसा दिखता है जो मौजूद हो सकता है या नहीं। उन प्रकार के प्रश्नों को यहां (और अधिकांश एसई साइटों पर) प्रोत्साहित नहीं किया जाता है।
slhck

@slhck ठीक है, इस बारे में कैसे?
रोडी ओल्डेनहिस 19

मैंने (अब अप्रासंगिक) भाग को हटाने की कोशिश की, जहाँ आप एक उपकरण के लिए पूछ रहे हैं। मेरे लिए यह प्रश्न ठीक है कि इस तरह से, आप 1) हालांकि उत्तर देने के लिए आवश्यक नंगे आवश्यक को कम करने की कोशिश कर सकते हैं और 2) उन लोगों को सूचित करें जिन्होंने पहले ही उत्तर दे दिया था कि उनके उत्तर अब मान्य नहीं हैं। आम तौर पर किसी सवाल को मौलिक रूप से बदलना इतना अच्छा नहीं होता है, लेकिन यह देखते हुए कि आपके पास अब जो उत्तर हैं, वे आपके मूल प्रश्न के समाधान की तरह नहीं दिखेंगे (और अपवित्र नहीं हैं), मैं यहां फिर से लिखना चाहूंगा।
19

जवाबों:


-1

ImageMagick को छवियों की तुलना करने के लिए कुछ हैश बनाने में सक्षम होना चाहिए, लेकिन यह एक टूलकिट की तरह है जो आपको कुछ समय बिताने के लिए सीखना होगा कि कैसे अपने स्वयं के कस्टम उत्तर का उपयोग करें और बनाएं जो कि आप चाहते हैं, बल्कि यहां "आपका जवाब" है। में चिपकाया गया। लेकिन यहां तक ​​कि Google की "समान छवियां" एकदम सही है, और डुप्लिकेट का वास्तव में पता लगाने का सबसे अच्छा तरीका उन्हें देखना है, या तो "अंतर" छवियां बनाई हैं, या स्वयं वास्तविक छवियां।

ImageMagick® बिटमैप छवियों को बनाने, संपादित करने, बनाने या परिवर्तित करने के लिए एक सॉफ्टवेयर सूट है।

ImageMagick एक मुफ्त सॉफ्टवेयर है जो रेडी-टू-रन बाइनरी डिस्ट्रीब्यूशन या सोर्स कोड के रूप में दिया जाता है जिसका उपयोग आप ओपन और मालिकाना दोनों अनुप्रयोगों में कर सकते हैं, कॉपी कर सकते हैं, संशोधित कर सकते हैं और वितरित कर सकते हैं। यह Apache 2.0 लाइसेंस के तहत वितरित किया जाता है, OSI द्वारा अनुमोदित और OSSCC द्वारा उपयोग के लिए अनुशंसित है।

वर्तमान रिलीज़ ImageMagick 6.9.0-5 http://www.imagemagick.org/download से उपलब्ध है । यह लिनक्स, विंडोज, मैक ओएस एक्स, आईओएस, एंड्रॉइड ओएस और अन्य पर चलता है।

ImageMagick उदाहरण - छवि तुलना - जानकारी और तकनीकों के बहुत सारे, लेकिन एक बहुत "अंतर" चित्र बनाने के लिए एक नज़र रखना शामिल है।

इस क्लिप को अलग-अलग मेटाडेटा वाली समान छवियों के लिए "समस्या" के कम से कम हिस्से को हल करना चाहिए:

आप प्रत्येक छवि के लिए IM 'हस्ताक्षर' बना सकते हैं ...

identify -quiet -format "%#" images...

MD5 और SHA256 की तरह एक हैश स्ट्रिंग उत्पन्न करता है। हालांकि बाद के विपरीत, यह हस्ताक्षर उत्पन्न करने के लिए वास्तविक छवि डेटा का उपयोग करता है, न कि छवियों मेटाडेटा का।

इस प्रकार, यदि आपके पास एक ही चित्र की दो प्रतियां हैं, लेकिन विभिन्न निर्माण / संशोधन टाइमस्टैम्प के साथ, आपको दोनों फाइलों के लिए एक ही हस्ताक्षर प्राप्त करना चाहिए, जबकि MD5 और SHA256 दो हस्ताक्षर का उत्पादन करेंगे भले ही छवि स्वयं एक ही हो।

चेतावनी: JPEG छवि को पढ़ना और लिखना अलग छवि डेटा और इस प्रकार एक अलग हस्ताक्षर उत्पन्न करेगा। यह बस हानिपूर्ण संपीड़न JPEG छवि प्रारूप उपयोग के कारण है।

फिर अपनी पसंद के उपकरण के साथ हैश की तुलना करें, लिनक्स को पसंद करते हुए आप शायद परिचित हों if [[ "$string1" == "$string2" ]]...


कुछ अन्य संभावित विकल्प:

लेकिन, शायद एक बेहतर बैकअप रणनीति जो केवल "मास्टर" उच्च-रिज़ॉल्यूशन छवियों का समर्थन करती है, बनाए गए थंबनेल और गैर-मास्टर फ़ोल्डरों को अनदेखा करना कहीं अधिक तेज और आसान होगा।


धन्यवाद, लेकिन क्या आपके पास उनमें से किसी के साथ कोई अनुभव है? क्या आप प्रत्येक की विश्वसनीयता के बारे में बयान दे सकते हैं? क्या आप इनपुट और आउटपुट के उदाहरण दिखा सकते हैं? ... या यह सिर्फ Google परिणामों के पहले जोड़े की एक सूची है जो मैंने भी पाया है? :)
रोडी ओल्डेनहिस

यह एक उत्तर नहीं है, लेकिन सिर्फ एक खुली सूची वाला उपकरण है। उदाहरण के लिए, मैं व्यक्तिगत उपयोग से जानता हूं कि ImageMagick छवि तुलना कर सकता है, लेकिन यह है कि यह कोर है- एक गहन प्रक्रिया है जो इसे उत्पादन के आधार पर अच्छी तरह से काम करने के लिए बनाती है। एक को अनिवार्य रूप से कुछ ढांचे का निर्माण करना होता है - स्क्रिप्टिंग टूल का उपयोग bashकरना - जैसे कि इमेजमैजिक को वास्तव में व्यावहारिक तरीके से थोक तुलना के लिए अच्छी तरह से काम करना।
जेकगोल्ड

"अलग मेटाडाटा" छवियों के लिए कमांड लाइन उत्तर जोड़ा गया। उनका उपयोग करने का कोई व्यक्तिगत अनुभव नहीं है, केवल ImageMagick की "विश्वसनीयता के बारे में बयान" यह होगा कि यह FOSS है, इसलिए संभवतः अन्य FOSS परियोजनाओं की विश्वसनीयता के समान है
Xen2050

मुझे पिछले दो वाक्य पसंद हैं ... हालाँकि, मुझे एक बेहतर रणनीति नहीं दिख रही है; व्हाट्सएप के माध्यम से भेजी जाने वाली छवि के बीच लिपियों के बीच अंतर करने के लिए अक्सर कोई रास्ता नहीं होता है, और यह "मास्टर" छवि से आता है (जैसे, डिजिटल कैमरा या फोन कैमरा व्हाट्सएप के अंदर या बाहर से चलता है ...)
Rody Oldenhuis

शायद वहाँ मेटाडेटा मदद कर सकता है? एक कैमरा / फोन "मूल" छवि में आमतौर पर कैमरा, सेटिंग्स, कभी-कभी जीपीएस जानकारी भी होती है ... मुझे नहीं पता कि क्या व्हाट्सएप उन सभी को कॉपी करता है, या अगर यह ऐसा होता है, तो यह स्वयं का उपयोग कर सकता है "व्हाट्सएप का उपयोग करें!" टैगाइन या कुछ और?
Xen2050

-2

तीन उपकरण जो मैंने अतीत में महान परिणामों के साथ उपयोग किए हैं। सभी विंडोज के लिए हैं। कोई भी खुला स्रोत नहीं है और न ही लिनक्स के लिए।

  • पिकासा : आप बस अपनी छवियों को लोड करते हैं, फिर डुप्लिकेट खोजने के लिए प्रायोगिक सुविधाओं में जाएं

  • VisiPics : यह टूल अपने सबसे अधिक प्रतिबंधात्मक सेटिंग पर सटीक डुप्लिकेट के लिए स्कैन करता है। आप समान छवियों को खोजने के लिए सेटिंग को "ढीला" कर सकते हैं। उदाहरण के लिए, आप उन चित्रों का मिलान कर सकते हैं जो आप एक तस्वीर में फेंक रहे हैं, लेकिन दूसरे में मुस्कुरा रहे हैं।

  • समानता : ऑडियो के लिए बढ़िया काम करता है, लेकिन साथ ही साथ मिलान करने वाली छवियों के लिए एक विशेषता है। यह उन छवियों का भी पता लगा सकता है जो सही ढंग से उन्मुख नहीं हैं, लेकिन हमेशा उच्चतम गुणवत्ता वाली छवि को पीछे छोड़ते हुए एक अच्छा काम नहीं करते हैं।


धन्यवाद, लेकिन ... मैं एक लिनक्स आदमी हूँ :)
पुराने Oldenhuis
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.