Maildir से डुप्लिकेट संदेश निकालें


10

मुझे अपने IMAP सर्वर के Maildir में डुप्लिकेट संदेशों का एक गुच्छा मिला है। उन्हें हटाने का सबसे अच्छा तरीका क्या है?

कुछ प्रासंगिक बिंदु:

  • साझा संदेश-आईडी आमतौर पर डुप्लिकेट की एक अच्छी पर्याप्त परिभाषा है। एक छोटी सी स्क्रिप्ट जो सभी को हटा देती है लेकिन डुप्लिकेट संदेशों में से एक काम करेगी।
  • कभी-कभी यह साझा संदेश निकायों के आधार पर डुप्लिकेट खोजने के लिए आवश्यक है। यहाँ साझा की एक उचित परिभाषा क्या है? बिटवाइज बराबर? लाइन रैपिंग, भागने, चरित्र एन्कोडिंग में अजीब अंतर के बारे में क्या?
  • कभी-कभी 'डुप्लिकेट' संदेशों के बीच कुछ सार्थक अंतर होता है। 'डुप्लिकेट' संदेशों के सेट में अंतर की समीक्षा करने का सबसे अच्छा तरीका क्या है? Diffs?

जवाबों:


6

मैंने ऊपर उल्लिखित केविन की स्क्रिप्ट में कुछ महत्वपूर्ण सुधार किए हैं, और वह मेरे पुल अनुरोधों को स्वीकार करने के लिए पर्याप्त था। अंततः हम इसे एक समर्पित परियोजना में विभाजित करते हैं, जिसे आप यहां पा सकते हैं:

https://github.com/kdeldycke/maildir-deduplicate


यह स्क्रिप्ट नए स्थान पर चली गई, इसलिए मैंने लिंक को अपडेट कर दिया।
एडम स्पियर्स

3

लिनक्स में सामान्य फ़ाइलों के लिए, मैं डुप्लिकेट फ़ाइलों को हटाने के लिए fdupes बर्तनों का उपयोग करता हूं। मैंने पाया कि यह Maildir संदेशों के लिए भी काम करता है।


1
fdupes केवल सटीक डुप्लिकेट के लिए काम करने लगता है, जबकि ओपी (स्पष्ट रूप से) दोहराव के अधिक जटिल पैटर्न के बारे में पूछ रहा है। एक संदेश .forwardजो दो बार दिया गया है या जो कुछ अलग हेडर होगा, इसलिए जबकि संदेश स्वयं एक डुप्लिकेट है, दो प्रतियों वाली दो फाइलें नहीं हो सकती हैं।
ट्रिपलए

0

ग्नोम का विकास [एक चित्रमय मेल उपयोगकर्ता एजेंट] में डुप्लिकेट मेल को हटाने के लिए एक अंतर्निहित सुविधा है। जैसा कि इस सहायता पृष्ठ पर बताया गया है , यह निम्नलिखित है:

  1. संदिग्ध संदेशों (या सिर्फ सभी संदेशों) का चयन करें
  2. मेनू संदेशों पर जाएं , डुप्लिकेट संदेश हटाएं चुनें ।

Voilà।

PS इवोल्यूशन आपके संदेशों को स्थानीय रूप से (MailDir, MH, Mbox) या IMAP पर पहुँच सकता है।


0

आज मैंने जो सबसे अच्छा पाया है वह केविन डेल्डीके के मेलडिर-डुप्लीकेट है

  • यह X-MIMETrackहेडर को डिफ़ॉल्ट रूप से नजरअंदाज करता है और हेडर की तुलना SHA224डाइजेस्ट का उपयोग करता है।
  • यह पुष्टि के लिए पूछे बिना डुप्लिकेट को स्वचालित रूप से हटा देता है; हालाँकि, एक ड्राई-रन मोड है जो पूर्वावलोकन करने की अनुमति देता है जो डुप्लिकेट हटा दिए जाएंगे।

मुझे यकीन है कि कोई रिक सैंडर्स के delIMAPdups.pl से कुछ कल्पना कर सकता है , उसके IMAP टूल्स का हिस्सा ।


maildir-deduplicate एक नए स्थान पर चले गए इसलिए मैंने लिंक को अपडेट किया। हालाँकि आपकी जानकारी अब पुरानी है।
एडम स्पियर्स

मैंने इसे अपडेट कर दिया है, ताकि पुरानी जानकारी भ्रामक न हो।
एडम स्पियर्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.