मेल सर्वर पर फ़िल्टर के माध्यम से बहुत सी स्पैम मिल रही हैं, जो कि (अविश्वसनीय रूप से स्पष्ट) वजन घटाने या शीर्ष पर अन्य स्कैम टेक्स्ट की कुछ पंक्तियों के साथ शुरू करने की अपेक्षाकृत सरल चाल के साथ चलती हैं, इसके बाद प्रोग्रामिंग प्रलेखन से पाठ का एक बड़ा निकाय है। - या, सभी की सबसे बुरी, स्टैक एक्सचेंज से पाठ स्क्रैप किया गया । सबसे अच्छे रूप में, स्पैमास हत्यारे इसे BAYES_50 के रूप में मानते हैं, और ऐसा होता है कि बाकी संदेशों का निर्माण सावधानीपूर्वक किया जाता है ताकि वे अन्य ट्रिगर्स को न मारें। (उदाहरण के लिए, हेडर न्यूनतम और सही हैं।) अक्सर, शामिल अंशों को मेरे वैध हितों के साथ पर्याप्त रूप से संरेखित किया जाता है कि कुल मिलाकर संदेश BAYES_00 के रूप में स्कोर किया जाता है, क्योंकि बहुत ही अनचाहा टोकन केवल sysadmin समस्या को हल करने के रसदार बजट से अभिभूत हैं।
शीर्ष भाग स्पष्ट रूप से स्पैमी है (और वास्तव में पहले से प्राप्त और स्पैम संदेशों के रूप में प्रशिक्षित होने के समान है) कि मैं इस तरह से चकित हो रहा हूँ - लेकिन स्पष्ट रूप से यह है। यह एक अलग पास की तरह लगता है जिसने संदेश के शीर्ष 25 (या तो) लाइनों को स्कोर किया और वजन किया जो समस्या को हल करेगा। क्या इसे करने का कोई तरीका है?
कई लोगों ने कस्टम रेगुलर एक्सप्रेशन लिखने का सुझाव दिया है। मैं इसमें शामिल नहीं होना चाहता, क्योंकि यह लगातार हारने वाली लड़ाई है। बेइज़ियन स्पैम छँटाई के व्यापक उपयोग में आने से पहले लोगों ने ऐसा किया था, और यह आमतौर पर भयानक था। कोई भी इंसान नहीं रख सकता । यह केवल प्रत्येक स्पैम संदेश के लिए कुंजी को हटाने से अधिक प्रभावी नहीं है, और मेरी ओर से बहुत अधिक काम करता है।
बायेसियन स्पैम फ़िल्टरिंग काम करता है। यह इस स्पैम पर भी काम करता है, अगर मैं " फोल्ड ऊपर " भाग को विभाजित करता हूं और सिर्फ उस हिस्से का विश्लेषण करता हूं , जिसमें डिकॉय / चैफ हटा दिया गया है। सवाल यह है: मैं ऐसा करने के लिए स्पैमाससिन कैसे प्राप्त कर सकता हूं?