एक वैकल्पिक स्पष्टीकरण के रूप में, निम्नलिखित अंतर्ज्ञान पर विचार करें:
त्रुटि को कम करते समय, हमें यह तय करना चाहिए कि इन त्रुटियों को कैसे दंडित किया जाए। दरअसल, दंडात्मक त्रुटियों के लिए सबसे सीधा तरीका एक linearly proportional
दंड समारोह का उपयोग करना होगा । इस तरह के फ़ंक्शन के साथ, माध्य से प्रत्येक विचलन को आनुपातिक संगत त्रुटि दी जाती है। इस बीच से दो बार के परिणामस्वरूप दोगुना जुर्माना होगा।
अधिक सामान्य दृष्टिकोण squared proportional
माध्य और इसी दंड से विचलन के बीच एक संबंध पर विचार करना है। इससे यह सुनिश्चित हो जाएगा कि आप जितना आगे से दूर हैं, आनुपातिक रूप से उतना ही अधिक आपको दंडित किया जाएगा। इस दंड समारोह का उपयोग करते हुए, आउटलेर्स (माध्य से दूर) को आनुपातिक रूप से अर्थ के निकट टिप्पणियों की तुलना में अधिक जानकारीपूर्ण माना जाता है।
इसका एक विज़ुअलाइज़ेशन देने के लिए, आप बस दंड कार्यों को प्लॉट कर सकते हैं:
अब विशेष रूप से जब प्रतिगमन (जैसे ओएलएस) के आकलन पर विचार करते हैं, तो अलग-अलग दंड कार्य अलग-अलग परिणाम देंगे। linearly proportional
पेनल्टी फ़ंक्शन का उपयोग करते हुए , प्रतिगमन फ़ंक्शन का उपयोग करते समय रिग्रेशन आउटलेर्स को कम वजन देगा squared proportional
। इसलिए मेडियन एब्सोल्यूट डिविएशन (एमएडी) एक अधिक मजबूत अनुमानक के रूप में जाना जाता है । सामान्य तौर पर, यह ऐसा मामला है कि एक मजबूत अनुमानक अधिकांश डेटा बिंदुओं को अच्छी तरह से फिट बैठता है, लेकिन आउटलेर्स को 'अनदेखा' करता है। एक न्यूनतम वर्ग, फिट बैठता है, तुलना में, आउटलेर्स की ओर अधिक खींचा जाता है। यहाँ तुलना के लिए एक दृश्य है:
अब भले ही ओएलएस बहुत मानक है, अलग-अलग दंड कार्य सबसे निश्चित रूप से उपयोग में हैं। एक उदाहरण के रूप में, आप मैटलैब के सुदृढ़ कार्य पर एक नज़र डाल सकते हैं जो आपको अपने प्रतिगमन के लिए एक अलग दंड (जिसे 'वेट' भी कहा जाता है) फ़ंक्शन का चयन करने की अनुमति देता है। दंड कार्यों में andrews, bisquare, cauchy, fair, huber, logistic, ols, talwar और welsch शामिल हैं। उनकी संबंधित अभिव्यक्तियों को वेबसाइट पर भी पाया जा सकता है।
मुझे उम्मीद है कि आपको दंड कार्यों के लिए थोड़ा और अंतर्ज्ञान प्राप्त करने में मदद मिलेगी :)
अद्यतन करें
यदि आपके पास माटलैब है , तो मैं मतलाब के स्ट्रांगडेमो के साथ खेलने की सिफारिश कर सकता हूं , जो विशेष रूप से साधारण रिक्वायरमेंट से मजबूत प्रतिगमन की तुलना के लिए बनाया गया था:
डेमो आपको व्यक्तिगत बिंदुओं को खींचने की अनुमति देता है और तुरंत साधारण कम से कम वर्गों और मजबूत प्रतिगमन (जो शिक्षण उद्देश्यों के लिए एकदम सही है!) दोनों पर प्रभाव देखता है।