हानि फ़ंक्शन और निर्णय फ़ंक्शन के बीच अंतर क्या है?


23

मैं देखता हूं कि दोनों फ़ंक्शन डेटा माइनिंग विधियों जैसे कि ग्रेडिएंट बूस्टिंग रेजिस्टर्स का हिस्सा हैं। मैं देखता हूं कि वे अलग-अलग वस्तुएं भी हैं।

दोनों का रिश्ता सामान्य रूप से कैसा है?

जवाबों:


45

एक निर्णय फ़ंक्शन एक फ़ंक्शन है जो डेटासेट को इनपुट के रूप में लेता है और आउटपुट के रूप में निर्णय देता है। निर्णय क्या हो सकता है हाथ में समस्या पर निर्भर करता है। उदाहरणों में शामिल:

  • अनुमान समस्याएं: "निर्णय" अनुमान है।
  • परिकल्पना परीक्षण समस्याओं: निर्णय अशक्त परिकल्पना को अस्वीकार या अस्वीकार करने के लिए है।
  • वर्गीकरण समस्याएं: निर्णय एक नए अवलोकन (या अवलोकन) को एक श्रेणी में वर्गीकृत करना है।
  • मॉडल चयन समस्याएं: निर्णय एक उम्मीदवार मॉडल को चुनना है।

आमतौर पर, किसी समस्या के लिए अनंत संख्या में निर्णय कार्य उपलब्ध होते हैं। अगर हम उदाहरण के लिए दस टिप्पणियों आधार पर स्वीडिश पुरुषों की ऊंचाई का अनुमान लगाने में रुचि रखते हैं , तो हम निम्नलिखित में से किसी भी निर्णय का उपयोग कर सकते हैं d ( x ) :एक्स=(एक्स1,एक्स2,...,एक्स10)(एक्स)

  • नमूना का मतलब: (एक्स)=110Σमैं=110एक्समैं
  • नमूने का माध्यिका: (एक्स)=मंझला(एक्स)
  • नमूना का ज्यामितीय मध्यमान: (एक्स)=एक्स1एक्स1010
  • फ़ंक्शन जो हमेशा 1: , चाहे x का मान हो । मूर्खतापूर्ण, हाँ, लेकिन यह एक मान्य निर्णय कार्य है।(एक्स)=1एक्स

फिर हम यह कैसे निर्धारित कर सकते हैं कि इनमें से कौन से निर्णय का उपयोग करना है? एक तरीका एक नुकसान फ़ंक्शन का उपयोग करना है , जो सभी संभावित निर्णयों से जुड़े नुकसान (या लागत) का वर्णन करता है। अलग-अलग निर्णय कार्यों से विभिन्न प्रकार की गलतियाँ होंगी। नुकसान फ़ंक्शन हमें बताता है कि हमें किस प्रकार की गलतियों के बारे में अधिक चिंतित होना चाहिए। सबसे अच्छा निर्णय फ़ंक्शन वह फ़ंक्शन है जो सबसे कम अपेक्षित नुकसान देता है । अपेक्षित नुकसान से क्या मतलब है सेटिंग पर निर्भर करता है (विशेष रूप से, चाहे हम लगातार या बेयसियन आंकड़ों के बारे में बात कर रहे हों )।

संक्षेप में:

  • निर्णय कार्यों का उपयोग डेटा के आधार पर निर्णय लेने के लिए किया जाता है।
  • हानि फ़ंक्शन का उपयोग यह निर्धारित करने के लिए किया जाता है कि किस निर्णय फ़ंक्शन का उपयोग करना है।

पैरामीट्रिक निर्णय कार्यों के लिए (जैसे: लॉजिस्टिक रिग्रेशन, थ्रेशोल्ड निर्णय) मूल रूप से आपके पास प्रत्येक पैरामीटर संयोजन के लिए एक संभावित कार्य है, और नुकसान फ़ंक्शन का उपयोग सबसे अच्छा खोजने के लिए किया जाता है। सामान्य उदाहरण: यदि आप पैरामीटर स्थान का पता लगाने के लिए ढाल वंश का उपयोग करते हैं, तो आप नुकसान को मापदंडों के संबंध में प्राप्त करते हैं और नुकसान के न्यूनतम (स्थानीय) पर उतरते हैं।
पिक्सो

7

हानि फ़ंक्शन वह है जो एक मॉडल प्राप्त करने के लिए कम से कम किया जाता है जो कुछ अर्थों में इष्टतम है। मॉडल में स्वयं एक निर्णय फ़ंक्शन होता है जिसका उपयोग भविष्यवाणी करने के लिए किया जाता है।

उदाहरण के लिए, SVM क्लासिफायर में:

  • एल(w,ξ)=12w2+सीΣमैंξमैं
  • (एक्स)=wटीएक्स+

दूरी के बराबर मानदंड नहीं है, या क्या मैं यहां कुछ मिलाता हूं ... इसलिए निर्णय फ़ंक्शन हमेशा उन नुकसान फ़ंक्शन का एक हिस्सा है जिसका उपयोग मैं उन वास्तविक मूल्यों से "तुलना" करने के लिए करता हूं जिनके लिए मैं एक मॉडल को ठीक करने की कोशिश करता हूं? और लक्ष्य इस "अंतर" को कम कर रहा है?
www.pieronigro.de

@ हेयटस को अलग करने वाले हाइपरप्लेन का मानदंड (जिसे एसवीएम को प्रशिक्षित करते समय अनुकूलित किया जा रहा है) का उपयोग निर्णय कार्य में नहीं किया जाता है। हाइपरप्लेन का ही उपयोग किया जाता है। प्रशिक्षण के दौरान आदर्श को छोटा करना मूल रूप से नियमितीकरण का एक रूप है।
मार्क क्लेसेन

अधिक सामान्य जवाब देना बेहतर होगा जो किसी विशिष्ट क्लासिफायर से जुड़ा नहीं है।
एसएमसीआई
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.