जो, यदि कोई हो, मशीन लर्निंग एल्गोरिदम को स्पष्टीकरण और भविष्यवाणी के बीच एक अच्छा व्यापार माना जा रहा है?


9

ग्रैडिएंट बूस्टिंग मशीन या न्यूरल नेटवर्क जैसे एल्गोरिदम का वर्णन करने वाले मशीन लर्निंग टेक्स्ट अक्सर टिप्पणी करते हैं कि ये मॉडल भविष्यवाणी में अच्छे हैं, लेकिन यह व्याख्यात्मकता या व्याख्या के नुकसान की कीमत पर आता है। इसके विपरीत, एकल निर्णय पेड़ों और शास्त्रीय प्रतिगमन मॉडल को स्पष्टीकरण के रूप में अच्छा माना जाता है, लेकिन यादृच्छिक जंगलों या एसवीएम जैसे अधिक परिष्कृत मॉडल की तुलना में (अपेक्षाकृत) खराब भविष्यवाणी सटीकता देता है। क्या मशीन लर्निंग मॉडल आमतौर पर दोनों के बीच एक अच्छे व्यापार का प्रतिनिधित्व करने के रूप में स्वीकार किए जाते हैं? क्या एल्गोरिदम की विशेषताओं को समझने वाला कोई साहित्य है जो उन्हें व्याख्यायित करने की अनुमति देता है? (यह सवाल पहले क्रॉस-वैरिफाइड पर पूछा गया था)

जवाबों:


3

क्या कोई साहित्य एल्गोरिदम की विशेषताओं की गणना कर रहा है जो उन्हें व्याख्या करने की अनुमति देता है?

एकमात्र साहित्य जिसके बारे में मुझे पता है, वह है रीबेरो, सिंह और गेस्ट्रीन का हालिया पत्र । वे पहले एक ही भविष्यवाणी की व्याख्या को परिभाषित करते हैं:

"एक भविष्यवाणी की व्याख्या" करके, हमारा मतलब है कि पाठ या दृश्य कलाकृतियों को प्रस्तुत करना जो उदाहरण के घटकों (उदाहरण के लिए पाठ में शब्द, एक छवि में पैच) और मॉडल की भविष्यवाणी के बीच संबंधों की गुणात्मक समझ प्रदान करते हैं।

लेखक आगे इस बारे में विस्तार से बताते हैं कि अधिक ठोस उदाहरणों के लिए इसका क्या अर्थ है, और फिर इस धारणा का उपयोग किसी मॉडल की व्याख्या को परिभाषित करने के लिए करें। उनका उद्देश्य मौजूदा तरीकों की व्याख्यात्मकता की तुलना करने के बजाय अन्यथा अकर्मक मॉडल के लिए कृत्रिम रूप से व्याख्यात्मकता को जोड़ने और बोलने की कोशिश करना है। पेपर वैसे भी मददगार हो सकता है, जैसा कि "व्याख्यात्मकता" की धारणा के आसपास एक अधिक सटीक शब्दावली को पेश करने की कोशिश की जाती है।

क्या मशीन लर्निंग मॉडल आमतौर पर दोनों के बीच एक अच्छे व्यापार का प्रतिनिधित्व करने के रूप में स्वीकार किए जाते हैं?

मैं @ के साथ सहमत हूँ कि लोचदार-शुद्ध (केवल लॉजिस्टिक के लिए) प्रतिगमन को भविष्यवाणी सटीकता और स्पष्टीकरण के बीच एक अच्छे समझौते के लिए एक उदाहरण के रूप में देखा जा सकता है।

एक अलग तरह के एप्लिकेशन डोमेन (समय श्रृंखला) के लिए, तरीकों का एक अन्य वर्ग भी एक अच्छा समझौता प्रदान करता है: बायेसियन स्ट्रक्चरल टाइम सीरीज मॉडलिंग। यह शास्त्रीय संरचनात्मक समय श्रृंखला मॉडलिंग, और बायेसियन दृष्टिकोण से कुछ लचीलेपन से व्याख्यात्मकता प्राप्त करता है। लॉजिस्टिक रिग्रेशन के समान, मॉडलिंग के लिए उपयोग किए जाने वाले रिग्रेशन समीकरणों से स्पष्टीकरण में मदद मिलती है। विपणन में एक अच्छा आवेदन और आगे के संदर्भों के लिए इस पेपर को देखें ।

केवल उल्लेख किए गए बायेसियन संदर्भ से संबंधित, आप संभाव्य चित्रमय मॉडल को देखना चाह सकते हैं। उनकी व्याख्या प्रतिगमन समीकरणों पर निर्भर नहीं करती है, लेकिन मॉडलिंग के चित्रमय तरीकों पर; एक महान अवलोकन के लिए कोल्लर और फ्रीडमैन द्वारा "प्रोबेबिलिस्टिक ग्राफिकल मॉडल: सिद्धांत और तकनीक" देखें।

मुझे यकीन नहीं है कि हम ऊपर दिए गए बायेसियन तरीकों को "आम तौर पर स्वीकार किए गए अच्छे व्यापार-बंद" के रूप में संदर्भित कर सकते हैं। वे उस के लिए पर्याप्त रूप से अच्छी तरह से ज्ञात नहीं हो सकते हैं, खासकर लोचदार शुद्ध उदाहरण की तुलना में।


अब जब मुझे रिबेरो एट अल द्वारा लिंक किए गए पेपर पर विचार करने का मौका मिला है, तो मैं यह कहना चाहूंगा कि धारा 2 'द केस फॉर एक्सप्लोरेशन' में 'स्पष्टीकरण' की एक उपयोगी परिभाषा है। इसके महत्व को रेखांकित करने का सभ्य काम, और इस तरह, डेटा साइंस समुदाय के भीतर व्यापक रूप से पढ़ा जाने योग्य है।
रॉबर्ट डी ग्रेफ

: हालांकि मेरे सवाल के आधार सीवी पर स्वीकार नहीं किया गया, @SeanEaster मुझे इस उपयोगी लिंक के साथ मदद की jstage.jst.go.jp/article/bhmk1974/26/1/26_1_29/_article
रॉबर्ट डे Graaf

3

क्या मशीन लर्निंग मॉडल आमतौर पर दोनों के बीच एक अच्छे व्यापार का प्रतिनिधित्व करने के रूप में स्वीकार किए जाते हैं?

मुझे लगता है कि भविष्यवाणी से अच्छा होने का मतलब है कि आप ओवरफिटिंग के लिए काफी मजबूत होने के साथ-साथ डेटा में मौजूद nonlinearities फिट करने में सक्षम हैं। व्याख्यात्मकता और उन अशुभताओं की भविष्यवाणी करने में सक्षम होने के बीच का व्यापार डेटा और पूछे गए प्रश्न पर निर्भर करता है। डेटा विज्ञान में वास्तव में कोई मुफ्त भोजन नहीं है और किसी भी एल्गोरिथम को डेटा के किसी भी सेट के लिए सबसे अच्छा नहीं माना जा सकता है (और यही व्याख्या के लिए भी लागू होता है)।

सामान्य नियम यह होना चाहिए कि आप जितने अधिक एल्गोरिदम जानते हैं, यह आपके लिए उतना ही बेहतर है क्योंकि आप अपनी विशिष्ट आवश्यकताओं को अधिक आसानी से अपना सकते हैं।

अगर मुझे अपने पसंदीदा काम को वर्गीकरण कार्य के लिए चुनना होता है जो मैं अक्सर कारोबारी माहौल में उपयोग करता हूं तो मैं लॉजिस्टिक रिग्रेशन के लिए इलास्टिक-नेट चुनूंगा । उस प्रक्रिया के बारे में मजबूत धारणा के बावजूद जो डेटा उत्पन्न करती है, वह आसानी से डेटा को अपना सकती है, जो नियमितीकरण शब्द के लिए अपना सकती है, जो मूल लॉजिस्टिक रिग्रेशन से इसकी व्याख्या बनाए रखता है।

क्या एल्गोरिदम की विशेषताओं को समझने वाला कोई साहित्य है जो उन्हें व्याख्यायित करने की अनुमति देता है?

मैं आपको एक अच्छी तरह से लिखी गई पुस्तक लेने का सुझाव दूंगा जो आमतौर पर इस्तेमाल की जाने वाली मशीन लर्निंग एल्गोरिदम और अलग-अलग परिदृश्यों में सामान्य पेशेवरों और विपक्षों का वर्णन करती है। इस तरह की किताब का एक उदाहरण द एलीमेंट्री ऑफ स्टैटिस्टिकल लर्निंग ऑफ टी। हस्ती, आर। तिब्शिरानी और जे। फ्राइडमैन हो सकता है।


3
टीबीएच यह उस सटीक पाठ पर मेरी हताशा थी, जो अलग-अलग मॉडलों के संबंध में कई बार 'व्याख्यात्मक' शब्द का उपयोग करता है, और एक चरण में कहता है '... डेटा माइनिंग एप्लिकेशन को व्याख्यात्मक मॉडल की आवश्यकता होती है। यह केवल व्याख्याओं का उत्पादन करने के लिए पर्याप्त नहीं है '(खंड 10.7), मेरे बिना एक व्याख्यात्मक मॉडल की पहचान करने के लिए सामग्री खोजने में सक्षम होने के बिना - जिसने सवाल पूछा। हालांकि मैं इस तरह के एक उच्च माना पाठ के महत्वपूर्ण प्रकट करने के लिए घृणा कर रहा था। इसी तरह टीबीशिरानी के पेपर ने LASSO सूचियों को 'व्याख्या करने योग्य' के रूप में पेश किया, जो यह कहे बिना कि 'व्याख्यात्मक' क्या है, इसके गुणों में से एक है।
रॉबर्ट डी ग्रेफ

1

संभवतया विवरण बनाम पूर्वधारणा की अनुचित प्रभावोत्पादकता और स्पष्टीकरण बनाम भविष्यवाणी पर ट्रेडऑफ के बारे में मेरा उत्तर देखें । न्यूनतम संदेश लंबाई (एमएमएल, वालेस 2005) डेटा संपीड़न के संदर्भ में स्पष्टीकरण की एक औपचारिक परिभाषा देता है, और इस अपेक्षा को प्रेरित करता है कि स्पष्टीकरण आम तौर पर ओवरफिटिंग के बिना फिट होते हैं, और अच्छे स्पष्टीकरण अच्छे, सामान्य अनुमानों को उत्पन्न करते हैं। लेकिन यह औपचारिक सिद्धांत पर भी निर्भर करता है कि पहनावा बेहतर क्यों भविष्यवाणी करेगा - एक परिणाम (सोलोमनॉफ 1964) इष्टतम भविष्यवाणी और आंतरिक रूप से पूरी तरह से बायेसियन दृष्टिकोण पर जाने के लिए: पीछे वितरण पर एकीकृत, बस मतलब मत उठाओ, मंझला, या मोड।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.