अगर मुझे एक व्याख्यात्मक मॉडल चाहिए, तो क्या रैखिक प्रतिगमन के अलावा अन्य तरीके हैं?


18

मुझे कुछ सांख्यिकीविदों का सामना करना पड़ा जो कभी भी भविष्यवाणी के लिए रैखिक प्रतिगमन के अलावा अन्य मॉडलों का उपयोग नहीं करते हैं क्योंकि उनका मानना ​​है कि "एमएल मॉडल" जैसे कि यादृच्छिक वन या ढाल बढ़ाने के लिए व्याख्या करना कठिन है या "व्याख्या करने योग्य नहीं"।

रैखिक प्रतिगमन में, यह देखते हुए कि मान्यताओं के सेट को सत्यापित किया जाता है (त्रुटियों की सामान्यता, समरूपता, कोई बहु-संप्रभुता नहीं), टी-परीक्षण चर के महत्व का परीक्षण करने का एक तरीका प्रदान करते हैं, परीक्षण जो मेरे ज्ञान में उपलब्ध नहीं हैं। यादृच्छिक वन या ढाल बढ़ाने वाले मॉडल।

इसलिए, मेरा सवाल यह है कि अगर मैं एक स्वतंत्र चर का एक सेट के साथ एक आश्रित चर को मॉडल करना चाहता हूं, तो व्याख्या के लिए मुझे हमेशा रैखिक प्रतिगमन का उपयोग करना चाहिए?


6
आप अभी भी रैखिक पर विचार करते हैं पर निर्भर करता है। सामान्यीकृत लीनियर मॉडल और सामान्यीकृत एडिटिव मॉडल अभी भी एक रेखीय घटक के अनुमान के आधार पर काम करते हैं, लेकिन विभिन्न प्रकार के रिश्तों को मॉडल कर सकते हैं।
फ्रैंस रोडेनबर्ग

2
यह भी निर्भर करता है कि आपका मतलब क्या है। मशीन लर्निंग मॉडल के लिए 'ब्लैक बॉक्स में peering' के विभिन्न तरीके प्रस्तावित किए गए हैं, लेकिन आपके लक्ष्यों के लिए उपयुक्त हो सकते हैं या नहीं भी।
user20160

5
मैं यह नहीं देख पा रहा हूं कि व्याख्यात्मकता के साथ हीन सांख्यिकी और टी परीक्षणों का क्या संबंध है, जो आईएमओ मुख्य रूप से गुणांक अनुमानों के बारे में है।
स्टीफन कोलासे

3
@StephanKolassa "अंतःक्रियाशीलता" भी कार्य रूप से संबंधित हो सकती है । उदाहरण के लिए, प्रतिगमन मॉडल (चाहे रैखिक पुनर्मिलन, जीएलएम, या कुछ और) में एल्गोरिदमिक भिन्नात्मक बहुपद वक्र फिटिंग द्वारा निर्मित गुणांक अनुमान, अच्छी तरह से फिट होने के दौरान , लगभग निश्चित रूप से विरोधी सहज हैं: क्या आप उत्पादित आकृतियों के सरणी को ध्यान में रख सकते हैं? फॉर्म के मॉडल द्वारा , और इसलिए आपके गुणांक अनुमानों द्वारा निहित और बीच संबंध की व्याख्या करते हैं ? yमैं=β0+β1एक्समैं-3/5+β2एक्समैं1/3+β3एक्समैं3+εमैंyएक्स
एलेक्सिस

2
@UserX आप जो वर्णन करते हैं वह अभी भी रैखिक प्रतिगमन है (यानी मापदंडों में रैखिक है)। इसके विपरीत के साथ : पूर्व एक रेखीय प्रतिगमन मॉडल है, जबकि उत्तरार्द्ध को रेखीय प्रतिगमन का अनुमान नहीं लगाया जा सकता है। yमैं=β0+β1एक्समैं+β2एक्समैं2+εमैंyमैं=β0+β1एक्समैं+एक्समैंβ2+εमैं
एलेक्सिस

जवाबों:


29

मेरे लिए यह विश्वास करना कठिन है कि आपने लोगों को यह कहते हुए सुना, क्योंकि यह कहना एक मूर्खतापूर्ण बात होगी। यह कहने जैसा है कि आप केवल हथौड़ा का उपयोग करते हैं (ड्रिलिंग छेद सहित और लाइटबल्ब को बदलने के लिए), क्योंकि यह उपयोग करने के लिए सीधा है और अनुमानित परिणाम देता है।

दूसरा, रैखिक प्रतिगमन हमेशा "व्याख्या करने योग्य" नहीं होता है। यदि आपके पास कई बहुपद शर्तों के साथ रैखिक प्रतिगमन मॉडल है, या बस बहुत सी विशेषताएं हैं, तो इसकी व्याख्या करना कठिन होगा। उदाहरण के लिए, मान लें कि आपने सुविधाओं के रूप में MNIST features से प्रत्येक 784 पिक्सल के कच्चे मूल्यों का उपयोग किया है। क्या यह जानना कि पिक्सेल 237 का वजन -2311.67 के बराबर है, आपको मॉडल के बारे में कुछ भी बताएगा? छवि डेटा के लिए, संवेदी तंत्रिका नेटवर्क के सक्रियण मानचित्रों को समझना बहुत आसान होगा।

अंत में, ऐसे मॉडल हैं जो समान रूप से व्याख्या करने योग्य हैं, जैसे कि लॉजिस्टिक रिग्रेशन, निर्णय पेड़, भोले बेयस एल्गोरिथ्म, और कई और।

By - जैसा कि टिप्पणी में @Ingolifs द्वारा देखा गया है, और जैसा कि इस धागे में चर्चा की गई है , MNIST सबसे अच्छा उदाहरण नहीं हो सकता है, क्योंकि यह एक बहुत ही सरल डेटासेट है। यथार्थवादी छवि डेटासेट के अधिकांश के लिए, लॉजिस्टिक प्रतिगमन काम नहीं करेगा और वजन को देखते हुए कोई भी सीधा जवाब नहीं देगा। हालांकि, यदि आप लिंक किए गए धागे में वजन को करीब से देखते हैं, तो उनकी व्याख्या भी सीधी नहीं है, उदाहरण के लिए "5" या "9" की भविष्यवाणी के लिए वजन किसी भी स्पष्ट पैटर्न को नहीं दिखाता है (नीचे दी गई छवि देखें, दूसरे धागे से कॉपी की गई )।


2
यह उत्तर मुझे लगता है कि एक अच्छा काम दिखा रहा है कि एमएनआईएसटी पर स्पष्ट रूप से लॉजिस्टिक प्रतिगमन को कैसे समझाया जा सकता है।
इंगोलिफ्स

1
@Ingolifs सहमत हैं, लेकिन यह एक सक्रियण मानचित्र है, आप तंत्रिका नेटवर्क के लिए भी ऐसा कर सकते हैं।
टिम

इसके बावजूद कि इसे क्या कहा जाता है, यह इस बात की स्पष्ट व्याख्या देता है कि लॉजिस्टिक रिग्रेशन अपने निर्णयों का उपयोग इस तरह से करने के लिए है, जो आप वास्तव में तंत्रिका नेटवर्क के सक्रियण मानचित्रों के लिए नहीं करते हैं।
ingolifs

1
@Ingolifs MNIST शायद सबसे अच्छा उदाहरण नहीं है क्योंकि यह बहुत सरल है, लेकिन मुद्दा यह है कि आप तंत्रिका नेटवर्क के लिए एक ही विधि का उपयोग करेंगे।
टिम

11

डिसीजन ट्री एक और विकल्प होगा। या लारसो रिग्रेशन स्पार्स सिस्टम बनाने के लिए।

सांख्यिकीय अध्ययन पुस्तक के लिए एक परिचय से इस आंकड़े की जाँच करें । http://www.sr-sv.com/wp-content/uploads/2015/09/STAT01.pngयहाँ छवि विवरण दर्ज करें


"आईएसएल" पुस्तक क्या है?
16

1
@donlan amazon.com/… सुझाव उत्तर के लिए धन्यवाद संशोधित।
हायताओ डु

कोई दिक्कत नहीं है! इस धागे को पढ़ने के बाद इसे देखने जा रहा था
डैनलन

7

मैं टिम के और मैके के जवाबों से सहमत हो जाऊंगा - एमएल मॉडल जरूरी नहीं कि निर्विवाद हों। मैं आपको Descriptive mAchine Learning Explanations, DALEX R पैकेज से निर्देशित करूंगा , जो कि ML मॉडल को व्याख्यात्मक बनाने के लिए समर्पित है।


1
DALEX पैकेज वास्तव में बहुत दिलचस्प है, क्या आप जानते हैं कि पायथन के लिए कुछ समान मौजूद है?
विक्टर

@ विक्टर I को DALEX के पायथन संस्करण के बारे में पता नहीं है, लेकिन आप उदाहरण के लिए rpy2.readthedocs.io/en/version_2.8.x/introduction.html का उपयोग करके पायथन से R कॉल करने का प्रयास कर सकते हैं ।
बबैलप्रूफरीडर

6

नहीं, यह अनावश्यक रूप से प्रतिबंधक है। व्याख्यात्मक मॉडल की एक बड़ी रेंज है जिसमें न केवल (जैसे फ्रैंस रॉडेनबर्ग कहते हैं) रैखिक मॉडल, सामान्यीकृत रैखिक मॉडल और सामान्यीकृत योगात्मक मॉडल हैं, लेकिन प्रतिगमन के लिए उपयोग किए जाने वाले मशीन सीखने के तरीके भी हैं। मैं यादृच्छिक जंगलों, ग्रेडिएंट बूस्टेड मशीन, तंत्रिका नेटवर्क और बहुत कुछ शामिल करता हूं। सिर्फ इसलिए कि आपको मशीन लर्निंग मॉडल के गुणांक नहीं मिलते हैं, जो रैखिक रेजिमेंट के समान हैं, इसका मतलब यह नहीं है कि उनके कामकाज को समझा नहीं जा सकता है। यह सिर्फ थोड़ा अधिक काम करता है।

यह समझने के लिए कि क्यों, मैं इस प्रश्न को पढ़ने की सलाह दूंगा : एक यादृच्छिक जंगल से ज्ञान प्राप्त करना । यह दिखाता है कि आप किसी भी मशीन लर्निंग मॉडल को व्याख्यायित करने के लिए कैसे दृष्टिकोण कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.