पी के संदर्भ में लॉजिस्टिक रिग्रेशन में सापेक्ष वैरिएबल महत्व को कैसे निर्धारित किया जाए?


11

मान लीजिए कि एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग यह अनुमान लगाने के लिए किया जाता है कि ऑनलाइन एडवर्ट (भविष्यवक्ता: Ad1, Ad2, और Ad3) के सेट पर क्लिक करने के बाद ऑनलाइन शॉपर एक उत्पाद (परिणाम: खरीद) खरीदेगा या नहीं।

परिणाम एक द्विआधारी चर है: 1 (खरीदा) या 0 (purcahsed नहीं)। भविष्यवक्ता बाइनरी चर भी हैं: 1 (क्लिक किया गया) या 0 (क्लिक नहीं किया गया)। इसलिए सभी चर एक ही पैमाने पर हैं।

यदि Ad1, Ad2 और Ad3 के परिणामी गुणांक 0.1, 0.2 और 03 हैं, तो हम यह निष्कर्ष निकाल सकते हैं कि Ad3 Ad2 से अधिक महत्वपूर्ण है, और Ad1 Ad1 से अधिक महत्वपूर्ण है। इसके अलावा, चूंकि सभी चर समान पैमाने पर हैं, मानकीकृत और गैर-मानकीकृत गुणांक समान होने चाहिए, और हम आगे निष्कर्ष निकाल सकते हैं कि Ad2 लॉगिट (लॉग-ऑड्स) स्तर पर इसके प्रभाव के संदर्भ में Ad1 से दोगुना महत्वपूर्ण है।

लेकिन व्यवहार में हम इस बात की अधिक परवाह करते हैं कि पी (खरीद की संभावना) स्तर के संदर्भ में चर के सापेक्ष महत्व की तुलना और व्याख्या कैसे करें, न कि लॉगिट (लॉग-ऑड्स)।

इस प्रकार प्रश्न यह है कि क्या पी के संदर्भ में इन चर के सापेक्ष महत्व को निर्धारित करने के लिए कोई दृष्टिकोण है?


मुझे यह लेख उपयोगी लगा। यह अच्छी तरह से छह अलग-अलग तरीकों का वर्णन करता है जिनका उपयोग प्रत्येक विधि के साथ जुड़े प्रॉप्स और विपक्ष के साथ लॉजिस्टिक रिग्रेशन मॉडल से पूर्वसूचक महत्व को परिभाषित करने के लिए किया जा सकता है।
gchaks

जवाबों:


5

रैखिक मॉडल के लिए आप प्रत्येक मॉडल पैरामीटर के लिए टी-सांख्यिकी के निरपेक्ष मूल्य का उपयोग कर सकते हैं।

इसके अलावा, आप एक यादृच्छिक फॉरेस्ट की तरह कुछ का उपयोग कर सकते हैं और सुविधा आयात की बहुत अच्छी सूची प्राप्त कर सकते हैं।

यदि आप आर चेक आउट ( http://caret.r-forge.r-project.org/varimp.html ) का उपयोग कर रहे हैं, यदि आप अजगर चेक आउट का उपयोग कर रहे हैं ( http://scikit-learn.org/stable/auto_examples /ensemble/plot_forest_importances.html#example-ensemble-plot-forest-importances-py )

संपादित करें:

चूंकि लॉगिट के पास ऐसा करने का कोई सीधा तरीका नहीं है इसलिए आप प्रत्येक भविष्यवक्ता के लिए आरओसी वक्र का उपयोग कर सकते हैं।

वर्गीकरण के लिए, प्रत्येक पूर्वसूचक पर आरओसी वक्र विश्लेषण किया जाता है। दो कक्षा की समस्याओं के लिए, क्लास की भविष्यवाणी करने के लिए पूर्वसूचक डेटा पर कटऑफ की एक श्रृंखला लागू की जाती है। संवेदनशीलता और विशिष्टता प्रत्येक कटऑफ के लिए गणना की जाती है और आरओसी वक्र की गणना की जाती है। आरओसी वक्र के तहत क्षेत्र की गणना करने के लिए ट्रैपेज़ॉइडल नियम का उपयोग किया जाता है। इस क्षेत्र का उपयोग चर महत्व के माप के रूप में किया जाता है

R में यह कैसे काम करता है इसका एक उदाहरण है:

library(caret)
mydata <- data.frame(y = c(1,0,0,0,1,1),
                 x1 = c(1,1,0,1,0,0),
                 x2 = c(1,1,1,0,0,1),
                 x3 = c(1,0,1,1,0,0))

fit <- glm(y~x1+x2+x3,data=mydata,family=binomial())
summary(fit)

varImp(fit, scale = FALSE)

1
आपके जवाब का धन्यवाद! हाँ यह रैखिक मॉडल और यादृच्छिक वन के लिए आसान है, क्या आपके पास कोई विचार है कि यह लॉजिस्टिक रिग्रेशन मामले में कैसे करें? आपका बहुत बहुत धन्यवाद!
xyhzc

ऊपर संपादित देखें।
माइक 1886

ऐसा लगता है कि अनुपात-स्तर की तुलना के बारे में सवाल अभी भी जवाब नहीं दिया गया है। यहां तक ​​कि अगर हमें पता है कि AUC है, तो कहें, .6 का उपयोग केवल X1 और .9 का उपयोग करके केवल x2 के रूप में किया जाता है, हम शायद ही कह सकते हैं कि x2 का महत्व इसलिए 50% अधिक है। न ही, मुझे लगता है, कि यह (१ - १०% / ४०%) = .५% अधिक है। न ही हम केवल संवेदनशीलता या केवल विशिष्टता का उपयोग करके कुछ अनुरूप कर सकते हैं। मुझे वाल्ड सांख्यिकी की प्रयोज्यता के बारे में भी संदेह है। अधिकांश सहायक मानकीकृत गुणांक के स्पष्टीकरण हो सकते हैं (स्कॉट मेनार्ड की ऑनलाइन पुस्तक देखें)।
rolando2

धन्यवाद rolando2! इस प्रश्न के चर एक ही मैट्रिक्स में सभी उपाय हैं, इसलिए मानकीकृत और गैर-मानक गुणांक समान होना चाहिए। इसके अलावा, यद्यपि हम मानक गुणांक का उपयोग लॉगिट (लॉग-ऑड्स) स्तर पर चर की तुलना करने के लिए कर सकते हैं, हम P (इस मामले में ऑनलाइन दुकानदारों की खरीद की संभावना) पर चर की व्याख्या कैसे कर सकते हैं? आपका बहुत बहुत धन्यवाद!
xyhzc

1
मैं इसे सवाल का जवाब नहीं देखता।
HelloWorld

4

चूँकि आप विशेष रूप से प्रायिकता के पैमाने पर व्याख्या के लिए पूछ रहे थे: एक लॉजिस्टिक प्रतिगमन में, सफलता की अनुमानित संभावना दी गई है

π^(एक्स)=एक्सपी(β0+βएक्स)1+एक्सपी(β0+βएक्स)

β0βएक्स

एक्सपी(0.1)1+एक्सपी(0.1)=0.52

केवल 3 विज्ञापन पर क्लिक करने वाला व्यक्ति:

एक्सपी(0.3)1+एक्सपी(0.3)=0.57

हालाँकि, यदि व्यक्ति विज्ञापन 1 या विज्ञापन 3 पर क्लिक करता है, लेकिन विज्ञापन 2 (यदि यह एक प्लासुबाइल परिदृश्य है), तो संभावनाएं बन जाती हैं

एक्सपी(0.1+0.2)1+एक्सपी(0.1+0.2)=0.57

एक्सपी(0.3+0.2)1+एक्सपी(0.3+0.2)=0.62

इस मामले में संभावना में परिवर्तन दोनों 0.05 है, लेकिन आमतौर पर यह परिवर्तन विभिन्न स्तरों के संयोजन के लिए समान नहीं है। (आप इसे आसानी से देख सकते हैं यदि आप ऊपर के रूप में एक ही दृष्टिकोण का उपयोग करते हैं लेकिन गुणांक 0.1, 1.5, 0.3 के साथ।) इस प्रकार, संभावना पैमाने पर एक चर का महत्व अन्य चर के मनाया स्तरों पर निर्भर है। यह संभावना पैमाने पर एक पूर्ण, मात्रात्मक चर महत्व के उपाय के साथ आने के लिए कठिन (असंभव) बना सकता है।


आपके व्याख्या के लिये धन्यवाद! फिर क्या आपको पता है कि भविष्यवक्ताओं के सापेक्ष महत्व को निर्धारित करने के लिए कोई अप्रत्यक्ष तरीका है? mike1886 ने अपने उत्तर में "ROC वक्र विश्लेषण" का उल्लेख किया है, लेकिन कुछ मुद्दे हैं जैसा कि rolando2 द्वारा उल्लेख किया गया है। आपका बहुत बहुत धन्यवाद!
१२:
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.