लॉजिस्टिक रिग्रेशन के लिए हैट मैट्रिक्स से बाहर की जानकारी


12

यह मेरे लिए स्पष्ट है, और अच्छी तरह से कई साइटों पर समझाया गया है, कि क्या है कि मैट्रिक्स के विकर्ण पर मान रेखीय प्रतिगमन के लिए देते हैं।

लॉजिस्टिक रिग्रेशन मॉडल का हैट मैट्रिक्स मेरे लिए कम स्पष्ट है। क्या यह उस सूचना के समान है जिसे आप लीन मैट्रिक्स से रैखिक प्रतिगमन लागू करते हैं? यह सीवी (स्रोत 1) के एक अन्य विषय पर मुझे मिली हैट मैट्रिक्स की परिभाषा है:

H=VX(XVX)1XV

एक्स के साथ भविष्यवक्ता चर के वेक्टर और V । साथ एक विकर्ण मैट्रिक्स है ।(π(1π))

क्या यह दूसरे शब्दों में, यह भी सच है कि किसी अवलोकन के हैट मैट्रिक्स का विशेष मूल्य भी कोवरिएट स्थान में सहसंयोजकों की स्थिति को प्रस्तुत करता है, और उस अवलोकन के परिणाम मूल्य से कोई लेना-देना नहीं है?

यह पुस्तक "अग्रेजी के श्रेणीबद्ध डेटा विश्लेषण" में लिखी गई है:

अधिक से अधिक एक अवलोकन लीवर उम्र, फिट पर अपने संभावित प्रभाव अधिक है। साधारण प्रतिगमन के रूप में, उत्तोलन 0 और 1 के बीच आते हैं और मॉडल मापदंडों की संख्या के बराबर होते हैं। साधारण प्रतिगमन के विपरीत, टोपी के मान फिट के साथ-साथ मॉडल मैट्रिक्स पर भी निर्भर करते हैं, और जिन बिंदुओं में चरम पूर्वसूचक मान होते हैं, उन्हें अधिक लाभ उठाने की आवश्यकता नहीं होती है।

इस परिभाषा से, ऐसा लगता है कि हम इसका उपयोग नहीं कर सकते क्योंकि हम इसे साधारण रेखीय प्रतिगमन में उपयोग करते हैं?

स्रोत 1: आर में लॉजिस्टिक रिग्रेशन के लिए हैट मैट्रिक्स की गणना कैसे करें?

जवाबों:


13

मुझे संकेतन को थोड़ा बदलने दें और मैट्रिक्स को जहां सामान्य तत्वों साथ एक विकर्ण सममित मैट्रिक्स है । एक ही मान व्यक्तियों के समूहों के रूप में को निरूपित करें । आप हैट मैट्रिक्स के विकर्ण तत्व ( ) को तब की राशि रेखीय प्रतीपगमन में के रूप में मानकों की संख्या देता है। अब आपके प्रश्न के लिए: वीवीजे=मीटरजेπ(एक्सजे)[1-π(एक्सजे)]मीटरजेएक्स=एक्सजेजेटीजेएचजे=

H=V12X(XVX)1XV12
Vvj=mjπ(xj)[1π(xj)]mjx=xjjthhj
hj=mjπ(xj)[1π(xj)]xj(XVX)1xj
hj

हैट मैट्रिक्स में उत्तोलन मानों की व्याख्या अनुमानित प्रायिकता पर निर्भर करती है । यदि , तो आप लीवरेज रिग्रेशन मामले में लीवर वैल्यू की व्याख्या उसी तरह से कर सकते हैं, जैसे कि माध्य से दूर होने के कारण आपको उच्च मूल्य मिलते हैं। यदि आप प्रायिकता वितरण के चरम सिरों में हैं, तो ये लीवरेज मान समान अर्थों में दूरी नहीं माप सकते हैं। इसे होसमेर और लेमेशो (2000) से नीचे दिए गए चित्र में दिखाया गया है:0.1 < π < 0.9π0.1<π<0.9

यहाँ छवि विवरण दर्ज करें

इस मामले में कोवरिएट स्पेस में सबसे चरम मान आपको सबसे छोटा उत्तोलन दे सकते हैं, जो रैखिक क्रमिक मामले के विपरीत है। कारण यह है कि रैखिक प्रतिगमन में उत्तोलन एक मोनोटोनिक फ़ंक्शन है, जो गैर-रैखिक उपस्कर प्रतिगमन के लिए सही नहीं है। हैट मैट्रिक्स के विकर्ण तत्वों के उपरोक्त सूत्रीकरण में एक नीरस रूप से बढ़ता हुआ भाग होता है जो मध्यमान से दूरी का प्रतिनिधित्व करता है। वह हिस्सा है, जिसे आप देख सकते हैं कि क्या आप केवल प्रति से दूरी में रुचि रखते हैं। लॉजिस्टिक रिग्रेशन के लिए अधिकांश नैदानिक ​​आँकड़े पूर्ण लीवरेज का उपयोग करते हैं , इसलिए इस अलग मोनोटोनिक हिस्से को शायद ही कभी अकेले माना जाता है। एच जेxj(XVX)1xjhj

यदि आप इस विषय पर गहराई से पढ़ना चाहते हैं, तो प्रीगिबोन (1981) के पेपर पर एक नज़र डालें, जो लॉजिस्टिक हैट मैट्रिक्स और होस्मर और लेमेशो (2000) की पुस्तक से निकले हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.