एक प्रतिगमन में आर-स्क्वेर्ड और पी-मूल्य के बीच क्या संबंध है?


17

tl; dr - OLS प्रतिगमन के लिए, एक उच्च R- वर्ग भी उच्च P- मान को दर्शाता है? विशेष रूप से एक एकल व्याख्यात्मक चर (Y = a + bX + e) ​​के लिए, लेकिन n को कई व्याख्यात्मक चर (Y = a + b1X + ... bnX + e) ​​के लिए जानने में रुचि होगी।

संदर्भ - मैं चर की एक सीमा पर ओएलएस प्रतिगमन का प्रदर्शन कर रहा हूं और प्रत्येक व्याख्यात्मक (स्वतंत्र) चर के परिवर्तनों, रैखिक, लघुगणक, आदि के बीच आर-वर्ग मूल्यों वाले तालिका का निर्माण करके सर्वश्रेष्ठ व्याख्यात्मक कार्यात्मक रूप विकसित करने की कोशिश कर रहा हूं। और प्रतिक्रिया (निर्भर) चर। यह थोड़ा सा दिखता है:

परिवर्तनीय नाम - वेलिनियर फॉर्म-- - एलएन (वेरिएबल) - एफएक्सएक्स (वेरिएबल) - ... आदि

चर 1 ------- आर-स्क्वॉयर ---- आर-स्क्वेरेड ---- आर-स्क्वेरड -
... आदि ...

मैं सोच रहा था कि क्या आर-वर्ग उचित है या यदि पी-मान बेहतर होगा। संभवत: कुछ संबंध हैं, क्योंकि अधिक महत्वपूर्ण संबंध उच्च व्याख्यात्मक शक्ति होगा, लेकिन यकीन नहीं होता कि यह एक कठोर तरीके से सच है।


जवाबों:


15

उत्तर नहीं है, और समग्र प्रतिगमन पी-मूल्य के बीच ऐसा कोई नियमित संबंध नहीं है , क्योंकि स्वतंत्र चर के विचरण पर निर्भर करता है जितना कि यह अवशिष्ट के विचरण पर होता है (जिस पर यह करने के लिए) विपरीत रूप से आनुपातिक है), और आप मनमाने मात्रा में स्वतंत्र चर के परिवर्तन को बदलने के लिए स्वतंत्र हैं।आर 2R2R2

उदाहरण के रूप में, मामलों को अनुक्रमित करने के साथ बहुभिन्नरूपी डेटा किसी भी सेट पर विचार करता और मान कि पहले स्वतंत्र चर के मूल्यों का सेट , , के पास एक अद्वितीय अधिकतम एक सकारात्मक राशि द्वारा दूसरे-उच्चतम मूल्य से अलग है । पहले वैरिएबल के एक गैर-रैखिक परिवर्तन को लागू करें जो सभी मानों को से कम सीमा भेजता है और स्वयं कुछ बड़े मूल्य भेजता है । ऐसे किसीमैं { x मैं 1 } एक्स * ε एक्स * - ε / 2 [ 0 , 1 ] एक्स * एम » 1 एम एक्स एक ( ( x - x 0 ) λ - 1 ) /((xi1,xi2,,xip,yi))i{xi1}xϵxϵ/2[0,1]xM1Mउदाहरण के लिए, यह एक उपयुक्त (स्केल) बॉक्स-कॉक्स परिवर्तन द्वारा किया जा सकता है , इसलिए हम किसी भी चीज़ के बारे में बात नहीं कर रहे हैं अजीब या "पैथोलॉजिकल।" फिर, जैसा कि बड़े पैमाने पर बढ़ता है, करीब से रूप में आप कृपया, चाहे कितना भी बुरा हो, फिट है, क्योंकि अवशिष्टों के विचरण को बाध्य किया जाएगा, जबकि पहले स्वतंत्र चर का विचलन समानुपातिक है। ।एम आर 2 1 एम 2xa((xx0)λ1)/(λ1))MR21M2


इसके बजाय आपको अपने अन्वेषण में एक उपयुक्त मॉडल का चयन करने के लिए फिट परीक्षणों (अन्य तकनीकों के बीच) की अच्छाई का उपयोग करना चाहिए: आपको फिट की रैखिकता और अवशिष्टों की समरूपता के बारे में चिंतित होना चाहिए । और विश्वास पर परिणामी प्रतिगमन से कोई भी पी-मान न लें: इस अभ्यास से गुजरने के बाद वे लगभग व्यर्थ हो जाएंगे, क्योंकि उनकी व्याख्या स्वतंत्र चर को व्यक्त करने का विकल्प मानती है आश्रित चर बिल्कुल, जो यहाँ बहुत ज्यादा नहीं है।


10

यह उत्तर सीधे केंद्रीय प्रश्न से निपटता नहीं है; यह कुछ अतिरिक्त जानकारी से अधिक कुछ नहीं है जो एक टिप्पणी के लिए बहुत लंबा है।

मैं इस का कहना है क्योंकि econometricstatsquestion कोई संदेह नहीं है कुछ बिंदु पर इस जानकारी है, या यह की तरह कुछ का सामना करेंगे (करते हुए कहा कि और कर रहे हैं से संबंधित) और आश्चर्य अगर यहां अन्य उत्तर में दी गई जानकारी गलत है - यह गलत नहीं है - लेकिन मैं लगता है कि यह क्या हो रहा है के बारे में स्पष्ट होने के लिए भुगतान करता है।आर 2FR2

परिस्थितियों के एक विशेष सेट के तहत एक रिश्ता है; यदि आप प्रेक्षणों की संख्या और किसी दिए गए मॉडल के लिए तय किए गए भविष्यवाणियों की संख्या को पकड़ते हैं, तो वास्तव में में मोनोटोनिक है , क्योंकिआर 2FR2

F=R2/(k1)(1R2)/(Nk)

(यदि आप अंश और भाजक को विभाजित करते हैं , और स्थिरांक को बाहर खींचते हैं, तो आप देख सकते हैं कि यदि आप और स्थिरांक रखते हैं तो ) कश्मीर 1 / एफ α 1 / आर 2 - 1 एन कश्मीरR2k1/F1/R21Nk

चूँकि फिक्स्ड df और p- मान एक-दूसरे से संबंधित हैं, और -value भी एक-दूसरे से संबंधित हैं।आर 2 पीFR2p

लेकिन मॉडल के बारे में लगभग कुछ भी बदल दें, और यह रिश्ता बदली हुई परिस्थितियों में नहीं रहता है।

उदाहरण के लिए, एक बिंदु बनाने से बड़ा होता है और एक को हटाने से यह छोटा हो जाता है, लेकिन ऐसा करने से वृद्धि या कमी हो सकती है , इसलिए ऐसा लगता है कि और आवश्यक रूप से एक साथ नहीं चलते हैं यदि आप डेटा जोड़ते हैं या हटाते हैं। एक चर जोड़ना घट जाता है लेकिन (और इसके विपरीत) को बढ़ाता है , इसलिए जब आप ऐसा करते हैं तो आवश्यक रूप से से संबंधित नहीं होता है।(Nk)/(k1)R2FR2 (Nk)/(k1)R2R2F

जाहिर है, एक बार आप तुलना और -values भर में विभिन्न विशेषताओं के साथ मॉडल, इस संबंध जरूरी नहीं रखता है के रूप में whuber nonlinear परिवर्तनों के मामले में साबित कर दिया।R2p


मैं आपसे असहमत नहीं हूं, लेकिन ऐसा लग रहा है कि आप एक अलग सवाल का जवाब दे रहे हैं। यह कुछ पढ़ने में लगा, लेकिन मैंने निष्कर्ष निकाला कि प्रश्न क्या संबंध के बारे में पूछता है, यदि कोई हो, और बीच रखता है जब (कैटरेटिस पैरीबस) स्वतंत्र चर नॉनलाइनली रूपांतरित होते हैं। यह केवल तभी होता है जब उन चरों को अपरिवर्तित छोड़ दिया जाता है - या, अधिकतम, रैखिक रूप से आपस में रूपांतरित - कि हम ऐसे रिश्ते के बारे में बिल्कुल भी कुछ भी कह सकते हैं। यह उस अर्थ का हिस्सा है जिसमें मुझे लगता है कि "किसी दिए गए मॉडल के लिए आपका क्वालीफायर" समझना होगा। आर 2pR2
whuber

मैं एक अलग सवाल का जवाब दे रहा हूं; और मेरा मानना ​​है कि अर्थ की आपकी व्याख्या सही है। मैं और अधिक चिंतित था कि इस तरह के एक मुद्दे के रूप में मैं उठाया एक भ्रम की स्थिति पैदा करेगा अगर नहीं समझाया। मेरी समझ में आपके सभी बिंदु हैं। (अब मैं वास्तव में चिंतित हूं, कि शायद मेरा जवाब स्पष्ट करने के लिए नहीं है, जैसा कि मुझे उम्मीद थी, लेकिन केवल इस मुद्दे को भ्रमित करता है। क्या आपको लगता है कि एक उपयुक्त संशोधन है जो इसे मदद करेगा? क्या मुझे इसे हटाना चाहिए?)
Glen_b -Reinstate Monica

मुझे हटाए गए, ग्लेन को देखने से नफरत होगी। यदि आप परिवर्तन करने का इरादा रखते हैं, तो स्पष्ट रूप से इंगित करने पर विचार करें कि आप इस मुद्दे के किन पहलुओं के बारे में लिख रहे हैं ( जैसे , "दिए गए मॉडल" से आपका क्या मतलब है और "विभिन्न विशेषताओं" वाले मॉडल के बारे में आपके मन में क्या है)। यह स्पिरिट (सहयोगी, आलोचनात्मक नहीं) थी जिसमें मैंने अपनी टिप्पणी पेश की।
whuber

मैंने आपकी आलोचना नहीं की - आप स्पष्ट करने वाले थे और इससे अधिक कुछ भी नहीं था - लेकिन इसकी आवश्यकता उस उत्तर में अपर्याप्तता को रेखांकित करती है, जिसके बारे में मैंने टिप्पणी करने से पहले आपको चिंतित किया था। 'अलग-अलग विशेषताओं' की अस्पष्टता इसलिए है क्योंकि यह एक बहुत ही सामान्य बात है - किसी भी चीज की भिन्नता होती है (मैं किसी चीज को उदाहरण के रूप में सरल करता हूं कि एक बिंदु को हटाकर या किसी परिवर्तन को समझने के लिए एक चर जोड़कर) कि एकरस संबंध बना सकते हैं लुप्त हो। मैं सोचूंगा कि मैं और क्या कह सकता हूं।
Glen_b -Reinstate मोनिका

संपादन के लिए +1: ये बहुमूल्य टिप्पणियां हैं और के फॉर्मूले को देखने के लिए यह विशेष रूप से उपयोगी है । F
whuber

3

"ओएलएस प्रतिगमन के लिए, एक उच्च आर-वर्ग भी एक उच्च पी-मूल्य का मतलब है? विशेष रूप से एक एकल व्याख्यात्मक चर (Y = a + bX + e) ​​के लिए"

विशेष रूप से एकल व्याख्यात्मक चर के लिए, नमूना आकार को देखते हुए , इसका उत्तर हां है। जैसा कि ग्लेन_ बी ने समझाया है, और टेस्ट स्टेटिस्टिक के बीच सीधा संबंध है (यह एफ या टी हो )। उदाहरण के लिए, जैसा कि इस अन्य प्रश्न में समझाया गया है ( उच्च आर 2 वर्ग और सरल रैखिक प्रतिगमन के लिए उच्च p -value ) एक कोवरिएट (और एक स्थिर) के साथ सरल रैखिक प्रतिगमन के लिए, टी और आर 2 के बीच संबंध है:R2FtR2ptR2

|t|=R2(1R2)(n2)

तो इस मामले में, एक बार जब आप ठीक करते हैं , तो R 2 जितना उच्च होता है, उतना ही टी स्टेटिस्टिक और पी-वैल्यू कम होता है।nR2t

"लेकिन n को कई व्याख्यात्मक चर (Y = a + b1X + ... bnX + +) के लिए जानने में रुचि होगी।"

इसका उत्तर समान है, लेकिन केवल एक चर को देखने के बजाय, हम अब सभी चर को एक साथ देखते हैं - इसलिए स्टेटिस्टिक, जैसा कि ग्लेन_ब ने दिखाया है। और यहां आपको एन और पैरामीटर दोनों की संख्या को ठीक करना होगा। या, इसे बेहतर करने के लिए, स्वतंत्रता की डिग्री को ठीक करें।Fn

संदर्भ - मैं चर की एक सीमा पर ओएलएस प्रतिगमन कर रहा हूं और सबसे अच्छा व्याख्यात्मक कार्यात्मक रूप विकसित करने की कोशिश कर रहा हूं (...)

R2

R2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.