क्या


233

मैं कॉस्मा शालिज़ी (विशेष रूप से, दूसरे व्याख्यान के खंड 2.1.1 ) द्वारा कुछ व्याख्यान नोट्स के माध्यम से स्किमिंग कर रहा था , और याद दिलाया गया था कि आप बहुत कम आर 2 प्राप्त कर सकते हैंR2 आपके पास पूरी तरह से रैखिक मॉडल होने पर भी आपको ।

Shapizase के उदाहरण को समझने के लिए: मान लीजिए कि आपके पास एक मॉडल Y=aX+ϵ , जहां a ज्ञात है। फिर Var[Y]=a2Var[x]+Var[ϵ] और समझाया विचरण की राशि है a2Var[X] , तो । यह 0 as वीएकआर[एक्स]0वीएकआर[एक्स]R2=a2Var[x]a2Var[X]+Var[ϵ]Var[X]0 और 1 के रूप में जाता हैVar[X]

इसके विपरीत, आप उच्च तब भी प्राप्त कर सकते हैं जब आपका मॉडल बिल्कुल गैर-रेखीय हो। (किसी के पास एक अच्छा उदाहरण है?)R2

तो जब एक उपयोगी सांख्यिकीय है, और इसे कब अनदेखा किया जाना चाहिए?R2


5
कृपया ध्यान दें किसी अन्य रूप में संबंधित टिप्पणी थ्रेड हाल प्रश्न
whuber

36
मेरे पास दिए गए उत्कृष्ट उत्तरों को जोड़ने के लिए सांख्यिकीय कुछ भी नहीं है (esp। एक by @whuber), लेकिन मुझे लगता है कि सही उत्तर "R- चुकता: उपयोगी और खतरनाक" है। बहुत ज्यादा किसी भी आंकड़े की तरह।
पीटर Flom

32
इस प्रश्न का उत्तर है: "हाँ"
फोमाइट

अभी तक एक और जवाब के लिए देखें आँकड़े ।stackexchange.com/a/265924/99274
कार्ल

उदाहरण स्क्रिप्ट से बहुत उपयोगी है जब तक आप हमें बता सकते हैं क्या नहीं है ε है? यदि ε एक निरंतर है, भी, तो अपने / उसके तर्क गलत है, तब से है वार ( एक एक्स + ) = एक 2 वार ( एक्स ) हालांकि, अगर ε गैर स्थिर है, साजिश कृपया Y के खिलाफ एक्स छोटे के लिए वार ( एक्स ) और मुझे बताओ कि यह रैखिक है ........Var(aX+ϵ)ϵϵVar(aX+b)=a2Var(X)ϵYXVar(X)
दान

जवाबों:


264

पहले प्रश्न को संबोधित करने के लिए , मॉडल पर विचार करें

Y=X+sin(X)+ε

शून्य और परिमित विचरण के with के साथ । की सीमा के रूप में एक्स बढ़ जाती है (के रूप में निश्चित या यादृच्छिक के बारे में सोचा), आर 2 1. करने के लिए फिर भी, हो जाता है की विचरण ε (1 या उससे कम के आसपास) छोटा है, डेटा "काफ़ी गैर रेखीय" हैं। भूखंडों में, वी एक आर ( ε ) = 1εXR2εvar(ε)=1

एक्स की शॉर्ट रेंज

X की व्यापक रेंज

संयोग से, छोटे प्राप्त करने का एक आसान तरीका संकीर्ण श्रेणियों में स्वतंत्र चर को टुकड़ा करना है। प्रत्येक श्रेणी के भीतर प्रतिगमन ( बिल्कुल एक ही मॉडल का उपयोग करते हुए ) कम R 2 होगा , तब भी जब सभी डेटा पर आधारित पूर्ण प्रतिगमन उच्च R 2 होगाR2R2R2 । इस स्थिति पर विचार करना एक सूचनात्मक अभ्यास है और दूसरे प्रश्न के लिए अच्छी तैयारी है।

दोनों निम्नलिखित भूखंड एक ही डेटा का उपयोग करते हैं। पूर्ण प्रतिगमन के लिए 0.86 है। आर 2 (-5/2 5/2 से चौड़ाई 1/2 का) स्लाइस के लिए कर रहे हैं .16, .18, .07, .14, .08, .17, .20, .12, .01, .00, बाएँ से दाएँ पढ़ना। यदि कुछ भी हो, तो कटा हुआ स्थिति में फिट बेहतर हो जाता है क्योंकि 10 अलग-अलग लाइनें उनकी संकीर्ण सीमाओं के भीतर डेटा के अधिक निकट हो सकती हैं। हालांकि आर 2 सभी स्लाइस के लिए अब तक पूर्ण नीचे हैं आर 2 , न तो रिश्ता है, की ताकत linearity , और न ही वास्तव में किसी भी (डेटा का पहलू की सीमा को छोड़कर एक्सR2R2R2R2X प्रतिगमन के लिए उपयोग किया जाता है) बदल गया है।

पूर्ण प्रतिगमन के साथ बिंदु बादल

10 रजिस्टरों के साथ कटा हुआ बिंदु बादल

(एक वस्तु हो सकता है कि यह टुकड़ा करने की क्रिया प्रक्रिया के वितरण में परिवर्तन । यही कारण है कि सच है, लेकिन यह फिर भी का सबसे आम उपयोग के साथ मेल खाती आर 2 अचल प्रभाव मॉडलिंग में और डिग्री का पता चलता है जो करने के लिए आर 2 के विचरण के बारे में बता रहा है यादृच्छिक-प्रभाव की स्थिति में एक्स । विशेष रूप से, जब एक्स अपनी प्राकृतिक सीमा के एक छोटे अंतराल के भीतर भिन्न होने के लिए विवश होता है, तो आर 2 आमतौर पर गिर जाएगा।)XR2R2XXR2

साथ मूल समस्या यह है कि यह बहुत सी चीजों पर निर्भर करता है (तब भी जब एक से अधिक प्रतिगमन में समायोजित किया जाता है), लेकिन सबसे विशेष रूप से स्वतंत्र चर और अवशिष्ट के विचरण पर। आम तौर पर यह हमें मॉडल के अनुक्रम की तुलना करने के लिए "रैखिकता" या "रिश्ते की ताकत" या यहां तक ​​कि "फिट की अच्छाई" के बारे में कुछ भी नहीं बताता है ।R2

अधिकांश समय आप से बेहतर आँकड़ा पा सकते हैं । मॉडल चयन के लिए आप एआईसी और बीआईसी को देख सकते हैं; एक मॉडल की पर्याप्तता को व्यक्त करने के लिए, अवशिष्ट के विचरण को देखें। R2

यह हमें आखिरकार दूसरे सवाल पर ले आता है । एक स्थिति जिसमें का कुछ उपयोग हो सकता है, जब स्वतंत्र चर मानक मूल्यों पर सेट होते हैं, अनिवार्य रूप से उनके विचरण के प्रभाव को नियंत्रित करते हैं। फिर 1 - आर 2 वास्तव में अवशिष्ट के विचरण के लिए एक छद्म है, उपयुक्त रूप से मानकीकृत।R21R2



क्या एआईसी और बीआईसी स्पष्ट रूप से अनुमानित मापदंडों की संख्या के लिए समायोजित नहीं करते हैं? यदि हां, तो R ^ 2 की तुलना और अनुचित तरीके से करना अनुचित लगता है। तो मैं पूछता हूं, क्या आपके आलोचक ने आर ^ 2 को समायोजित किया है? ऐसा लगता है कि अगर आपको 'स्लाइसिंग' के लिए दंडित किया गया था जो कि R ^ 2 को समायोजित कर सकता है तो आपको मॉडल के फिट होने की अच्छाई के बारे में बताने में सक्षम होगा।
रसलपियरस

7
@ डीआर क्रिटिक को समायोजित करने के लिए पूरी तरह से लागू होता है । केवल ऐसे मामले जहां R 2 और समायोजित R 2 के बीच बहुत अंतर है, जब आप डेटा की तुलना में मापदंडों का भार उपयोग कर रहे हैं । स्लाइसिंग उदाहरण में लगभग 1,000 डेटा पॉइंट थे और स्लाइसिंग में केवल 18 पैरामीटर जोड़े गए थे; R 2 में समायोजन दूसरे दशमलव स्थान को भी प्रभावित नहीं करेगा, संभवत: अंत खंडों में जहां केवल कुछ दर्जन डेटा बिंदु थे: और यह उन्हें कम करेगा, वास्तव में तर्क को मजबूत करेगा। R2R2R2R2
whuber

5
आपकी पहली टिप्पणी में प्रश्न का उत्तर आपके उद्देश्य पर निर्भर होना चाहिए और व्याख्या करने के कई तरीके हैं "एक रैखिक संबंध के लिए परीक्षण।" एक है, आप परीक्षण करना चाहते हैं कि क्या गुणांक नॉनजेरो है। एक और बात यह है कि आप जानना चाहते हैं कि क्या गैर-मौजूदगी का सबूत है। (स्वयं के द्वारा) या तो बहुत उपयोगी नहीं है, हालांकि हम जानते हैं कि बहुत अधिक डेटा वाले R 2 का अर्थ है कि उनका स्कैल्पल लगभग रेखीय दिखता है - जैसे मेरा दूसरा या @ मैक्रो का उदाहरण। प्रत्येक उद्देश्य के लिए एक उपयुक्त परीक्षण और उससे संबंधित पी-मूल्य है। R2R2
whuber

4
आपके दूसरे प्रश्न के लिए हमें आश्चर्य होगा कि "सर्वश्रेष्ठ" रैखिक फिट का क्या मतलब हो सकता है। एक उम्मीदवार किसी भी फिट होगा जो वर्गों के अवशिष्ट योग को कम करता है। आप इसके लिए को एक प्रॉक्सी के रूप में सुरक्षित रूप से उपयोग कर सकते हैं , लेकिन इसकी (समायोजित) रूट माध्य वर्ग त्रुटि की जांच क्यों नहीं करते? यह एक अधिक उपयोगी आँकड़ा है। R2
whuber

47

आपका उदाहरण केवल तब लागू होता है जब चर मॉडल में होना चाहिए । यह निश्चित रूप से लागू नहीं होता है जब कोई सामान्य वर्ग के अनुमानों का उपयोग करता है। इस देखने के लिए, ध्यान दें कि यदि हम अनुमान एक अपने उदाहरण में कम से कम वर्गों द्वारा, हम पाते हैं:X a

कहाँरों 2 एक्स =1

a^=1Ni=1NXiYi1Ni=1NXi2=1Ni=1NXiYisX2+X¯2
है (नमूना) का विचरणएक्सऔर ¯ एक्स =1sX2=1Ni=1N(XiX¯)2X(नमूना) का मध्यमान हैएक्सX¯=1Ni=1NXiX

a^2Var[X]=a^2sX2=(1Ni=1NXiYi)2sX2(sX2sX2+X¯2)2

अब दूसरा शब्द हमेशा से कम होता है ( सीमा में 1 के बराबर ) इसलिए हमें चर X से R 2 में योगदान के लिए एक ऊपरी सीमा मिलती है :11R2X

a^2Var[X](1Ni=1NXiYi)2sX2

और जब तक रूप में अच्छी तरह से, हम वास्तव में देखेंगेआर20के रूप मेंरों 2 एक्स(क्योंकि अंश शून्य करने के लिए जाता है, लेकिन भाजक में चला जाता हैवीएकआर[ε]>)। इसके अतिरिक्त, हमR2को0और1 केबीच किसी चीज़ में परिवर्तितकर सकते हैंजोइस बात पर निर्भर करता है कि दोनों शब्द कितनी जल्दी बदलते हैं। अब उपरोक्त शब्द आम तौर पर की तुलना में तेजी से विचलन करेगा(1Ni=1NXiYi)2R20sX2Var[ϵ]>0R201 यदि एक्स मॉडल में होना चाहिए, और धीमी है, तो एक्स मॉडल में नहीं होना चाहिए। दोनों ही स्थिति में R 2 सही दिशा में जाता है।sX2XXR2

और यह भी ध्यान दें कि किसी भी परिमित डेटा सेट (यानी एक वास्तविक) के लिए हमारे पास कभी भी नहीं हो सकता जब तक कि सभी त्रुटियां बिल्कुल शून्य न हों। यह मूल रूप से इंगित करता है कि R 2 एक सापेक्ष माप है, बजाय एक निरपेक्ष। जब तक आर 2 वास्तव में 1 के बराबर नहीं होता है , तब तक हम हमेशा एक बेहतर फिटिंग मॉडल पा सकते हैं। यह शायद आर 2 का "खतरनाक" पहलू है क्योंकि इसमें 0 और 1 के बीच स्केल किया गया है, ऐसा लगता है कि हम इसे एक पूर्ण अर्थ में इंटरप्ट कर सकते हैं।R2=1R2R21R201

यह देखने के लिए शायद अधिक उपयोगी है कि मॉडल में चर जोड़ते समय कितनी जल्दी गिरता है। और अंतिम, लेकिन कम से कम, इसे चर चयन में कभी भी नजरअंदाज नहीं किया जाना चाहिए, क्योंकि आर 2 प्रभावी रूप से चर चयन के लिए एक पर्याप्त सांख्यिकीय है - इसमें चर चयन की सभी जानकारी शामिल है जो डेटा में है। केवल एक चीज जो आवश्यक है वह है आर 2 में ड्रॉप का चयन करना जो "फिटिंग्स की त्रुटियों" से मेल खाती है - जो आमतौर पर नमूना आकार और चर की संख्या पर निर्भर करता है।R2R2R2


4
+1 अच्छे अंक। गणना पिछले उत्तरों में मात्रात्मक अंतर्दृष्टि जोड़ते हैं।
whuber

27

अगर मैं एक उदाहरण जोड़ सकता हूं कि कब खतरनाक है। कई साल पहले मैं कुछ बायोमेट्रिक डेटा पर काम कर रहा था और युवा और मूर्ख होने के नाते मुझे खुशी हुई जब मैंने अपने फैंसी रिग्रेशन के लिए कुछ सांख्यिकीय रूप से महत्वपूर्ण आर 2 मान पाया, जो मैंने स्टेप वाइज फंक्शंस का उपयोग करके बनाया था। यह केवल बाद में एक बड़े अंतरराष्ट्रीय दर्शकों के लिए वापस अपनी प्रस्तुति के बाद लग रहा था मुझे लगता है कि डेटा की विशाल विचरण दिया - जनसंख्या के संबंध में नमूने के संभव गरीब प्रतिनिधित्व, एक के साथ संयुक्त अनुसंधान 2 0.02 की भी पूरी तरह से व्यर्थ था अगर यह "सांख्यिकीय रूप से महत्वपूर्ण" था ...R2R2R2

आंकड़ों के साथ काम करने वालों को डेटा को समझने की जरूरत है!


15
कोई आँकड़ा खतरनाक नहीं है यदि आप समझते हैं कि इसका क्या मतलब है। सीन का उदाहरण आर स्क्वायर के साथ करने के लिए कुछ विशेष नहीं है यह सांख्यिकीय महत्व के साथ आसक्त होने की सामान्य समस्या है। जब हम अभ्यास में सांख्यिकीय परीक्षण करते हैं तो हम केवल सार्थक मतभेदों में रुचि रखते हैं। दो आबादी में समान वितरण कभी नहीं होता है। अगर वे बराबर हैं तो हमें कोई परवाह नहीं है। बहुत बड़े नमूना आकारों के साथ हम छोटे महत्वहीन अंतरों का पता लगा सकते हैं। यही कारण है कि मेरे चिकित्सा अनुसंधान परामर्श में मैं नैदानिक ​​और सांख्यिकीय महत्व के बीच अंतर पर जोर देता हूं।
माइकल चेरिक

11
प्रारंभ में मेरे ग्राहक अक्सर पतले होते हैं कि सांख्यिकीय महत्व अनुसंधान का लक्ष्य है। उन्हें यह दिखाने की जरूरत है कि ऐसा नहीं है।
माइकल चेरिक

0.02 पर एक सांख्यिकीय रूप से महत्वपूर्ण मतलब है कि आपके पास यह दावा करने के लिए पर्याप्त डेटा है कि आर 2 0. नहीं है। लेकिन यह करीब 0 है। इसलिए स्वतंत्र चर और आश्रित चर के बीच बहुत कम संबंध है। R2R2
माइकल चेर्निक

1
बिल्कुल सहमत हूँ माइकल। आंकड़ों का थोड़ा ज्ञान खतरनाक हो सकता है! :) कई साल पहले उस अंतर्दृष्टि के आधार पर, मैंने यह समझने के लिए कड़ी मेहनत की कि बहुत सारे अध्ययनों को बेहतर ढंग से समझने के लिए बहुत सारे अध्ययन करने से उस गलत गलती को दोहराना नहीं है। एक मास्टर्स डिग्री और आंकड़ों में पीएचडी और मुझे अभी भी लगता है कि मुझे अपनी पढ़ाई के लिए एक लंबा रास्ता तय करना है!
शॉन

धन्यवाद सीन। मैं आपकी टिप्पणियों और विनम्रता की सराहना करता हूं।
माइकल चेरिक

16

जब आपके पास एक एकल पूर्वसूचक है, तो वास्तव में वाई में भिन्नता के अनुपात के रूप में व्याख्या की जाती है जिसे एक्स के साथ रैखिक संबंध द्वारा समझाया जा सकता है । आर 2 के मूल्य को देखते समय इस व्याख्या को ध्यान में रखा जाना चाहिए ।R2YXR2

आप एक गैर-रैखिक संबंध से एक बड़ा तभी प्राप्त कर सकते हैं जब संबंध रैखिक के करीब हो। उदाहरण के लिए, मान लीजिए वाई = एक्स + ε जहां एक्स ~ यू एन मैंR2Y=eX+ε और ε ~ एन ( 0 , 1 ) । यदि आप की गणना करते हैंXUniform(2,3)εN(0,1)

R2=cor(X,eX+ε)2

आप इसे लगभग ऐसा (मैंने केवल अनुकरण द्वारा इसका अनुमान लगाया है ) इसके बावजूद कि संबंध स्पष्ट रूप से रैखिक नहीं है। कारण यह है कि एक्स अंतराल ( 2 , 3 ) पर एक रेखीय फ़ंक्शन की तरह एक भयानक बहुत कुछ दिखता है ।.914eX(2,3)


1
एरिक और मैक्रो द्वारा नीचे टिप्पणी करने के लिए मुझे नहीं लगता कि किसी के पास मेरे लिए है और यह तीन अलग-अलग लोगों के बजाय एक संयुक्त उत्तर के लिए बेहतर है, लेकिन यह इस बात के लिए क्यों मायने रखता है कि आपके आसपास कैसे चर्चा केंद्र जो कुछ कहा जाता है उस पर ध्यान केंद्रित करने के बजाय आप चीजों को लिखते हैं और जहां आप इसे लिखते हैं
माइकल चेरिक

8
@MichaelChernick, मुझे नहीं लगता कि कोई चीज़ कैसे लिखता है, इसके बारे में "इतनी" चर्चा है। जिन दिशानिर्देशों के साथ हमने आपकी सहायता करने की कोशिश की है, वे "यदि सभी ने ऐसा किया है, तो यह साइट बहुत ही अव्यवस्थित और पालन करने में कठिन" होगी। ऐसा लग सकता है कि इन चीजों के बारे में बहुत अधिक चर्चा है, लेकिन ऐसा सिर्फ इसलिए है क्योंकि आप इसमें शामिल होने के बाद से बहुत सक्रिय प्रतिभागी हैं, जो बहुत अच्छा है, क्योंकि आप स्पष्ट रूप से तालिका में बहुत कुछ लाते हैं। यदि आप इस बारे में अधिक बात करना चाहते हैं, तो मेरे असंबंधित उत्तर के तहत टिप्पणी पर चर्चा करने के बजाय मेटा पर एक धागा शुरू करने पर विचार करें :)
मैक्रों

यदि एक विधवा आपके उदाहरण में एक समान वितरण का समर्थन करती है, तो क्या हुआ?
Qbik

जैसा कि मैंने इस साइट पर अनुभव प्राप्त किया है, मुझे मैक्रों से सहमत होना होगा कि संक्षिप्त और समेकित होना महत्वपूर्ण है।
माइकल चेरिक

15

एक स्थिति जिसे आप से बचना चाहते हैं , वह है कई प्रतिगमन, जहाँ मॉडल में अप्रासंगिक भविष्यवाणियों को जोड़ने से कुछ मामलों में R 2 बढ़ सकता हैR2R2 । इसके स्थान पर समायोजित R2 मान का उपयोग करके इसे संबोधित किया जा सकता है

जहांnडेटा सैंपल की संख्या है, औरpनिरंतर अवधि की गणना न करने वाले रजिस्टरों की संख्या है।R¯2=1(1R2)n1np1np


21
ध्यान दें कि अप्रासंगिक चर जोड़ने के लिए आर 2 (न केवल "कुछ मामलों में") में वृद्धि की गारंटी है, जब तक कि उन चर मौजूदा चर के साथ पूरी तरह से मेल नहीं खाते हैं। R2
whuber

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.