नोट linearity धारणा आप केवल की बात कर रहे का कहना है कि की सशर्त मतलब दिया रैखिक कार्य हैX iYiXi । आप इस धारणा का परीक्षण करने के लिए के मान का उपयोग नहीं कर सकते ।R2
इसका कारण यह है कि केवल देखे गए और पूर्वानुमानित मानों के बीच वर्गीय सहसंबंध है और सहसंबंध गुणांक का विशिष्ट रूप से और (रैखिक या अन्यथा) के बीच संबंध निर्धारित नहीं किया जाता है और निम्नलिखित दोनों परिदृश्य संभव हैं: एक्स वाईR2XY
मैं प्रत्येक पर बारी-बारी से चर्चा करूंगा:
(1) हाई लेकिन एक महत्वपूर्ण तरीके से रैखिकता धारणा अभी भी गलत है:R2 यहां ट्रिक इस तथ्य को हेरफेर करने के लिए है कि सहसंबंध आउटलेर के प्रति बहुत संवेदनशील है । मान लीजिए कि आपके पास भविष्यवाणियां हैं जो कि एक मिश्रण वितरण से उत्पन्न होता है जो कि मानक सामान्य है और एक बिंदु द्रव्यमान अन्य और एक प्रतिक्रिया चर है जो कि है एक्स 1 ,। । । , एक्स एन 99%एम1%X1,...,Xn99%M1%
Yi={ZiMif Xi≠Mif Xi=M
जहाँ और एक सकारात्मक स्थिरांक है जो , जैसे कि । फिर और लगभग पूरी तरह से सहसंबद्ध होंगे:Zi∼N(μ,1)Mμμ=0,M=105XiYi
u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1
तथ्य यह है कि के उम्मीद मूल्य के बावजूद दिया रैखिक नहीं है - वास्तव में यह एक असंतत कदम समारोह और की उम्मीद मूल्य है करता है भी पर निर्भर नहीं जब छोड़कर ।YiXiYiXiXi=M
(2) निम्न लेकिन रैखिकता धारणा अभी भी संतुष्ट है:R2 यहाँ चाल रैखिक बड़े आकार के चारों ओर "शोर" की मात्रा बनाने के लिए है। मान लीजिए कि आपके पास एक भविष्यवक्ता और प्रतिक्रिया और मॉडल हैXiYi
Yi=β0+β1Xi+εi
सही मॉडल था। इसलिए, की सशर्त मतलब दिया रैखिक कार्य है तो linearity धारणा संतुष्ट हो जाता है,। यदि सापेक्ष बड़ा है तो छोटा होगा। उदाहरण के लिए,एक्स मैं एक्स मैं वी एक आर ( ε मैं ) = σ 2 β 1 आर 2YiXiXivar(εi)=σ2β1R2
x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698
इसलिए, रैखिकता धारणा का आकलन यह देखने का विषय नहीं है कि कुछ सहन करने योग्य सीमा के भीतर हैR2 , लेकिन यह भविष्यवाणियों / पूर्वानुमानित मूल्यों और प्रतिक्रिया के बीच तितर बितर भूखंडों की जांच करने और एक (शायद व्यक्तिपरक) निर्णय लेने का मामला है।
पुन: क्या करें जब रैखिकता धारणा को पूरा नहीं किया जाता है और IVs को बदलने से भी मदद नहीं मिलती है? !!
जब गैर-रैखिकता एक मुद्दा है, तो यह प्रत्येक भविष्यवक्ता बनाम अवशेषों के भूखंडों को देखने के लिए सहायक हो सकता है - यदि कोई ध्यान देने योग्य पैटर्न है, तो यह उस भविष्यवक्ता में गैर-रैखिकता का संकेत दे सकता है। उदाहरण के लिए, यदि यह भूखंड अवशेषों और भविष्यवक्ता के बीच "कटोरे के आकार का" संबंध को प्रकट करता है, तो यह उस भविष्यवक्ता में एक लापता द्विघात शब्द को इंगित कर सकता है। अन्य पैटर्न एक अलग कार्यात्मक रूप का संकेत दे सकते हैं। कुछ मामलों में, यह हो सकता है कि आपने सही परिवर्तन करने की कोशिश नहीं की है या यह सच है कि मॉडल चर के किसी भी रूपांतरित संस्करण में रैखिक नहीं है (हालांकि यह एक उचित अनुमान लगाने के लिए संभव हो सकता है)।
अपने उदाहरण के बारे में: दो अलग-अलग आश्रित चर के लिए अनुमानित बनाम वास्तविक भूखंडों (मूल पोस्ट में 1 और 3 भूखंड) के आधार पर, यह मुझे लगता है कि दोनों मामलों के लिए रैखिकता धारणा स्थिर है। पहले कथानक में, ऐसा लगता है कि कुछ विषमलैंगिकता हो सकती है, लेकिन दोनों के बीच संबंध बहुत रैखिक दिखता है। दूसरे प्लॉट में, संबंध रैखिक दिखता है, लेकिन रिश्ते की ताकत कमजोर होती है, जैसा कि रेखा के चारों ओर बड़े बिखराव से संकेत मिलता है (यानी बड़ी त्रुटि भिन्नता) - यही कारण है कि आप कम देख रहे हैं ।R2