मैं डेटा विश्लेषण और ग्राफिक्स आर के कई प्रतिगमन अध्याय का उपयोग कर पढ़ रहा था : एक उदाहरण-आधारित दृष्टिकोण और यह पता लगाने के लिए थोड़ा उलझन में था कि यह व्याख्यात्मक चर (स्कैटलपॉट का उपयोग करके) के बीच रैखिक रिश्तों की जाँच करने की सिफारिश करता है और यदि कोई मामला हो तो किसी भी टी, उन्हें बदलने ताकि वे करते हो जाते हैं और अधिक के बीच सीधा संबंध। इसके कुछ अंश इस प्रकार हैं:
6.3 कई प्रतिगमन मॉडल फिटिंग के लिए एक रणनीति
(...)
सभी व्याख्यात्मक चरों को शामिल करते हुए स्कैप्लेटोट मैट्रिक्स की जांच करें। (इस बिंदु पर आश्रित चर शामिल है, वैकल्पिक। ) एक दूसरे के खिलाफ व्याख्यात्मक चर के भूखंडों में गैर-रैखिकता के सबूत के लिए पहले देखें।
(...)
यह बिंदु एक मॉडल खोज रणनीति की पहचान करता है - ऐसे मॉडल की तलाश करता है जिसमें व्याख्यात्मक चर के बीच प्रतिगमन संबंध "सरल" रैखिक रूप का अनुसरण करते हैं । इस प्रकार, यदि कुछ जोड़ीदार भूखंड गैर-रैखिकता के प्रमाण दिखाते हैं, तो अधिक लगभग रैखिक संबंधों को देने के लिए परिवर्तन (रों) के उपयोग पर विचार करें । जबकि यह आवश्यक नहीं हो सकता है कि इस रणनीति का पालन करते हुए, प्रतिगमन संबंध को पर्याप्त रूप से मॉडल करने के लिए, यह एक अच्छी रणनीति है, नीचे दिए गए कारणों से, खोज शुरू करने में पालन करने के लिए।
(...)
यदि व्याख्यात्मक चर के बीच के संबंध लगभग रैखिक हैं, तो शायद रूपांतरण के बाद, विश्वास के साथ प्रतिक्रिया चर के खिलाफ पूर्वसूचक चर के भूखंडों की व्याख्या करना संभव है।
(...)
एक या एक से अधिक व्याख्यात्मक चर के परिवर्तनों को खोजना संभव नहीं हो सकता है जो यह सुनिश्चित करते हैं कि पैनलों में दिखाए गए (जोड़ीदार) रिश्ते रैखिक दिखाई देते हैं। यह किसी भी फिट प्रतिगमन समीकरण के लिए नैदानिक भूखंडों की व्याख्या और फिट समीकरण में गुणांक की व्याख्या के लिए दोनों समस्याएं पैदा कर सकता है। कुक और वीज़बर्ग (1999) देखें।
क्या मुझे सक्रिय रूप से पीछा करने के बजाय आश्रित चर (बहुसंस्कृति के जोखिम के कारण) के बीच रैखिक संबंधों के बारे में चिंतित नहीं होना चाहिए? लगभग रैखिक रूप से संबंधित चर होने के क्या फायदे हैं?
लेखक बाद में अध्याय में मल्टीकोलिनरिटी के मुद्दे को संबोधित करते हैं, लेकिन यह सिफारिशें मल्टीकोलिनरिटी से बचने के साथ मुश्किलों में लगती हैं।