इस प्रकार दिए गए दोनों उत्तर मुझे पसंद हैं। मुझे कुछ चीजें जोड़ने दें।
एक अन्य विकल्प यह है कि आप चर को भी जोड़ सकते हैं । यह दोनों को मानकीकृत (यानी, उन्हें z- स्कोर में बदलकर) किया जाता है, उन्हें औसत करता है, और फिर आपके मॉडल को केवल समग्र चर के साथ फिटिंग करता है। यह एक अच्छा तरीका होगा जब आपको लगता है कि वे एक ही अंतर्निहित निर्माण के दो अलग-अलग उपाय हैं। उस स्थिति में, आपके पास दो माप हैं जो त्रुटि से दूषित हैं। आपके द्वारा वास्तव में चर के लिए सबसे अधिक सही मूल्यदेखभाल उनके बीच में है, इस प्रकार उनका औसत अधिक सटीक अनुमान देता है। आप उन्हें पहले एक ही पैमाने पर रखने के लिए मानकीकृत करते हैं, ताकि नाममात्र के मुद्दे परिणाम को दूषित न करें (उदाहरण के लिए, आप कई तापमान मापों को औसत नहीं करना चाहेंगे यदि कुछ फ़ारेनहाइट हैं और कुछ सेल्सियस हैं)। बेशक, अगर वे पहले से ही एक ही पैमाने पर हैं (उदाहरण के लिए, कई बहु-प्रचारित जनमत सर्वेक्षण), तो आप उस कदम को छोड़ सकते हैं। यदि आपको लगता है कि आपका एक चर दूसरे की तुलना में अधिक सटीक हो सकता है, तो आप एक भारित औसत (शायद माप त्रुटियों के पारस्परिक का उपयोग करके) कर सकते हैं।
यदि आपके चर एक ही निर्माण के अलग-अलग उपाय हैं, और पर्याप्त रूप से अत्यधिक सहसंबद्ध हैं, तो आप वास्तव में बिना किसी जानकारी को खोए केवल एक फेंक सकते हैं। एक उदाहरण के रूप में, मैं वास्तव में एक बार एक स्थिति में था, जहां मैं त्रुटि विचरण और शक्ति को बढ़ावा देने में से कुछ को अवशोषित करने के लिए एक कोवरिएट का उपयोग करना चाहता था, लेकिन जहां मैंने उस सहसंयोजक के बारे में परवाह नहीं की - यह निश्चित रूप से जर्मन नहीं था। मेरे पास कई विकल्प उपलब्ध थे और वे सभी एक-दूसरे साथ सहसंबद्ध थे । मैंने मूल रूप से एक यादृच्छिक पर उठाया और आगे बढ़ा, और यह ठीक काम किया। मुझे संदेह है कि अगर मैंने कुछ अन्य रणनीति का उपयोग करके दूसरों को भी शामिल किया होता तो मैं स्वतंत्रता की दो अतिरिक्त डिग्री को जलाने की शक्ति खो देता । बेशक, मैं उन्हें जोड़ सकता था, लेकिन परेशान क्यों? r>.98हालांकि, यह इस तथ्य पर गंभीर रूप से निर्भर करता है कि आपके चर संबंधित हैं क्योंकि वे एक ही चीज के दो अलग-अलग संस्करण हैं; यदि कोई अलग कारण है कि वे सहसंबद्ध हैं, तो यह पूरी तरह से अनुचित हो सकता है।
जैसा कि इसका तात्पर्य है, मैं आपको सुझाव देता हूं कि आपके सहसंबद्ध चर के पीछे क्या निहित है। यही है, आपको इस सिद्धांत की आवश्यकता है कि किस रणनीति का उपयोग करने के लिए सबसे अच्छा काम करने के लिए वे बहुत सहसंबद्ध हैं। एक ही अव्यक्त चर के अलग-अलग उपायों के अलावा, कुछ अन्य संभावनाएं एक कारण श्रृंखला होती हैं (जैसे, ) और अधिक जटिल स्थितियां जिनमें आपके चर कई कारण बलों का परिणाम होते हैं, जिनमें से कुछ इस प्रकार हैं: दोनों के लिए समान। शायद सबसे चरम मामला एक दमन चर का है, जो @whuber नीचे अपनी टिप्पणी में वर्णित करता है। उदाहरण के लिए, मैक्रों का सुझाव मानता है कि आप मुख्य रूप से में रुचि रखते हैं और के अतिरिक्त योगदान के बारे में आश्चर्य करते हैंX1→X2→YXZ के योगदान के लिए जिम्मेदार होने के बाद । इस प्रकार, यह सोचकर कि आपके चर क्यों सहसंबद्ध हैं और आप जो जानना चाहते हैं, वह आपको यह तय करने में मदद करेगा कि कौन सा (यानी, या ) को और कौन सा माना जाए । कुंजी अपनी पसंद को सूचित करने के लिए सैद्धांतिक अंतर्दृष्टि का उपयोग करना है। Xx1x2XZ
मैं मानता हूं कि रिज प्रतिगमन यकीनन बेहतर है, क्योंकि यह आपको उन चरों का उपयोग करने की अनुमति देता है जो आप मूल रूप से इरादा रखते थे और उन पैदावार की संभावना रखते हैं जो उनके वास्तविक मूल्यों के बहुत करीब हैं (हालांकि वे पक्षपाती होंगे - अधिक जानकारी के लिए यहां या यहां देखें )। बहरहाल, मुझे लगता है कि दो संभावित डाउनसाइड भी हैं: यह अधिक जटिल है (अधिक सांख्यिकीय परिष्कार की आवश्यकता है), और परिणामस्वरूप मॉडल की व्याख्या करना अधिक कठिन है, मेरी राय में।
मैं इकट्ठा करता हूं कि शायद अंतिम दृष्टिकोण एक संरचनात्मक समीकरण मॉडल फिट होगा। ऐसा इसलिए है क्योंकि यह आपको उन संबंधों के सटीक सेट को तैयार करने की अनुमति देगा, जो आपको विश्वास करते हैं कि अव्यक्त चर सहित। हालांकि, मैं SEM को इसके बारे में कुछ भी कहने के लिए अच्छी तरह से नहीं जानता, संभावना का उल्लेख करने के अलावा। (मुझे यह भी संदेह है कि यह उस स्थिति में ओवरकिल होगा जो आप केवल दो कोवरिएट्स के साथ वर्णन करते हैं।)