प्रतिगमन गुणांक के सहसंयोजक की व्याख्या क्या है?


13

R में lm फ़ंक्शन रिग्रेशन गुणांक के अनुमानित सहसंयोजी को प्रिंट कर सकता है। यह जानकारी हमें क्या देती है? क्या अब हम मॉडल की बेहतर व्याख्या कर सकते हैं या उन मुद्दों का निदान कर सकते हैं जो मॉडल में मौजूद हो सकते हैं?


1
अन्य सभी सह-मंडलों के रूप में एक ही व्याख्या --- रैखिक सह-निर्माण? मुख्य उपयोग ब्याज की चयनित विरोधाभासों के विचरण की गणना करना है, उदाहरण के लिए विरोधाभासों का परीक्षण करना।
kjetil b halvorsen

जवाबों:


20

प्रतिगमन अनुमानों की मानक त्रुटियों को प्राप्त करने के लिए सहसंयोजक मैट्रिक्स का सबसे बुनियादी उपयोग है। यदि शोधकर्ता केवल व्यक्तिगत प्रतिगमन मापदंडों की मानक त्रुटियों में रुचि रखता है, तो वे व्यक्तिगत मानक त्रुटियों को प्राप्त करने के लिए विकर्ण के वर्गमूल को ले सकते हैं।

हालांकि, अक्सर कई बार आप प्रतिगमन मापदंडों के रैखिक संयोजन में दिलचस्पी ले सकते हैं। उदाहरण के लिए, यदि आपके पास किसी दिए गए समूह के लिए संकेतक चर है, तो आप समूह के माध्य में रुचि ले सकते हैं, जो होगा

β0+βgrp

फिर, उस समूह के अनुमानित माध्य के लिए मानक त्रुटि खोजने के लिए, आपके पास होगा

XSX ,

जहां आपके विरोधाभासों का एक सदिश है और सहसंयोजक मैट्रिक्स है। हमारे मामले में, हम केवल इसके अलावा covariate "जीआरपी" है, तब ( अवरोधन, के लिए समूह से संबंधित के लिए)।एस एक्स = ( 1 , 1 ) 1 1XSX=(1,1)11

इसके अलावा, सहसंयोजक मैट्रिक्स (या अधिक से अधिक, सहसंबंध मैट्रिक्स, जो विशिष्ट रूप से सहसंयोजक मैट्रिक्स से पहचाना जाता है, लेकिन इसके विपरीत नहीं) कुछ मॉडल निदान के लिए बहुत उपयोगी हो सकता है। यदि दो चर अत्यधिक सहसंबद्ध हैं, तो इसके बारे में सोचने का एक तरीका यह है कि मॉडल को यह पता लगाने में परेशानी हो रही है कि कौन सा चर एक प्रभाव के लिए जिम्मेदार है (क्योंकि वे इतने निकट से संबंधित हैं)। यह कई प्रकार के मामलों के लिए मददगार हो सकता है, जैसे कि एक पूर्वानुमान मॉडल में उपयोग करने के लिए कोवरिएट के सबसेट को चुनना; यदि दो चर अत्यधिक सहसंबद्ध हैं, तो आप केवल अपने पूर्वानुमान मॉडल में दो में से एक का उपयोग करना चाह सकते हैं।


विवरण के लिए आपका धन्यवाद। अपने अंतिम पैराग्राफ में आप उन मुद्दों का वर्णन कर रहे हैं जो तब उत्पन्न हो सकते हैं जब स्वतंत्र चर अत्यधिक संपीड़ित होते हैं। ऐसा लगता है जैसे कि यह सहप्रसरण / वास्तविक की सह-संबंध को देखने के लिए आसान होगा से रों रों। सूत्र में एक व्युत्क्रम होता है। β वी एक आर ( β ) = ( ε 2 ) ( एक्स ' एक्स ) - 1Xβ
Var(β^)=E(ε^2)(XX)1
एमएस

8

प्रतिगमन गुणांक के दो "प्रकार" हैं:

  1. "ट्रू" प्रतिगमन गुणांक (आमतौर पर निरूपित ) जो डेटा की अंतर्निहित डेटा-जनरेटिंग प्रक्रिया का वर्णन करता है। ये निश्चित संख्याएँ हैं, या "पैरामीटर।" एक उदाहरण प्रकाश की गति होगी , जो (हम मानते हैं) सुलभ ब्रह्मांड में हमेशा हर जगह एक ही है।सीβc
  2. अनुमानित प्रतिगमन गुणांक (आमतौर पर चिह्नित किए गए या ) जो डेटा के नमूनों से गणना किए जाते हैं। नमूने यादृच्छिक चर के संग्रह हैं, इसलिए अनुमानित प्रतिगमन गुणांक भी यादृच्छिक चर हैं। एक उदाहरण एक प्रयोग में प्राप्त लिए एक अनुमान होगा ।βbβ^c

अब सोचिए कि कोवरियन का मतलब क्या होता है। किसी भी दो यादृच्छिक चर और । अगरउच्च है, तो जब भी आप का एक बड़ा निरपेक्ष मान खींचते हैं तो आप उसी दिशा में का एक बड़ा निरपेक्ष मान खींचने की उम्मीद कर सकते हैं । ध्यान दें कि "उच्च" यहां और में भिन्नता की मात्रा के सापेक्ष है , जैसा कि टिप्पणियों में बताया गया है।वाई | सी वी ( एक्स , वाई ) | एक्स वाई एक्स वाईXY|Cov(X,Y)|XYXY

(अनुमानित) दो प्रतिगमन गुणांक की सहप्रसरण का सहप्रसरण है अनुमान , । यदि अनुमानित गुणांक और बीच1bb1b2b1b2b1b2

b1b1

Cov(b1,b2)

जैसा कि यह वास्तव में किस लिए उपयोग किया जाता है, क्लिफ एबी का जवाब एक अच्छा सारांश है।


bibjij

1
@whuber धन्यवाद, और मैंने वास्तव में एक बिंदु पर "सहसंबंध" लिखा था। जब मैं अपना फोन बंद करूँगा तो इसे साफ़ कर दूँगा
शैडोअल्कर

चूँकि मैं एडिट्स के लिए पहले से थोड़ी देर के लिए इसे इस थ्रेड में वापस नहीं बना सकता, +1!
whuber

मेरे वर्णन में वही गलती हुई!
क्लिफ एबी

@ अब मैं वास्तव में कोविरेस की अपनी समझ का अनुमान लगा रहा हूं। क्या मेरा मुद्दा सिर्फ इतना है कि मैंने इस तथ्य पर जोर नहीं दिया कि तराजू अलग हो सकता है, या मैं कुछ और याद कर रहा हूं? मैं आपके "बक्से" स्पष्टीकरण पर आया था और मैं नहीं देखता कि क्या हो सकता है
छायाकार
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.