कई आश्रित चर के साथ प्रतिगमन?


61

क्या दो या अधिक आश्रित चर के साथ एक (एकाधिक) प्रतिगमन समीकरण होना संभव है? ज़रूर, आप दो अलग-अलग प्रतिगमन समीकरणों को चला सकते हैं, प्रत्येक के लिए एक DV, लेकिन ऐसा नहीं लगता है कि यह दो डीवी के बीच किसी भी रिश्ते को पकड़ लेगा?


जैसा कि सुर या 3 एसएलएस में है?
समुद्र में एक बूढ़ा आदमी।

जवाबों:


35

हाँ यह संभव है। जिसे आप रुचि रखते हैं उसे "मल्टीवेरिएट मल्टीपल रिग्रेशन" या सिर्फ "मल्टीवेरिएट रिग्रेशन" कहा जाता है। मुझे नहीं पता कि आप किस सॉफ्टवेयर का उपयोग कर रहे हैं, लेकिन आप आर में ऐसा कर सकते हैं।

यहां एक लिंक है जो उदाहरण प्रदान करता है।

http://www.public.iastate.edu/~maitra/stat501/lectures/MultivariateRegression.pdf


2
कोई जोड़ सकता है कि रजिस्ट्रियों को अलग करने वाली फिटिंग वास्तव में बहुभिन्नरूपी संरचना के बराबर होती है, जो कि आश्रित चर के मैट्रिक्स के साथ होती है। आर पैकेज में mvtnorm स्थापित के साथ (1: बहुभिन्नरूपी मॉडल, दूसरा: अलग-अलग अविभाज्य मॉडल): पुस्तकालय (mvtnorm); एक्स <- rmvnorm (100, c (1, 2), मैट्रिक्स (c (4, 2, 3, 3), ncol = 2)); Y <- X% *% मैट्रिक्स (1: 4, ncol = 2) + rmvnorm (100, c (0, 0), diag (c (20, 30))); एलएम (वाई ~ एक्स [, 1] + एक्स [, २]); एलएम (वाई [, 1] ~ एक्स [, 1] + एक्स [, 2]); lm (Y [, 2] ~ X [, 1] + X [, 2])
caracal

3
यदि यह समतुल्य है, तो उद्देश्य क्या है?
जोशुआ रोसेनबर्ग

1
@JoshuaRosenberg एकल निर्भर चर के साथ अलग-अलग रजिस्टरों पर बहुभिन्नरूपी प्रतिगमन चलाने का एक कारण विभिन्न परिणाम चर में गुणांक के परीक्षण करने की क्षमता है। उदाहरण के लिए, आप यह देखने के लिए एफ-टेस्ट कर सकते हैं कि क्या एक प्रेडिक्टर का एक परिणाम चर पर उतना ही प्रभाव पड़ता है जितना कि दूसरे परिणाम चर पर।
एलेक्सके

10

@ ब्रेट की प्रतिक्रिया ठीक है।

यदि आप अपनी दो-ब्लॉक संरचना का वर्णन करने में रुचि रखते हैं, तो आप PLS प्रतिगमन का भी उपयोग कर सकते हैं । मूल रूप से, यह एक प्रतिगमन ढांचा है जो प्रत्येक ब्लॉक से संबंधित चर के क्रमिक (ऑर्थोगोनल) रैखिक संयोजनों के निर्माण के विचार पर निर्भर करता है जैसे कि उनका सहसंयोजक अधिकतम है। यहां हम मानते हैं कि एक ब्लॉक में व्याख्यात्मक चर शामिल हैं, और दूसरा ब्लॉक प्रतिक्रिया चर, जैसा कि नीचे दिखाया गया है:वाईXY

वैकल्पिक शब्द

हम "अव्यक्त चर" की तलाश करते हैं, जो न्यूनतम त्रुटि के साथ ब्लॉक की भविष्यवाणी करने की अनुमति देते समय ब्लॉक में शामिल अधिकतम जानकारी (एक रैखिक फैशन में) के लिए खाता है । औरवाई यू जे वी जेXYujvj लोडिंग (यानी, रैखिक संयोजन) प्रत्येक आयाम से जुड़े रहे हैं। अनुकूलन मानदंड पढ़ता है

maxuh∣=1,vh∣=1cov(Xh1uh,Yvh)(maxcov(ξh,ωh))

जहां बाद (यानी, अवशिष्ट) ब्लॉक के लिए खड़ा है । एक्स एच वेंXh1Xhth

पहले आयाम ( और ) पर फैक्टोरियल स्कोर के बीच संबंध - लिंक के परिमाण को दर्शाता है ।ω 1 एक्स वाईξ1ω1XY


मुझे लगता है कि एक मल्टीपल-मल्टीवाईएल PLS अनिवार्य रूप से एक मल्टीपल "मल्टीपल-सिंगल-पीएलएस" करता है। इसलिए वाई चर के बीच संबंधों को संबोधित नहीं किया जाता है।
लैंसलीबाई

4

मल्टीवेरेट रिग्रेशन एसएलएसएस में जीएलएम-मल्टीवेरिएट विकल्प का उपयोग करके किया जाता है।

अपने सभी परिणामों (DVs) को परिणाम बॉक्स में रखें, लेकिन आपके सभी निरंतर भविष्यवाणियों को कोवरिएट बॉक्स में। आप कारकों बॉक्स में कुछ भी जरूरत नहीं है। बहुभिन्नरूपी परीक्षणों को देखें। एकतरफा परीक्षण अलग-अलग कई रजिस्ट्रियों के समान होंगे।

जैसा कि किसी और ने कहा, आप इसे एक संरचनात्मक समीकरण मॉडल के रूप में भी निर्दिष्ट कर सकते हैं, लेकिन परीक्षण समान हैं।

(दिलचस्प है, ठीक है, मुझे लगता है कि यह दिलचस्प है, इस पर यूके-यूएस का थोड़ा अंतर है। ब्रिटेन में, बहु प्रतिगमन को आमतौर पर एक बहुभिन्नरूपी तकनीक नहीं माना जाता है, इसलिए जब आप कई परिणाम / DVs. करते हैं तो बहुभिन्नरूपी प्रतिगमन केवल बहुभिन्नरूपी होता है। )


2
@Jeremy मीलों जवाब में एक अतिरिक्त: www-01.ibm.com/support/docview.wss?uid=swg21476743
Epaminondas

2

मैं पहले प्रतिगमन चर को पीसीए परिकलित चर में परिवर्तित करके ऐसा करूंगा, और फिर मैं पीसीए परिकलित चर के साथ प्रतिगमन पर विचार करूंगा। जब मैं एक नया उदाहरण मैं वर्गीकृत करना चाहता हूँ, मैं निश्चित रूप से pca मूल्यों की गणना करने में सक्षम होने के लिए eigenvectors को स्टोर करूँगा।


2
यह उपरोक्त उत्तर की तुलना में वैचारिक रूप से भिन्न है। मैं अभी भी स्पष्ट नहीं हूं कि अपने चर को पीसीए गुणांक में कैसे परिवर्तित किया जाए, जो मुझे 2+ आश्रित चर पर फिर से पाने की अनुमति देता है?
जेफ

@ यह जवाब वास्तव में वैचारिक रूप से बहुभिन्नरूपी प्रतिगमन के समान है। यहाँ, सुझाव क्रम में दो असतत चरणों को करना है (अर्थात, भारित रैखिक समग्र चर ढूंढें फिर उन्हें पुनः प्राप्त करें); बहुभिन्नरूपी प्रतिगमन दो चरणों को एक साथ करता है । बहुभिन्नरूपी प्रतिगमन अधिक शक्तिशाली होगा, क्योंकि डब्ल्यूएलसीवी का गठन प्रतिगमन को अधिकतम करने के लिए किया जाता है। हालांकि, दो-चरण प्रक्रिया प्रक्रिया के बारे में अधिक स्पष्टता प्रदान कर सकती है, या शोधकर्ता के लिए अन्यथा बेहतर हो सकती है।
गुंग - फिर से बहाल करें मोनिका

1
अगर आप निर्भर चर पर पीसीए करते हैं और तब केवल पहले प्रमुख घटक पर फिर से काम करते हैं, तो @gung हम्म इस तरह से समझ में आता है ... लेकिन फिर भी आप बहुत अधिक भिन्नता निकाल रहे हैं।
जेफ

1
@ जेफ, पीसी ऑर्थोगोनल हैं। आप प्रत्येक पर स्वतंत्र प्रतिगमन चला सकते हैं। हालांकि, यह कम शक्तिशाली है b / c अपघटन काफी समान नहीं है, और बहुभिन्नरूपी प्रतिगमन परीक्षण वास्तव में पीसी पर regs की एक श्रृंखला नहीं है।
गंग -

@ जींग हाँ, आप एन स्वतंत्र पंजीकरण चला सकते हैं, लेकिन फिर आप बीटा गुणांक के एन सेट के साथ समाप्त होते हैं। मुझे समझ नहीं आता कि समस्या का हल कैसे होता है?
जेफ

1

स्याहगोश द्वारा mentionned रूप में, आप mvtnorm पैकेज आर में मान लिया जाये कि आप में से (नाम "मॉडल") एक एल एम मॉडल बनाया का उपयोग कर सकते एक अपने मॉडल में प्रतिक्रिया की है, और यह "मॉडल" कहा जाता है, तो यहां मल्टीवेरिएट भविष्य कहनेवाला वितरण प्राप्त करने के लिए है कई प्रतिक्रिया "resp1", "resp2", "resp3" एक मैट्रिक्स रूप में संग्रहीत Y:

library(mvtnorm)
model = lm(resp1~1+x+x1+x2,datas) #this is only a fake model to get
                                  #the X matrix out of it
Y = as.matrix(datas[,c("resp1","resp2","resp3")])
X =  model.matrix(delete.response(terms(model)), 
           data, model$contrasts)
XprimeX  = t(X) %*% X
XprimeXinv = solve(xprimex)
hatB =  xprimexinv %*% t(X) %*% Y
A = t(Y - X%*%hatB)%*% (Y-X%*%hatB)
F = ncol(X)
M = ncol(Y)
N = nrow(Y)
nu= N-(M+F)+1 #nu must be positive
C_1 =  c(1  + x0 %*% xprimexinv %*% t(x0)) #for a prediction of the factor setting x0 (a vector of size F=ncol(X))
varY = A/(nu) 
postmean = x0 %*% hatB
nsim = 2000
ysim = rmvt(n=nsim,delta=postmux0,C_1*varY,df=nu) 

अब, ysim की मात्राएँ भविष्य कहनेवाला वितरण से बीटा-प्रत्याशा सहिष्णुता अंतराल हैं, आप निश्चित रूप से जो कुछ भी आप चाहते हैं करने के लिए सीधे नमूना वितरण का उपयोग कर सकते हैं।

एंड्रयू एफ का जवाब देने के लिए, स्वतंत्रता की डिग्री इसलिए nu = N- (M + F) +1 है ... N टिप्पणियों का # होना, प्रतिक्रियाओं का # और M # समीकरण मॉडल के मापदंडों का # होना। nu सकारात्मक होना चाहिए।

(आप इस दस्तावेज़ में मेरे काम को पढ़ना चाहते हैं :-))


0

क्या आप पहले से ही "कैनोनिकल सहसंबंध" शब्द के पार आए थे? वहां आपके पास स्वतंत्र के साथ-साथ आश्रित पक्ष पर चर के सेट हैं। लेकिन शायद अधिक आधुनिक अवधारणाएं उपलब्ध हैं, मेरे पास जो विवरण हैं वे सभी अस्सी / नब्बे के दशक के हैं ...


1
Canonical सहसंबंध दो-खंड संरचनाओं से गणना किए गए कारक स्कोर के बीच संबंध है, जैसा कि CCA या PLS के साथ है। यह वही है जो मैंने अपनी प्रतिक्रिया (पीएलएस प्रतिगमन) में वर्णित किया था, हालांकि पीएलएस सीसीए की तुलना में अधिक उपयुक्त है जब चर एक विषम भूमिका निभाते हैं, जो यहां होने की संभावना है। इसका कारण यह है कि एक असममित अपस्फीति प्रक्रिया है और हम इसके बजाय सहसंयोजक के साथ काम करते हैं (CCA के साथ, हम एक ही समय में दोनों ब्लॉकों को डिफ्लेक्ट करते हैं, और हम सहसंबंध को अधिकतम करने की कोशिश करते हैं)
chl

@chl: upps- आज (जीवन का अंत) मैं मध्य-उत्तर के इस प्रश्न / वार्तालाप पर वापस आया था .... क्षमा करें मैंने पहले जांच नहीं की थी - मेरे पाठ्यक्रमों के साथ कुछ था और फिर मैं स्टेट को भूल गया। .. अगर मेरे लायक कुछ है तो मैं अगले दिन वापस आऊंगा।
गॉटफ्रीड हेल्स

-3

इसे संरचनात्मक समीकरण मॉडल या युगपत समीकरण मॉडल कहा जाता है।


3
मैं गलत हो सकता हूं, लेकिन मुझे नहीं लगता कि यह वही बात है। एसईएम ग्राफ से जो मैंने देखा है, ऐसा लगता है कि एसईएम अव्यक्त कारकों के मूल्यों को निर्धारित करने के लिए कई प्रतिगमन समीकरणों का उपयोग करता है, और फिर एक उच्च-क्रम कारक का निर्धारण करने के लिए उन अव्यक्त कारकों के मूल्य पर एक और प्रतिगमन चलाया जाता है। शायद यह गलत है, लेकिन मैंने कभी ऐसा SEM ग्राफ नहीं देखा है जो कई IVs को कई DVs-- से जोड़ता है - सब कुछ पदानुक्रमित है।
जेफ

इस पेपर में चित्र 8: biomedcentral.com/1471-2288/3/27 आप इसे कर सकते हैं, लेकिन इसका कोई मतलब नहीं है। यह MANOVA जैसा ही है।
जेरेमी मील्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.