क्या लीनियर रिग्रेशन में वैरिएबल ऑर्डर मायने रखता है


9

मैं दो चर ( और ) के बीच परस्पर क्रिया की जाँच कर रहा हूँ । इन चरों के बीच बीच रैखिक सहसंबंध का एक बड़ा सौदा है । समस्या की प्रकृति से मैं कारण के बारे में कुछ भी नहीं कह सकता (चाहे कारण या आसपास का अन्य तरीका हो)। मैं आउटलाइनरों का पता लगाने के लिए प्रतिगमन लाइन से विचलन का अध्ययन करना चाहता हूं। ऐसा करने के लिए मैं या तो की एक रेखीय प्रतिगमन का निर्माण कर सकते के एक समारोह के रूप मेंx1x2r>0.9एक्स1एक्स2एक्स1एक्स2, या फिर इसके विपरीत। क्या मेरी पसंद का परिवर्तनशील क्रम मेरे परिणामों को प्रभावित कर सकता है?


आउटलेर की खोज में, आपको पहले दोनों के खिलाफ अपने आश्रित चर को फिर से प्राप्त करना चाहिए एक्स1 तथा एक्स2और आउटलेर की तलाश करें।
स्कीनटेक्डी

क्या आपकी जांच के बाहर के लोगों को ढूंढ रहा है? यदि ऐसा है, तो आपको पहले दोनों के खिलाफ अपने आश्रित चर को फिर से प्राप्त करना चाहिएएक्स1 तथा एक्स2और फिर बाह्य परीक्षण करें। यदि संभव कारण पता चल रहा है, तो आपको एक डिज़ाइन किए गए प्रयोग को करने पर विचार करना चाहिए। यदि आपके प्रयोग का उद्देश्य आपके दो स्वतंत्र चर के बीच एक संबंध खोजना है, तो एकत्रित डेटा के घटाव को देखने से चाल नहीं चलेगी।
स्कीनटेक्डी

यह मेरे लिए स्पष्ट नहीं है कि आपका क्या मतलब है। यदि आपके डेटा में आउटलेयर हैं तो वे प्रतिगमन लाइन की गणना को प्रभावित करेंगे। आप दोनों में आउटलेर की तलाश क्यों कर रहे हैंएक्स1 तथा एक्स2एक साथ?
DQdlM

@schenectady टिप्पणियों में LaTeX के लिए का उपयोग करें, कृपया।

जवाबों:


3

यह निश्चित रूप से कर सकता है (वास्तव में, यह आपके डेटा पर मान्यताओं के संबंध में भी मायने रखता है - आप केवल कोवरिएट दिए गए परिणाम के वितरण के बारे में धारणा बनाते हैं)। इस प्रकाश में, आप "उलटा भविष्यवाणी विचरण" जैसे शब्द को देख सकते हैं। किसी भी तरह से, रैखिक प्रतिगमन कारण के बारे में कुछ भी नहीं कहता है! सबसे अच्छे रूप में, आप सावधान डिजाइन के माध्यम से कार्य-कारण के बारे में कुछ कह सकते हैं।


3

मामले को सममित बनाने के लिए, कोई दो चर के बीच अंतर को पुनः प्राप्त कर सकता है (Δएक्स) बनाम उनका औसत मूल्य।


3

मानक प्रतिगमन बिंदुओं और रेखा के बीच ऊर्ध्वाधर दूरी को कम करता है, इसलिए 2 चर को स्विच करने से अब क्षैतिज दूरी (समान स्क्रैपप्लेट) दी जाएगी। एक अन्य विकल्प (जो कई नामों से जाता है) लंबवत दूरी को कम करना है, यह सिद्धांत घटकों का उपयोग करके किया जा सकता है।

यहाँ कुछ R कोड है जो अंतर दिखाता है:

library(MASS)

tmp <- mvrnorm(100, c(0,0), rbind( c(1,.9),c(.9,1)) )

plot(tmp, asp=1)

fit1 <- lm(tmp[,1] ~ tmp[,2])  # horizontal residuals
segments( tmp[,1], tmp[,2], fitted(fit1),tmp[,2], col='blue' )
o <- order(tmp[,2])
lines( fitted(fit1)[o], tmp[o,2], col='blue' )

fit2 <- lm(tmp[,2] ~ tmp[,1])  # vertical residuals
segments( tmp[,1], tmp[,2], tmp[,1], fitted(fit2), col='green' )
o <- order(tmp[,1])
lines( tmp[o,1], fitted(fit2)[o], col='green' )

fit3 <- prcomp(tmp)
b <- -fit3$rotation[1,2]/fit3$rotation[2,2]
a <- fit3$center[2] - b*fit3$center[1]
abline(a,b, col='red')
segments(tmp[,1], tmp[,2], tmp[,1]-fit3$x[,2]*fit3$rotation[1,2], tmp[,2]-fit3$x[,2]*fit3$rotation[2,2], col='red')

legend('bottomright', legend=c('Horizontal','Vertical','Perpendicular'), lty=1, col=c('blue','green','red'))

आउटलेर की तलाश करने के लिए आप केवल सिद्धांत घटकों के विश्लेषण के परिणामों की साजिश कर सकते हैं।

तुम भी देखना चाहते हो सकता है:

ब्लांड और ऑल्टमैन (1986), दो तरीकों के बीच समझौते का आकलन करने के लिए सांख्यिकीय तरीके। लांसेट, पीपी 307-310


0

आपके X1 और x2 चर मिलनसार हैं। बहुरूपता की उपस्थिति में, आपके पैरामीटर अनुमान अभी भी निष्पक्ष हैं, लेकिन उनका विचरण बड़ा है, अर्थात, पैरामीटर अनुमानों के महत्व पर आपका अनुमान मान्य नहीं है, और आपकी भविष्यवाणी में बड़े आत्मविश्वास अंतराल होंगे।

पैरामीटर अनुमानों की व्याख्या भी मुश्किल है। लीनियर रिग्रेशन फ्रेमवर्क में, ए 1 पर पैरामीटर का अनुमान है वाई में परिवर्तन एक्स में एक यूनिट बदलाव के लिए मॉडल में हर दूसरे बाहरी चर को दिया जाता है जो निरंतर आयोजित किया जाता है। आपके मामले में, X1 और x2 अत्यधिक सहसंबद्ध हैं, और जब X1 बदल रहा है तो आप x2 को स्थिर नहीं रख सकते।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.