मुझे लगता है कि इस मुद्दे पर इस साइट पर पहले पूरी तरह से चर्चा की गई है, अगर आपको सिर्फ यह पता है कि कहां देखना है। इसलिए मैं संभवत: अन्य प्रश्नों के कुछ लिंक के साथ बाद में एक टिप्पणी जोड़ूंगा, या यदि मुझे कोई भी नहीं मिल सकता है तो एक पूर्ण विवरण प्रदान करने के लिए इसे संपादित कर सकता हूं।
दो बुनियादी संभावनाएं हैं: पहला, अन्य IV कुछ अवशिष्ट परिवर्तनशीलता को अवशोषित कर सकता है और इस तरह प्रारंभिक IV के सांख्यिकीय परीक्षण की शक्ति को बढ़ा सकता है। दूसरी संभावना यह है कि आपके पास एक दबानेवाला चर है। यह एक बहुत ही जवाबी सहज ज्ञान युक्त विषय है, लेकिन आप कुछ जानकारी मिल सकती है यहाँ *, यहाँ या इस उत्कृष्ट सीवी धागा ।
* ध्यान दें कि आपको उस हिस्से को पाने के लिए नीचे से पूरे रास्ते को पढ़ना होगा जो कि दबाने योग्य चर बताते हैं, आप बस वहां से आगे जा सकते हैं, लेकिन आपको पूरी बात पढ़कर सबसे अच्छी सेवा मिलेगी।
संपादित करें: जैसा कि वादा किया गया है, मैं अपनी बात का एक पूर्ण विवरण जोड़ रहा हूं कि कैसे अन्य IV अवशिष्ट परिवर्तनशीलता में से कुछ को अवशोषित कर सकता है और इस तरह प्रारंभिक IV के सांख्यिकीय परीक्षण की शक्ति बढ़ा सकता है। @whuber ने एक प्रभावशाली उदाहरण जोड़ा, लेकिन मैंने सोचा कि मैं एक मानार्थ उदाहरण जोड़ सकता हूं जो इस घटना को एक अलग तरीके से समझाता है, जो कुछ लोगों को घटना को अधिक स्पष्ट रूप से समझने में मदद कर सकता है। इसके अलावा, मैं प्रदर्शित करता हूं कि दूसरी IV को अधिक दृढ़ता से जुड़ा होना जरूरी नहीं है (हालांकि, व्यवहार में, यह लगभग हमेशा इस घटना के घटित होने के लिए होगा)।
एक प्रतिगमन मॉडल में सहसंयोजकों का परीक्षण मानक के साथ किया जा सकता है, इसके मानक त्रुटि से पैरामीटर अनुमान को विभाजित करके, या उन्हें वर्गों के योगों का विभाजन करके एफ- टेस्ट्स के साथ परीक्षण किया जा सकता है। जब टाइप III एसएस का उपयोग किया जाता है, तो ये दो परीक्षण विधियां समतुल्य होंगी (अधिक प्रकार के एसएस और संबद्ध परीक्षणों के लिए, यह मेरे जवाब को यहां पढ़ने में मदद कर सकता है: टाइप I एसएस की व्याख्या कैसे करें )। उन लोगों के लिए जो केवल प्रतिगमन विधियों के बारे में सीखना शुरू करते हैं, टी- टेट अक्सर ध्यान केंद्रित करते हैं क्योंकि वे लोगों को समझने में आसान लगते हैं। हालांकि, यह एक ऐसा मामला है जहां मुझे लगता है कि एनोवा की तालिका देखना अधिक मददगार है। आइए एक साधारण प्रतिगमन मॉडल के लिए मूल एनोवा तालिका को याद करें: tFt
Sourcex1ResidualTotalSS∑(y^i−y¯)2∑(yi−y^i)2∑(yi−y¯)2df1N−(1+1)N−1MSSSx1dfx1SSresdfresFMSx1MSres
यहाँ का मध्यमान है y , y मैं का मनाया मूल्य है y इकाई (जैसे, रोगी) के लिए मैं , y मैं इकाई के लिए मॉडल की भविष्यवाणी मूल्य है मैं , और एन अध्ययन में इकाइयों की कुल संख्या है। यदि आपके पास दो orthogonal covariates के साथ एक एकाधिक प्रतिगमन मॉडल है, तो ANOVA तालिका का निर्माण इस तरह किया जा सकता है: y¯yyiyiy^iiN
Sourcex1x2ResidualTotalSS∑(y^x1ix¯2−y¯)2∑(y^x¯1x2i−y¯)2∑(yi−y^i)2∑(yi−y¯)2df11N−(2+1)N−1MSSSx1dfx1SSx2dfx2SSresdfresFMSx1MSresMSx2MSres
यहाँ y एक्स 1 मैं ° एक्स 2 , उदाहरण के लिए, इकाई के लिए भविष्यवाणी की मूल्य है मैं अगर के लिए अपने मनाया मूल्य एक्स 1 था इसके वास्तविक मनाया मूल्य है, लेकिन के लिए अपने मनाया मूल्य एक्स 2 के माध्य था एक्स 2 । बेशक, यह संभव है कि ˉ एक्स 2 है की मनाया मूल्य एक्स 2y^x1ix¯2ix1x2x2x¯2 x2कुछ अवलोकन के लिए, जिस स्थिति में कोई समायोजन नहीं किया जाना है, लेकिन यह आमतौर पर ऐसा नहीं होगा। ध्यान दें कि एनोवा तालिका बनाने के लिए यह विधि केवल मान्य है यदि सभी चर ऑर्थोगोनल हैं; यह एक बहुत ही सरलीकृत मामला है जो एक्सपोज़ररी उद्देश्यों के लिए बनाया गया है।
यदि हम उस स्थिति पर विचार कर रहे हैं जहां एक ही डेटा का उपयोग किसी मॉडल को साथ और उसके बिना फिट करने के लिए किया जाता है , तो देखे गए y मान और same y समान होंगे। इस प्रकार, कुल एसएस दोनों एनोवा तालिकाओं में समान होना चाहिए। इसके अलावा, यदि x 1 और x 2 एक-दूसरे के लिए ऑर्थोगोनल हैं, तो S S x 1 भी एनोवा दोनों तालिकाओं में समान होगा। तो, यह कैसे होता है कि तालिका में x 2 के साथ जुड़े वर्गों के योग हो सकते हैं ? अगर वे कुल एसएस और एस एस एक्स 1 से आए थेx2yy¯x1x2SSx1x2SSx1समान हैं? जवाब है कि वे से आए थे । Df एक्स 2 भी से लिया जाता है df रेस । SSresdfx2dfres
अब X 1 का -est दोनों मामलों में M S Res द्वारा विभाजित M S x 1 है । चूंकि एम एस एक्स 1 समान है, इसलिए इस परीक्षण के महत्व में अंतर एम एस रेस में परिवर्तन से आता है , जो दो तरीकों से बदल गया है: यह कम एसएस के साथ शुरू हुआ, क्योंकि कुछ को एक्स 2 के लिए आवंटित किया गया था , लेकिन वे हैं कम df से विभाजित, चूंकि स्वतंत्रता की कुछ डिग्री x 2 को आवंटित की गई थी , साथ ही साथ। एफ -टेस्ट के महत्व / शक्ति में परिवर्तन (और समकक्ष रूप सेFx1MSx1MSresMSx1MSresx2x2F -est, इस मामले में) इस कारण से है कि उन दोनों ने व्यापार को कैसे बदल दिया। यदि x 2 को अधिक SS को x 2 के लिए दिया जाता है, तो x 2 को दिया जाता है, तो M S Res कम हो जाएगा, जिससे X 1 सेजुड़ा F बढ़ जाएगा और P अधिक महत्वपूर्ण हो जाएगा। tx2x2MSresFx1p
इसके होने के लिए का प्रभाव x 1 से बड़ा नहीं होना चाहिए , लेकिन अगर ऐसा नहीं है, तो p -values में बदलाव काफी छोटा होगा। गैर-महत्व और महत्व के बीच स्विच करने का एकमात्र तरीका यह है कि यदि पी- अल्फा अल्फा के दोनों किनारों पर थोड़ा-थोड़ा होता है। यहाँ एक उदाहरण है, जिसमें कोडित है : x2x1ppR
x1 = rep(1:3, times=15)
x2 = rep(1:3, each=15)
cor(x1, x2) # [1] 0
set.seed(11628)
y = 0 + 0.3*x1 + 0.3*x2 + rnorm(45, mean=0, sd=1)
model1 = lm(y~x1)
model12 = lm(y~x1+x2)
anova(model1)
# ...
# Df Sum Sq Mean Sq F value Pr(>F)
# x1 1 5.314 5.3136 3.9568 0.05307 .
# Residuals 43 57.745 1.3429
# ...
anova(model12)
# ...
# Df Sum Sq Mean Sq F value Pr(>F)
# x1 1 5.314 5.3136 4.2471 0.04555 *
# x2 1 5.198 5.1979 4.1546 0.04785 *
# Residuals 42 52.547 1.2511
# ...
वास्तव में, को बिल्कुल भी महत्वपूर्ण नहीं होना चाहिए। विचार करें: x2
set.seed(1201)
y = 0 + 0.3*x1 + 0.3*x2 + rnorm(45, mean=0, sd=1)
anova(model1)
# ...
# Df Sum Sq Mean Sq F value Pr(>F)
# x1 1 3.631 3.6310 3.8461 0.05636 .
# ...
anova(model12)
# ...
# Df Sum Sq Mean Sq F value Pr(>F)
# x1 1 3.631 3.6310 4.0740 0.04996 *
# x2 1 3.162 3.1620 3.5478 0.06656 .
# ...
ये वास्तव में @ व्हिबर पोस्ट में नाटकीय उदाहरण की तरह कुछ भी नहीं हैं, लेकिन वे लोगों को यह समझने में मदद कर सकते हैं कि यहाँ क्या चल रहा है।