परिकल्पना परीक्षण के लिए कई रैखिक प्रतिगमन

15

मैं विभिन्न चर के मॉडल बनाने के लिए कई रैखिक रजिस्टरों का उपयोग करने से परिचित हूं। हालांकि, मैं उत्सुक था कि क्या प्रतिगमन परीक्षण कभी भी किसी भी तरह की बुनियादी परिकल्पना परीक्षण करने के लिए उपयोग किए जाते हैं। यदि ऐसा है, तो उन परिदृश्यों / परिकल्पनाओं को क्या दिखेगा?

regression hypothesis-testing multiple-regression

— cryptic_star
स्रोत

1

क्या आप आगे बता सकते हैं कि आपका क्या मतलब है? यह परीक्षण करना बहुत आम है कि क्या एक चर के लिए ढलान पैरामीटर शून्य से अलग है। मुझे लगता है कि "परिकल्पना परीक्षण" कहेंगे। क्या आप इससे अनजान हैं, या आप कुछ अलग मतलब रखते हैं? आपके उद्देश्यों के लिए एक परिदृश्य क्या है?

— गंग -

मैं इससे अनजान हूं। यदि प्रतिगमन-आधारित विश्लेषण किसी अन्य प्रकार की परिकल्पना परीक्षण के लिए उपयोग किया जाता है, तो मैं अनिश्चित था (शायद दूसरे पर एक चर के महत्व के बारे में, आदि)।

— cryptic_star

26

ये रहा एक सरल उदाहरण। मुझे नहीं पता कि आप आर से परिचित हैं, लेकिन उम्मीद है कि कोड पर्याप्त रूप से आत्म-व्याख्यात्मक है।

set.seed(9)        # this makes the example reproducible
N = 36
    # the following generates 3 variables:
x1 =     rep(seq(from=11, to=13),           each=12)
x2 = rep(rep(seq(from=90, to=150, by=20),   each=3 ), times=3)
x3 =     rep(seq(from=6,  to=18,  by=6 ),  times=12)
cbind(x1, x2, x3)[1:7,]    # 1st 7 cases, just to see the pattern
      x1  x2 x3
 [1,] 11  90  6
 [2,] 11  90 12
 [3,] 11  90 18
 [4,] 11 110  6
 [5,] 11 110 12
 [6,] 11 110 18
 [7,] 11 130  6 
    # the following is the true data generating process, note that y is a function of
    #   x1 & x2, but not x3, note also that x1 is designed above w/ a restricted range,
    #   & that x2 tends to have less influence on the response variable than x1:
y  = 15 + 2*x1 + .2*x2 + rnorm(N, mean=0, sd=10)

reg.Model = lm(y~x1+x2+x3)    # fits a regression model to these data

अब, देखते हैं कि यह कैसा दिखता है:

. . . 
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) -1.76232   27.18170  -0.065  0.94871   
x1           3.11683    2.09795   1.486  0.14716   
x2           0.21214    0.07661   2.769  0.00927 **
x3           0.17748    0.34966   0.508  0.61524   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
. . . 
F-statistic: 3.378 on 3 and 32 DF,  p-value: 0.03016

हम आउटपुट के "गुणांक" अनुभाग पर ध्यान केंद्रित कर सकते हैं। मॉडल द्वारा अनुमानित प्रत्येक पैरामीटर को अपनी पंक्ति मिलती है। वास्तविक अनुमान पहले कॉलम में सूचीबद्ध है। दूसरे कॉलम में अनुमानों के मानक त्रुटियों को सूचीबद्ध किया गया है, अर्थात, यह अनुमान है कि नमूना से नमूने तक 'के आसपास कितना उछाल' होगा, अगर हम इस प्रक्रिया को बार-बार दोहराते हैं। अधिक विशेष रूप से, यह उस टी-स्कोर से जुड़े के मानक विचलन का अनुमान है । यह अनुमानित मान प्राप्त करने की संभावना है जो 0 या उससे अधिक दूर है, नमूना वितरण के अनुमान है। यदि हम प्रत्येक पैरामीटर अनुमान को उसके एसई से विभाजित करते हैं, तो हमें एक मिलता है यदि टी-स्कोर , जिसे तीसरे कॉलम में सूचीबद्ध किया गया है; इसका उपयोग परिकल्पना परीक्षण के लिए किया जाता है, विशेष रूप से यह परीक्षण करने के लिए कि क्या पैरामीटर अनुमान 0. से भिन्न है 'अंतिम स्तंभ हैपी-मूल्य शून्य परिकल्पना सच थी। ध्यान दें कि यदि शून्य परिकल्पना सच नहीं है, तो यह स्पष्ट नहीं है कि यह मान हमें कुछ भी सार्थक बता रहा है।

यदि हम गुणांक तालिका और उपरोक्त सही डेटा जनरेटिंग प्रक्रिया के बीच आगे-पीछे देखते हैं, तो हम कुछ दिलचस्प चीजें देख सकते हैं। इंटरसेप्ट -1.8 होने का अनुमान है और इसका एसई 27 है, जबकि सही मान 15. है। क्योंकि संबंधित पी-वैल्यू .95 है, इसे 0 (एक प्रकार II त्रुटि ) से 'काफी अलग' नहीं माना जाएगा , लेकिन यह फिर भी सही मूल्य के एक एसई के भीतर है । इस प्रकार वास्तविक मूल्य के परिप्रेक्ष्य और इस राशि में उतार-चढ़ाव के कारण इस अनुमान के बारे में बहुत कुछ चरम नहीं है; हमारे पास इसे 0. से अलग करने की अपर्याप्त शक्ति है। एक ही कहानी, अधिक या कम, के लिए हैx1। डेटा विश्लेषक आमतौर पर कहते हैं कि यह 'मामूली रूप से महत्वपूर्ण' नहीं है, क्योंकि इसका पी-मूल्य> .10 है, हालांकि, यह एक अन्य प्रकार की त्रुटि है। के लिए अनुमान x2काफी सटीक है मॉडल के लिए , जो एक साथ परीक्षण है। यह परीक्षण यह देखने के लिए जांचता है कि क्या मॉडल एक पूरे के रूप में है $.21214\approx.2$ x3x1अनुमानों को 0. से विभेदित करने में असमर्थ माना जाना चाहिए। इस परीक्षण के परिणामों से पता चलता है कि कम से कम कुछ पैरामीटर का अनुमान 0 के बराबर नहीं है, सही निर्णय नहीं है। चूँकि 4 परीक्षण ऊपर हैं, हमें कई तुलनाओं की समस्या बिना । (यह ध्यान रखें कि क्योंकि पी-मान यादृच्छिक चर हैं - क्या कुछ महत्वपूर्ण है प्रयोग से प्रयोग के लिए अलग-अलग होगा, यदि प्रयोग फिर से चलाया गया - यह संभव है कि ये एक दूसरे के साथ असंगत हों। इस पर चर्चा की गई है। सीवी यहां: कई प्रतिगमन में गुणांक का महत्व: महत्वपूर्ण टी-परीक्षण बनाम गैर-महत्वपूर्ण एफ-स्टेटिस्टिक से कोई सुरक्षा नहीं होगी , और यहाँ विपरीत स्थिति: एक प्रतिगमन कैसे महत्वपूर्ण हो सकता है फिर भी सभी भविष्यवाणियाँ गैर-महत्वपूर्ण हो सकती हैं , और यहाँ: प्रतिगमन में F और t आँकड़े । ) शायद उत्सुकता से, इस उदाहरण में कोई प्रकार I त्रुटियां नहीं हैं । किसी भी दर पर, इस पैराग्राफ में चर्चा किए गए सभी 5 परीक्षण परिकल्पना परीक्षण हैं।

आपकी टिप्पणी से, मैं इकट्ठा करता हूं कि आप यह भी सोच सकते हैं कि यह कैसे निर्धारित किया जाए कि एक व्याख्यात्मक चर दूसरे की तुलना में अधिक महत्वपूर्ण है। यह एक बहुत ही सामान्य प्रश्न है, लेकिन काफी पेचीदा है। एक एथलीट की ऊंचाई और वजन के आधार पर एक खेल में सफलता की संभावना का अनुमान लगाना चाहते हैं, और सोच रहे हैं कि कौन अधिक महत्वपूर्ण है। एक सामान्य रणनीति यह देखना है कि कौन सा गुणांक बड़ा है। हालांकि, ये अनुमान उन इकाइयों के लिए विशिष्ट हैं जिनका उपयोग किया गया था: उदाहरण के लिए, वजन के लिए गुणांक इस आधार पर बदल जाएगा कि क्या पाउंड या किलोग्राम का उपयोग किया जाता है। इसके अलावा, यह दूर से स्पष्ट नहीं है कि पाउंड और इंच, या किलोग्राम और सेंटीमीटर की समानता / तुलना कैसे करें। लोगों को रोजगार के लिए एक रणनीति है मानकीकृत करना है(यानी, z- स्कोर में बदल जाएं) पहले उनका डेटा। फिर ये आयाम सामान्य इकाइयों (जैसे, मानक विचलन) में हैं, और गुणांक आर-स्कोर के समान हैं । इसके अलावा, यह परीक्षण करना संभव है कि क्या एक आर-स्कोर दूसरे से बड़ा है । दुर्भाग्य से, यह आपको जंगल से बाहर नहीं निकालता है; जब तक कि सच्चा r ठीक 0 नहीं है, तब तक अनुमानित r बड़े पैमाने पर कोवरिएट मानों की श्रेणी द्वारा संचालित किया जाता है। (मुझे नहीं पता कि इसे पहचानना कितना आसान होगा, लेकिन @ व्हिबर का उत्कृष्ट उत्तर यहां है: Is $R^2$ उपयोगी या खतरनाक , इस बिंदु को दिखाता है; इसे देखने के लिए, बस इस बारे में सोचें कि कैसे $r=\sqrt{r^2}$ ।) इस प्रकार, सबसे अच्छा जो कभी भी कहा जा सकता है कि एक निर्दिष्ट सीमा के भीतर एक व्याख्यात्मक चर में परिवर्तनशीलता एक और निर्दिष्ट सीमा के भीतर एक अन्य व्याख्यात्मक चर में परिवर्तनशीलता की तुलना में प्रतिक्रिया के स्तर को निर्धारित करने के लिए अधिक महत्वपूर्ण है।

— गुंग - को पुनः स्थापित मोनिका
स्रोत

2

प्रतिगमन मॉडल में आवश्यक परीक्षण पूर्ण-कम किया गया परीक्षण है। यह वह जगह है जहां आप 2 प्रतिगमन मॉडल की तुलना कर रहे हैं, पूर्ण मॉडल में सभी शर्तें हैं और कम किए गए परीक्षण में उन शर्तों का एक सबसेट है (कम किए गए मॉडल को पूर्ण मॉडल में नेस्ट करने की आवश्यकता है)। परीक्षण तब अशक्त परिकल्पना का परीक्षण करता है कि कम किया गया मॉडल केवल पूर्ण मॉडल के साथ-साथ किसी भी अंतर के कारण होता है।

सांख्यिकीय सॉफ्टवेयर से आम प्रिंटआउट में एक समग्र एफ परीक्षण शामिल है, यह केवल पूर्ण-कम परीक्षण है जहां कम परीक्षण केवल एक अवरोधन है। वे अक्सर प्रत्येक व्यक्तिगत भविष्यवक्ता के लिए एक पी-मान भी छापते हैं, यह केवल पूर्ण-घटाए गए मॉडल परीक्षणों की एक श्रृंखला है, प्रत्येक में कम किए गए मॉडल में उस विशिष्ट शब्द को शामिल नहीं किया गया है। ब्याज के सवालों का जवाब देने के लिए इन परीक्षणों का उपयोग करने के कई तरीके हैं। वास्तव में एक परिचयात्मक सांख्यिकी पाठ्यक्रम में पढ़ाए जाने वाले प्रत्येक परीक्षण को प्रतिगमन मॉडल और पूर्ण-कम किए गए परीक्षण का उपयोग करके गणना की जा सकती है और परिणाम कई मामलों में समान होंगे और कुछ अन्य में एक बहुत करीबी सन्निकटन होगा।

— ग्रेग हिमपात
स्रोत