परिकल्पना परीक्षण के लिए कई रैखिक प्रतिगमन


15

मैं विभिन्न चर के मॉडल बनाने के लिए कई रैखिक रजिस्टरों का उपयोग करने से परिचित हूं। हालांकि, मैं उत्सुक था कि क्या प्रतिगमन परीक्षण कभी भी किसी भी तरह की बुनियादी परिकल्पना परीक्षण करने के लिए उपयोग किए जाते हैं। यदि ऐसा है, तो उन परिदृश्यों / परिकल्पनाओं को क्या दिखेगा?


1
क्या आप आगे बता सकते हैं कि आपका क्या मतलब है? यह परीक्षण करना बहुत आम है कि क्या एक चर के लिए ढलान पैरामीटर शून्य से अलग है। मुझे लगता है कि "परिकल्पना परीक्षण" कहेंगे। क्या आप इससे अनजान हैं, या आप कुछ अलग मतलब रखते हैं? आपके उद्देश्यों के लिए एक परिदृश्य क्या है?
गंग -

मैं इससे अनजान हूं। यदि प्रतिगमन-आधारित विश्लेषण किसी अन्य प्रकार की परिकल्पना परीक्षण के लिए उपयोग किया जाता है, तो मैं अनिश्चित था (शायद दूसरे पर एक चर के महत्व के बारे में, आदि)।
cryptic_star

जवाबों:


26

ये रहा एक सरल उदाहरण। मुझे नहीं पता कि आप आर से परिचित हैं, लेकिन उम्मीद है कि कोड पर्याप्त रूप से आत्म-व्याख्यात्मक है।

set.seed(9)        # this makes the example reproducible
N = 36
    # the following generates 3 variables:
x1 =     rep(seq(from=11, to=13),           each=12)
x2 = rep(rep(seq(from=90, to=150, by=20),   each=3 ), times=3)
x3 =     rep(seq(from=6,  to=18,  by=6 ),  times=12)
cbind(x1, x2, x3)[1:7,]    # 1st 7 cases, just to see the pattern
      x1  x2 x3
 [1,] 11  90  6
 [2,] 11  90 12
 [3,] 11  90 18
 [4,] 11 110  6
 [5,] 11 110 12
 [6,] 11 110 18
 [7,] 11 130  6 
    # the following is the true data generating process, note that y is a function of
    #   x1 & x2, but not x3, note also that x1 is designed above w/ a restricted range,
    #   & that x2 tends to have less influence on the response variable than x1:
y  = 15 + 2*x1 + .2*x2 + rnorm(N, mean=0, sd=10)

reg.Model = lm(y~x1+x2+x3)    # fits a regression model to these data

अब, देखते हैं कि यह कैसा दिखता है:

. . . 
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) -1.76232   27.18170  -0.065  0.94871   
x1           3.11683    2.09795   1.486  0.14716   
x2           0.21214    0.07661   2.769  0.00927 **
x3           0.17748    0.34966   0.508  0.61524   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1 
. . . 
F-statistic: 3.378 on 3 and 32 DF,  p-value: 0.03016 

हम आउटपुट के "गुणांक" अनुभाग पर ध्यान केंद्रित कर सकते हैं। मॉडल द्वारा अनुमानित प्रत्येक पैरामीटर को अपनी पंक्ति मिलती है। वास्तविक अनुमान पहले कॉलम में सूचीबद्ध है। दूसरे कॉलम में अनुमानों के मानक त्रुटियों को सूचीबद्ध किया गया है, अर्थात, यह अनुमान है कि नमूना से नमूने तक 'के आसपास कितना उछाल' होगा, अगर हम इस प्रक्रिया को बार-बार दोहराते हैं। अधिक विशेष रूप से, यह उस टी-स्कोर से जुड़े के मानक विचलन का अनुमान है । यह अनुमानित मान प्राप्त करने की संभावना है जो 0 या उससे अधिक दूर है, नमूना वितरण के अनुमान है। यदि हम प्रत्येक पैरामीटर अनुमान को उसके एसई से विभाजित करते हैं, तो हमें एक मिलता है यदि टी-स्कोर , जिसे तीसरे कॉलम में सूचीबद्ध किया गया है; इसका उपयोग परिकल्पना परीक्षण के लिए किया जाता है, विशेष रूप से यह परीक्षण करने के लिए कि क्या पैरामीटर अनुमान 0. से भिन्न है 'अंतिम स्तंभ हैपी-मूल्य शून्य परिकल्पना सच थी। ध्यान दें कि यदि शून्य परिकल्पना सच नहीं है, तो यह स्पष्ट नहीं है कि यह मान हमें कुछ भी सार्थक बता रहा है।

यदि हम गुणांक तालिका और उपरोक्त सही डेटा जनरेटिंग प्रक्रिया के बीच आगे-पीछे देखते हैं, तो हम कुछ दिलचस्प चीजें देख सकते हैं। इंटरसेप्ट -1.8 होने का अनुमान है और इसका एसई 27 है, जबकि सही मान 15. है। क्योंकि संबंधित पी-वैल्यू .95 है, इसे 0 (एक प्रकार II त्रुटि ) से 'काफी अलग' नहीं माना जाएगा , लेकिन यह फिर भी सही मूल्य के एक एसई के भीतर है । इस प्रकार वास्तविक मूल्य के परिप्रेक्ष्य और इस राशि में उतार-चढ़ाव के कारण इस अनुमान के बारे में बहुत कुछ चरम नहीं है; हमारे पास इसे 0. से अलग करने की अपर्याप्त शक्ति है। एक ही कहानी, अधिक या कम, के लिए हैx1। डेटा विश्लेषक आमतौर पर कहते हैं कि यह 'मामूली रूप से महत्वपूर्ण' नहीं है, क्योंकि इसका पी-मूल्य> .10 है, हालांकि, यह एक अन्य प्रकार की त्रुटि है। के लिए अनुमान x2काफी सटीक है मॉडल के लिए , जो एक साथ परीक्षण है। यह परीक्षण यह देखने के लिए जांचता है कि क्या मॉडल एक पूरे के रूप में है.२१,२१४.2x3x1अनुमानों को 0. से विभेदित करने में असमर्थ माना जाना चाहिए। इस परीक्षण के परिणामों से पता चलता है कि कम से कम कुछ पैरामीटर का अनुमान 0 के बराबर नहीं है, सही निर्णय नहीं है। चूँकि 4 परीक्षण ऊपर हैं, हमें कई तुलनाओं की समस्या बिना । (यह ध्यान रखें कि क्योंकि पी-मान यादृच्छिक चर हैं - क्या कुछ महत्वपूर्ण है प्रयोग से प्रयोग के लिए अलग-अलग होगा, यदि प्रयोग फिर से चलाया गया - यह संभव है कि ये एक दूसरे के साथ असंगत हों। इस पर चर्चा की गई है। सीवी यहां: कई प्रतिगमन में गुणांक का महत्व: महत्वपूर्ण टी-परीक्षण बनाम गैर-महत्वपूर्ण एफ-स्टेटिस्टिक से कोई सुरक्षा नहीं होगी , और यहाँ विपरीत स्थिति: एक प्रतिगमन कैसे महत्वपूर्ण हो सकता है फिर भी सभी भविष्यवाणियाँ गैर-महत्वपूर्ण हो सकती हैं , और यहाँ: प्रतिगमन में F और t आँकड़े । ) शायद उत्सुकता से, इस उदाहरण में कोई प्रकार I त्रुटियां नहीं हैं । किसी भी दर पर, इस पैराग्राफ में चर्चा किए गए सभी 5 परीक्षण परिकल्पना परीक्षण हैं।

आपकी टिप्पणी से, मैं इकट्ठा करता हूं कि आप यह भी सोच सकते हैं कि यह कैसे निर्धारित किया जाए कि एक व्याख्यात्मक चर दूसरे की तुलना में अधिक महत्वपूर्ण है। यह एक बहुत ही सामान्य प्रश्न है, लेकिन काफी पेचीदा है। एक एथलीट की ऊंचाई और वजन के आधार पर एक खेल में सफलता की संभावना का अनुमान लगाना चाहते हैं, और सोच रहे हैं कि कौन अधिक महत्वपूर्ण है। एक सामान्य रणनीति यह देखना है कि कौन सा गुणांक बड़ा है। हालांकि, ये अनुमान उन इकाइयों के लिए विशिष्ट हैं जिनका उपयोग किया गया था: उदाहरण के लिए, वजन के लिए गुणांक इस आधार पर बदल जाएगा कि क्या पाउंड या किलोग्राम का उपयोग किया जाता है। इसके अलावा, यह दूर से स्पष्ट नहीं है कि पाउंड और इंच, या किलोग्राम और सेंटीमीटर की समानता / तुलना कैसे करें। लोगों को रोजगार के लिए एक रणनीति है मानकीकृत करना है(यानी, z- स्कोर में बदल जाएं) पहले उनका डेटा। फिर ये आयाम सामान्य इकाइयों (जैसे, मानक विचलन) में हैं, और गुणांक आर-स्कोर के समान हैं । इसके अलावा, यह परीक्षण करना संभव है कि क्या एक आर-स्कोर दूसरे से बड़ा है । दुर्भाग्य से, यह आपको जंगल से बाहर नहीं निकालता है; जब तक कि सच्चा r ठीक 0 नहीं है, तब तक अनुमानित r बड़े पैमाने पर कोवरिएट मानों की श्रेणी द्वारा संचालित किया जाता है। (मुझे नहीं पता कि इसे पहचानना कितना आसान होगा, लेकिन @ व्हिबर का उत्कृष्ट उत्तर यहां है: Isआर2उपयोगी या खतरनाक , इस बिंदु को दिखाता है; इसे देखने के लिए, बस इस बारे में सोचें कि कैसेआर=आर2।) इस प्रकार, सबसे अच्छा जो कभी भी कहा जा सकता है कि एक निर्दिष्ट सीमा के भीतर एक व्याख्यात्मक चर में परिवर्तनशीलता एक और निर्दिष्ट सीमा के भीतर एक अन्य व्याख्यात्मक चर में परिवर्तनशीलता की तुलना में प्रतिक्रिया के स्तर को निर्धारित करने के लिए अधिक महत्वपूर्ण है।


2

प्रतिगमन मॉडल में आवश्यक परीक्षण पूर्ण-कम किया गया परीक्षण है। यह वह जगह है जहां आप 2 प्रतिगमन मॉडल की तुलना कर रहे हैं, पूर्ण मॉडल में सभी शर्तें हैं और कम किए गए परीक्षण में उन शर्तों का एक सबसेट है (कम किए गए मॉडल को पूर्ण मॉडल में नेस्ट करने की आवश्यकता है)। परीक्षण तब अशक्त परिकल्पना का परीक्षण करता है कि कम किया गया मॉडल केवल पूर्ण मॉडल के साथ-साथ किसी भी अंतर के कारण होता है।

सांख्यिकीय सॉफ्टवेयर से आम प्रिंटआउट में एक समग्र एफ परीक्षण शामिल है, यह केवल पूर्ण-कम परीक्षण है जहां कम परीक्षण केवल एक अवरोधन है। वे अक्सर प्रत्येक व्यक्तिगत भविष्यवक्ता के लिए एक पी-मान भी छापते हैं, यह केवल पूर्ण-घटाए गए मॉडल परीक्षणों की एक श्रृंखला है, प्रत्येक में कम किए गए मॉडल में उस विशिष्ट शब्द को शामिल नहीं किया गया है। ब्याज के सवालों का जवाब देने के लिए इन परीक्षणों का उपयोग करने के कई तरीके हैं। वास्तव में एक परिचयात्मक सांख्यिकी पाठ्यक्रम में पढ़ाए जाने वाले प्रत्येक परीक्षण को प्रतिगमन मॉडल और पूर्ण-कम किए गए परीक्षण का उपयोग करके गणना की जा सकती है और परिणाम कई मामलों में समान होंगे और कुछ अन्य में एक बहुत करीबी सन्निकटन होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.