ये रहा एक सरल उदाहरण। मुझे नहीं पता कि आप आर से परिचित हैं, लेकिन उम्मीद है कि कोड पर्याप्त रूप से आत्म-व्याख्यात्मक है।
set.seed(9) # this makes the example reproducible
N = 36
# the following generates 3 variables:
x1 = rep(seq(from=11, to=13), each=12)
x2 = rep(rep(seq(from=90, to=150, by=20), each=3 ), times=3)
x3 = rep(seq(from=6, to=18, by=6 ), times=12)
cbind(x1, x2, x3)[1:7,] # 1st 7 cases, just to see the pattern
x1 x2 x3
[1,] 11 90 6
[2,] 11 90 12
[3,] 11 90 18
[4,] 11 110 6
[5,] 11 110 12
[6,] 11 110 18
[7,] 11 130 6
# the following is the true data generating process, note that y is a function of
# x1 & x2, but not x3, note also that x1 is designed above w/ a restricted range,
# & that x2 tends to have less influence on the response variable than x1:
y = 15 + 2*x1 + .2*x2 + rnorm(N, mean=0, sd=10)
reg.Model = lm(y~x1+x2+x3) # fits a regression model to these data
अब, देखते हैं कि यह कैसा दिखता है:
. . .
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.76232 27.18170 -0.065 0.94871
x1 3.11683 2.09795 1.486 0.14716
x2 0.21214 0.07661 2.769 0.00927 **
x3 0.17748 0.34966 0.508 0.61524
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
. . .
F-statistic: 3.378 on 3 and 32 DF, p-value: 0.03016
हम आउटपुट के "गुणांक" अनुभाग पर ध्यान केंद्रित कर सकते हैं। मॉडल द्वारा अनुमानित प्रत्येक पैरामीटर को अपनी पंक्ति मिलती है। वास्तविक अनुमान पहले कॉलम में सूचीबद्ध है। दूसरे कॉलम में अनुमानों के मानक त्रुटियों को सूचीबद्ध किया गया है, अर्थात, यह अनुमान है कि नमूना से नमूने तक 'के आसपास कितना उछाल' होगा, अगर हम इस प्रक्रिया को बार-बार दोहराते हैं। अधिक विशेष रूप से, यह उस टी-स्कोर से जुड़े के मानक विचलन का अनुमान है । यह अनुमानित मान प्राप्त करने की संभावना है जो 0 या उससे अधिक दूर है, नमूना वितरण के अनुमान है। यदि हम प्रत्येक पैरामीटर अनुमान को उसके एसई से विभाजित करते हैं, तो हमें एक मिलता है यदि टी-स्कोर , जिसे तीसरे कॉलम में सूचीबद्ध किया गया है; इसका उपयोग परिकल्पना परीक्षण के लिए किया जाता है, विशेष रूप से यह परीक्षण करने के लिए कि क्या पैरामीटर अनुमान 0. से भिन्न है 'अंतिम स्तंभ हैपी-मूल्य शून्य परिकल्पना सच थी। ध्यान दें कि यदि शून्य परिकल्पना सच नहीं है, तो यह स्पष्ट नहीं है कि यह मान हमें कुछ भी सार्थक बता रहा है।
यदि हम गुणांक तालिका और उपरोक्त सही डेटा जनरेटिंग प्रक्रिया के बीच आगे-पीछे देखते हैं, तो हम कुछ दिलचस्प चीजें देख सकते हैं। इंटरसेप्ट -1.8 होने का अनुमान है और इसका एसई 27 है, जबकि सही मान 15. है। क्योंकि संबंधित पी-वैल्यू .95 है, इसे 0 (एक प्रकार II त्रुटि ) से 'काफी अलग' नहीं माना जाएगा , लेकिन यह फिर भी सही मूल्य के एक एसई के भीतर है । इस प्रकार वास्तविक मूल्य के परिप्रेक्ष्य और इस राशि में उतार-चढ़ाव के कारण इस अनुमान के बारे में बहुत कुछ चरम नहीं है; हमारे पास इसे 0. से अलग करने की अपर्याप्त शक्ति है। एक ही कहानी, अधिक या कम, के लिए हैx1
। डेटा विश्लेषक आमतौर पर कहते हैं कि यह 'मामूली रूप से महत्वपूर्ण' नहीं है, क्योंकि इसका पी-मूल्य> .10 है, हालांकि, यह एक अन्य प्रकार की त्रुटि है। के लिए अनुमान x2
काफी सटीक है मॉडल के लिए , जो एक साथ परीक्षण है। यह परीक्षण यह देखने के लिए जांचता है कि क्या मॉडल एक पूरे के रूप में है.21214 ≈ .2x3
x1
अनुमानों को 0. से विभेदित करने में असमर्थ माना जाना चाहिए। इस परीक्षण के परिणामों से पता चलता है कि कम से कम कुछ पैरामीटर का अनुमान 0 के बराबर नहीं है, सही निर्णय नहीं है। चूँकि 4 परीक्षण ऊपर हैं, हमें कई तुलनाओं की समस्या बिना । (यह ध्यान रखें कि क्योंकि पी-मान यादृच्छिक चर हैं - क्या कुछ महत्वपूर्ण है प्रयोग से प्रयोग के लिए अलग-अलग होगा, यदि प्रयोग फिर से चलाया गया - यह संभव है कि ये एक दूसरे के साथ असंगत हों। इस पर चर्चा की गई है। सीवी यहां: कई प्रतिगमन में गुणांक का महत्व: महत्वपूर्ण टी-परीक्षण बनाम गैर-महत्वपूर्ण एफ-स्टेटिस्टिक से कोई सुरक्षा नहीं होगी , और यहाँ विपरीत स्थिति: एक प्रतिगमन कैसे महत्वपूर्ण हो सकता है फिर भी सभी भविष्यवाणियाँ गैर-महत्वपूर्ण हो सकती हैं , और यहाँ: प्रतिगमन में F और t आँकड़े । ) शायद उत्सुकता से, इस उदाहरण में कोई प्रकार I त्रुटियां नहीं हैं । किसी भी दर पर, इस पैराग्राफ में चर्चा किए गए सभी 5 परीक्षण परिकल्पना परीक्षण हैं।
आपकी टिप्पणी से, मैं इकट्ठा करता हूं कि आप यह भी सोच सकते हैं कि यह कैसे निर्धारित किया जाए कि एक व्याख्यात्मक चर दूसरे की तुलना में अधिक महत्वपूर्ण है। यह एक बहुत ही सामान्य प्रश्न है, लेकिन काफी पेचीदा है। एक एथलीट की ऊंचाई और वजन के आधार पर एक खेल में सफलता की संभावना का अनुमान लगाना चाहते हैं, और सोच रहे हैं कि कौन अधिक महत्वपूर्ण है। एक सामान्य रणनीति यह देखना है कि कौन सा गुणांक बड़ा है। हालांकि, ये अनुमान उन इकाइयों के लिए विशिष्ट हैं जिनका उपयोग किया गया था: उदाहरण के लिए, वजन के लिए गुणांक इस आधार पर बदल जाएगा कि क्या पाउंड या किलोग्राम का उपयोग किया जाता है। इसके अलावा, यह दूर से स्पष्ट नहीं है कि पाउंड और इंच, या किलोग्राम और सेंटीमीटर की समानता / तुलना कैसे करें। लोगों को रोजगार के लिए एक रणनीति है मानकीकृत करना है(यानी, z- स्कोर में बदल जाएं) पहले उनका डेटा। फिर ये आयाम सामान्य इकाइयों (जैसे, मानक विचलन) में हैं, और गुणांक आर-स्कोर के समान हैं । इसके अलावा, यह परीक्षण करना संभव है कि क्या एक आर-स्कोर दूसरे से बड़ा है । दुर्भाग्य से, यह आपको जंगल से बाहर नहीं निकालता है; जब तक कि सच्चा r ठीक 0 नहीं है, तब तक अनुमानित r बड़े पैमाने पर कोवरिएट मानों की श्रेणी द्वारा संचालित किया जाता है। (मुझे नहीं पता कि इसे पहचानना कितना आसान होगा, लेकिन @ व्हिबर का उत्कृष्ट उत्तर यहां है: Isआर2उपयोगी या खतरनाक , इस बिंदु को दिखाता है; इसे देखने के लिए, बस इस बारे में सोचें कि कैसेआर = आर2--√।) इस प्रकार, सबसे अच्छा जो कभी भी कहा जा सकता है कि एक निर्दिष्ट सीमा के भीतर एक व्याख्यात्मक चर में परिवर्तनशीलता एक और निर्दिष्ट सीमा के भीतर एक अन्य व्याख्यात्मक चर में परिवर्तनशीलता की तुलना में प्रतिक्रिया के स्तर को निर्धारित करने के लिए अधिक महत्वपूर्ण है।