कई रैखिक प्रतिगमन में पी-मूल्य की समझ


12

कई रैखिक प्रतिगमन विश्लेषण के पी-मूल्य के बारे में, मिनिटैब की वेबसाइट से परिचय नीचे दिखाया गया है।

प्रत्येक पद के लिए p- मान शून्य परिकल्पना का परीक्षण करता है कि गुणांक शून्य के बराबर है (कोई प्रभाव नहीं)। एक कम पी-मूल्य (<0.05) इंगित करता है कि आप अशक्त परिकल्पना को अस्वीकार कर सकते हैं। दूसरे शब्दों में, एक भविष्यवक्ता जिसके पास कम पी-मूल्य है, आपके मॉडल के लिए एक सार्थक अतिरिक्त होने की संभावना है क्योंकि भविष्यवक्ता के मूल्य में परिवर्तन प्रतिक्रिया चर में परिवर्तन से संबंधित हैं।

उदाहरण के लिए, मेरे पास एक परिणामी MLR मॉडल है । और आउट पुट नीचे दिखाया गया है। फिर इस समीकरण का उपयोग करके एक गणना की जा सकती है।y=0.46753X10.2668X2+1.6193X3+4.5424X4+14.48y

            Estimate      SE        tStat       pValue  
               ________    ______    _________    _________

(Intercept)      14.48     5.0127       2.8886    0.0097836
x1             0.46753     1.2824      0.36458      0.71967
x2             -0.2668     3.3352    -0.079995      0.93712
x3              1.6193     9.0581      0.17877      0.86011
x4              4.5424     2.8565       1.5902       0.1292

ऊपर दिए गए परिचय के आधार पर, शून्य परिकल्पना यह है कि गुणांक बराबर होता है। मेरी समझ यह है कि गुणांक, उदाहरण के लिए के गुणांक , को 0 के रूप में सेट किया जाएगा और दूसरे y को y रूप में गणना की जाएगी। । फिर और लिए एक युग्मित टी-टेस्ट आयोजित किया जाता है , लेकिन इस टी-टेस्ट का पी-वैल्यू 6.9e-12 है जो 0.1292 ( के गुणांक के मूल्य) के बराबर नहीं है ।X4y2=0.46753X10.2668X2+1.6193X3+0X4+14.48yy2X4

क्या कोई सही समझ पर मदद कर सकता है? बहुत धन्यवाद!


क्या आप प्रतिगमन दिनचर्या का आउटपुट दिखा सकते हैं?
अक्कल

पी-मूल्य संगणना का आपका वर्णन गैर-मानक है। आपको क्यों लगता है कि इसे आपके द्वारा वर्णित तरीके से गणना की जानी चाहिए? आउटपुट में पी-वैल्यू की गणना मापदंडों के वार-कोव मैट्रिक्स से की जाती है। यदि आप वाल्ड की तरह प्रतिबंध परीक्षण चलाना चाहते हैं, तो यह आपके द्वारा वर्णित तरीका नहीं है। आप 3 चर के साथ मॉडल को पुन: आकलन करने के लिए होगा, मिल loglikelihood आदि
Aksakal

1
उस परिचय के अनुसार, आपके पास केवल एक "महत्वपूर्ण" चर है - "अवरोधन" -, क्योंकि केवल इसका पी-मूल्य छोटा है। उद्धरण में भोले और भ्रामक अभ्यास से परे जाने के लिए, आपको कई प्रतिगमन के बारे में अधिक जानने की आवश्यकता है। यह देखने के लिए कि इस संबंध में क्या सीखा जा सकता है, हमारी साइट पर संबंधित थ्रेड्स की खोज करने पर विचार करें ।
whuber

2
इन दो प्रश्नों के उत्तर देखें: --ysts.stackexchange.com/questions/5135/… और - सांख्यिकी.stackexchange.com/questions/126179// उन्होंने मुझे यह समझने में मदद की कि पी-वैल्यू की गणना कैसे की जाती है, आशा है कि उन्हें मिल जाएगा साथ ही सहायक है।
जियाकोमो

जवाबों:


7

यह कुछ कारणों से गलत है:

  1. मॉडल "बिना" X4 आवश्यक रूप से अन्य मूल्यों के लिए समान गुणांक नहीं होगा। कम किए गए मॉडल को फिट करें और अपने लिए देखें।

  2. गुणांक के लिए सांख्यिकीय परीक्षण 2 भविष्यवाणियों से प्राप्त वाई के "माध्य" मूल्यों की चिंता नहीं करता है। भविष्यवाणी की गईY का हमेशा एक ही भव्य मतलब होगा, इस प्रकार टी-टेस्ट से 0.5 के बराबर पी-मान होगा। वही अवशिष्टों के लिए धारण करता है। आपके t-test में ऊपर दिए गए बिंदु के अनुसार गलत मान था।

  3. गुणांक के सांख्यिकीय महत्व के लिए आयोजित सांख्यिकीय परीक्षण एक नमूना टी-परीक्षण है। यह भ्रामक है क्योंकि हमारे पास X4 के लिए कई गुणांक का "नमूना" नहीं है, लेकिन हमारे पास केंद्रीय सीमा प्रमेय का उपयोग करके ऐसे नमूने के वितरण गुणों का अनुमान है। माध्य और मानक त्रुटि इस तरह के एक सीमित वितरण के स्थान और आकार का वर्णन करती है। यदि आप कॉलम "एस्ट" को लेते हैं और "एसई" से विभाजित करते हैं और मानक सामान्य वितरण से तुलना करते हैं, तो यह आपको 4 कॉलम में पी-मान देता है।

  4. एक चौथा बिंदु: मिनिटैब के सहायता पृष्ठ की आलोचना। इस तरह की मदद फ़ाइल, एक पैराग्राफ में, सांख्यिकीय प्रशिक्षण के वर्षों को संक्षेप में प्रस्तुत नहीं कर सकती है, इसलिए मुझे पूरी चीज के साथ संघर्ष करने की आवश्यकता नहीं है। लेकिन, यह कहना कि "भविष्यवक्ता" "एक महत्वपूर्ण योगदान" अस्पष्ट है और शायद गलत है। एक बहुभिन्नरूपी मॉडल में किन चरों को शामिल करने के लिए तर्क सूक्ष्म है और वैज्ञानिक तर्क पर निर्भर है न कि सांख्यिकीय अनुमान।


0

पी-मानों की आपकी प्रारंभिक व्याख्या सही प्रतीत होती है, जो यह है कि केवल अवरोधन में एक गुणांक होता है जो 0. से काफी भिन्न होता है। आप देखेंगे कि x4 के लिए गुणांक का अनुमान अभी भी काफी अधिक है, लेकिन पर्याप्त त्रुटि है कि यह महत्वपूर्ण नहीं है 0 से अलग।

Y1 और y2 के आपके युग्मित टी परीक्षण से पता चलता है कि मॉडल एक दूसरे से अलग हैं। यह उम्मीद की जानी चाहिए, एक मॉडल में आपने एक बड़ा लेकिन अभेद्य गुणांक शामिल किया है जो आपके मॉडल में काफी योगदान दे रहा है। यह सोचने का कोई कारण नहीं है कि इन मॉडलों का एक-दूसरे से भिन्न होने का p- मान x4 के गुणांक के p- मान 0 से भिन्न होने के समान होना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.