प्रतिगमन में पी-मूल्यों का अर्थ


27

जब मैं कुछ सॉफ़्टवेयर पैकेज (उदाहरण के लिए गणितज्ञ) में एक रेखीय प्रतिगमन करता हूं, तो मुझे मॉडल में अलग-अलग मापदंडों से जुड़े पी-मान मिलते हैं। , के लिए उदाहरण के एक रेखीय प्रतिगमन कि एक परिणाम का उत्पादन के परिणाम के साथ जुड़े एक पी-मूल्य होगा एक और एक के साथ ax+bab

  1. उन मापदंडों के बारे में इन पी-मूल्यों का व्यक्तिगत रूप से क्या मतलब है?

  2. क्या किसी प्रतिगमन मॉडल के लिए मापदंडों की गणना करने का एक सामान्य तरीका है?

  3. क्या प्रत्येक पैरामीटर से जुड़े पी-मूल्य को पूरे मॉडल के लिए पी-मूल्य में जोड़ा जा सकता है?

प्रकृति में इस प्रश्न को गणितीय रखने के लिए, मैं संभावनाओं के संदर्भ में केवल पी-मूल्यों की व्याख्या की मांग कर रहा हूं।


सवाल @cardinal से जुड़े गैविन के जवाब इसे अच्छी तरह से कहते हैं।
जेएम

6
@zyx, ओपी के सवालों के बारे में उन्नत नहीं है। ये बहुत ही सामान्य प्रश्न हैं, जिनके लिए, मेरी राय में, सांख्यिकी। एसई अधिक उपयुक्त है --- और जिससे प्रतिभागियों को अधिक से अधिक, साथ ही साथ भाग लिया जाता है। Math.SE और MO दोनों प्रायिकता प्रश्नों के लिए उत्कृष्ट संसाधन हैं, लेकिन सांख्यिकीय लोगों के लिए बहुत कम हैं। ओपी के प्रश्न उत्तरार्द्ध की ओर अधिक झुकाव रखते हैं।
कार्डिनल

@कार्डिनल: मैंने सार्वजनिक बीटा की शुरुआत के बाद से आँकड़े का पालन किया है। 4800+ प्रश्नों में से, मैं ओपी से आइटम 3 को पूछने या उत्तर देने वाले एक का पता लगाने में सक्षम नहीं था , जो कि "बहुत ही सामान्य" क्वेरी है, तो यह अजीब है। न ही मैंने आइटम 1 के लिए वैचारिक रूप से सटीक उत्तर देखे हैं, कुछ ही समय में यह सामने आया। मुझे लगता है कि इन चीजों को गणित में पोस्ट किया जाना चाहिए। समय-समय पर बड़े दर्शकों का ध्यान आकर्षित करने के लिए, मिनटों के भीतर माइग्रेट नहीं किया जाता। यह स्टेट्स पर भी पूछने के लिए चोट नहीं करता है। लेकिन बाद को एकमात्र ऐसी जगह में बदलना जहाँ आँकड़ों पर चर्चा की जा सकती है, सहायक नहीं है।
zx

अब math.SE के बारे में एक सूत्र है। meta.math.SE में आँकड़े।
zyx

(ऊपर उल्लिखित कुछ टिप्पणियों को माइग्रेशन में खो दिया गया था। वे मूल गणित पर दिखाई दे रहे हैं। पोस्टिंग, "माइग्रेटिड फ्रॉम ..." शब्दों के बगल में नीचे दी गई है)
zyx

जवाबों:


13
  1. के लिए पी-मूल्य परिकल्पना "का एक परीक्षण में पी-मूल्य है α = 0 " (आमतौर पर एक 2-तरफा टी टेस्ट)। के लिए पी-मूल्य परिकल्पना "का एक परीक्षण में पी-मूल्य है β = 0 " (यह भी आम तौर पर एक 2-तरफा टी टेस्ट) और इसी तरह प्रतिगमन में किसी भी अन्य गुणांक के लिए। इन परीक्षणों के लिए संभावना मॉडल रैखिक प्रतिगमन मॉडल में ग्रहण किए गए एक द्वारा निर्धारित किए जाते हैं। प्रतिगमन रैखिक कम से कम वर्गों के लिए, जोड़ी ( एक , ) (क द्विचर सामान्य वितरण सही पैरामीटर मान पर केंद्रित इस प्रकार α , βaα=0tbβ=0ta,bα,β), और प्रत्येक गुणांक के लिए परिकल्पना परीक्षण के बराबर है -testing कि क्या α = 0 (resp। Β = 0 ) एक उपयुक्त सामान्य वितरण से नमूने के आधार पर [एक चर, यानी, के वितरण के एक या अकेले]। विवरण जो की सामान्य वितरण दिखाई कुछ हद तक जटिल और "स्वतंत्रता की डिग्री" और "टोपी मैट्रिक्स" शामिल कर रहे हैं (संकेतन के आधार पर एक मैट्रिक्स है कि लगातार OLS प्रतिगमन के सिद्धांत में प्रदर्शित से कुछ के लिए)।tα=0β=0abA^

  2. हाँ। आमतौर पर यह अधिकतम संभावना के आकलन द्वारा (और परिभाषित) किया जाता है । के लिए प्रतिगमन रैखिक OLS और अन्य मॉडल की एक छोटी संख्या वहाँ डेटा से पैरामीटर आकलन करने के लिए सटीक फार्मूले हैं। अधिक सामान्य प्रतिगमन के लिए समाधान प्रकृति में पुनरावृत्त और संख्यात्मक हैं।

  3. प्रत्यक्ष नहीं। एक पी-मूल्य की गणना पूरे मॉडल के परीक्षण के लिए अलग-अलग की जाती है, यानी परिकल्पना का एक परीक्षण, जो सभी गुणांक (वास्तव में ग्रहण किए गए चर के होते हैं, इसलिए "स्थिर अवधि" के गुणांक को शामिल नहीं किया गया है, अगर वहाँ है एक)। लेकिन इस पी-मूल्य की गणना आमतौर पर गुणांक के पी-मूल्यों के ज्ञान से नहीं की जा सकती है।


2
आपके बिंदु (1.) में एक पैरामीटर और एक अनुमानक के बीच थोड़ा सा भ्रम होता है । -value आकलनकर्ता के बजाय पैरामीटर के साथ जुड़ा हुआ है और आकलनकर्ता द्विचर सामान्य, नहीं मानकों (जो, कम से कम, शास्त्रीय आंकड़ों में तय माना जाता है) कर रहे हैं। इसके अलावा, बिंदु (3.) में अपनी टिप्पणी भ्रम हो सकता है क्योंकि यह पूरी तरह संभव है (और बहुत आम है) व्यक्ति से कुछ के लिए पी प्रतिगमन अनुमान के -values दोनों बड़े और संयुक्त की तुलना में छोटा पी इसी से -value एफ -टेस्ट। pppF
कार्डिनल

@NRH: क्षमा करें, क्या आप अपनी पिछली टिप्पणी को स्पष्ट कर सकते हैं। मैं इसे (अभी तक) काफी फॉलो नहीं करता। :)
कार्डिनल

@कार्डिनल: यह कहना अधिक सटीक लगता है कि पी-मान एक परिकल्पना परीक्षण से जुड़ा है। पैरामीटर परीक्षण की शून्य परिकल्पना में दिखाई देते हैं और जोड़ी (अनुमानक, वैकल्पिक परिकल्पना का मान देखा गया) फिर एक पी-मूल्य निर्धारित करते हैं। अशक्त परिकल्पनाओं को मापदंडों का उपयोग करके वर्णित किया जाना चाहिए, जैसे कि α = 0 के बजाय अनुमानक a = 0 जैसा था [मूल उत्तर में किया गया] अब संपादित (त्रुटि को इंगित करने के लिए धन्यवाद)। हालांकि, कथित रूप से भ्रमित या लापता अंतर "अनुमानक सामान्य रूप से द्विभाजित होते हैं, पैरामीटर नहीं" जवाब में स्पष्ट रूप से कहा गया था।
zyx

1
क्षमा करें, मैं अभी विरोध नहीं कर सका। @zyx ने math पर मूल पोस्ट के लिए एक टिप्पणी की। जो कि stat.SE पर उत्तर देते थे, वे अक्सर अभेद्य थे। मुझे लगता है कि कई उत्तर काफी सटीक हैं, हालांकि कभी-कभी गणितीय प्रभाव। वह चीजों की प्रकृति में है। सांख्यिकीय प्रश्न और उत्तर हमेशा सटीक गणितीय कथनों में कम नहीं किए जा सकते हैं। विशेष रूप से मुश्किल लोगों को नहीं। फिर भी यहाँ दिया गया उत्तर न तो विशेष रूप से सटीक है और न ही मेरी राय में सटीक है।
NRH

3
मुझे लगता है कि अगर किसी ने एक व्याख्यात्मक टिप्पणी की तो वह अच्छा होगा।
कार्डिनल

1

अपना पहला प्रश्न लिखिए: यह आपकी पसंद के सॉफ्टवेयर पर निर्भर करता है। वास्तव में दो प्रकार के पी-मान हैं जो इन परिदृश्यों में अक्सर उपयोग किए जाते हैं, दोनों आमतौर पर संभावना अनुपात परीक्षणों पर आधारित होते हैं (कुछ अन्य होते हैं लेकिन ये आमतौर पर समकक्ष होते हैं या कम से कम उनके परिणामों में भिन्न होते हैं)।

यह महसूस करना महत्वपूर्ण है कि ये सभी पी-वैल्यू बाकी मापदंडों पर सशर्त हैं । इसका अर्थ है: मान लेना (कुछ) अन्य पैरामीटर अनुमान सही हैं, आप परीक्षण करते हैं कि पैरामीटर के लिए गुणांक शून्य है या नहीं। आमतौर पर, इन परीक्षणों के लिए शून्य परिकल्पना यह है कि गुणांक शून्य है, इसलिए यदि आपके पास एक छोटा पी-मान है, तो इसका मतलब है (सशर्त रूप से अन्य गुणांक के मूल्य पर) कि गुणांक स्वयं शून्य होने की संभावना नहीं है।

टाइप I परीक्षण प्रत्येक गुणांक के गुणांक के लिए गुणांक के मान पर करता है जो मॉडल में इसके पहले आते हैं (बाएं से दाएं)। प्रकार III परीक्षण (सीमांत परीक्षण), अन्य सभी गुणांक के मूल्य पर प्रत्येक गुणांक सशर्त के शून्य के लिए परीक्षण।

विभिन्न उपकरण अलग-अलग पी-मानों को डिफ़ॉल्ट के रूप में प्रस्तुत करते हैं, हालांकि आमतौर पर आपके पास दोनों प्राप्त करने के तरीके होते हैं। यदि आपके पास आँकड़ों के बाहर कोई कारण नहीं है, तो किसी क्रम में मापदंडों को शामिल करने के लिए, आप आमतौर पर III के परीक्षा परिणामों में रुचि लेंगे।

अंत में (अपने अंतिम प्रश्न से अधिक), संभावना अनुपात परीक्षण के साथ आप हमेशा बाकी पर गुणांक सशर्त के किसी भी सेट के लिए एक परीक्षण बना सकते हैं। यदि आप एक ही समय में कई गुणांक वाले शून्य होने का परीक्षण करना चाहते हैं, तो यह जाने का तरीका है (अन्यथा आप कुछ गंदा कई परीक्षण मुद्दों में भाग लेते हैं)।


क्या आप कृपया उल्लेखित शर्त पर विस्तार से बता सकते हैं? साथ univariate प्रतिगमन में भविष्यवक्ताओं और एक अवरोधन, मानकों का एक रैखिक संयोजन पर एक परिकल्पना का परीक्षण ψ = ' β का उपयोग करता है परीक्षण आंकड़ा टी = ψ - ψ 0pψ=cβ ...t=ψ^ψ0σ^c(XX)1c
स्याहगोश

यहाँ ψ = ' β , साथ β पैरामीटर अनुमान के वेक्टर जा रहा है, और गुणांकों के एक वेक्टर। एक्स डिजाइन मैट्रिक्स है, और σ अवशिष्ट मानक त्रुटि है | | | | 2 / ( एन - ( पी + 1 ) ) , जहां आपूर्ति मॉडल से अवशिष्ट के वेक्टर है। एक एकल पैरामीटर के परीक्षण के लिए जे 0 जा रहा है, है jψ^=cβ^β^cXσ^||e||2/(n(p+1))ejcjमई इकाई वेक्टर, और । मैं यह नहीं देखता कि मॉडल की तुलनाएँ t के लिए एक रोल कहाँ निभाती हैंψ0=0t
काराकल

मामले का सार यहाँ उदाहरण के लिए कैप्चर किया गया है । याद रखें कि एनोवा प्रतिगमन का एक विशेष मामला है। मूल रूप से, यह इस के लिए नीचे आता है: यदि आप किसी मॉडल के चर ए (गुणांक) के वेरिएबल बी के साथ या उसके बिना शून्य के लिए एक परीक्षण करते हैं, तो आपको अलग-अलग परिणाम मिल सकते हैं। इसलिए, परिणाम आपके मॉडल, डेटा (यहां तक ​​कि चर बी के मूल्यों के लिए) पर सशर्त है और इस प्रकार गुणांक पर आपके परीक्षण में नहीं बल्कि आपके मॉडल में है। गणित में उस विचार को खोजना कुछ कठिन हो सकता है :-)
निक सब्बे

p1pcββjF=(SSerSSeu)/(dferdfeu)SSeu/dfeuSSerdfer||er||2u

निरंतर मामला पूरी तरह से एक डायकोटोमस 0-1 एन्कोडेड चर के बराबर होना चाहिए।
निक सबबे
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.