जब कोई UMP नहीं है, तो अस्वीकृति क्षेत्र को कैसे परिभाषित करें?


13

रैखिक प्रतिगमन मॉडल पर विचार करें

y=Xβ+u ,

uN(0,σ2I) ,

(यू|एक्स)=0

आज्ञा देना बनाम ।एच0:σ02=σ2एच1:σ02σ2

हम उस , जहां । और annihilator मैट्रिक्स के लिए विशिष्ट संकेतन है, , जहां आश्रित चर है ने ।dमैंहूँ(एक्स)=n×कश्मीरएमएक्सएमएक्सy= y y yएक्सyटीएक्सyσ2~χ2(n-)dim(X)=n×kMXMXy=y^y^yX

मैं जिस पुस्तक को पढ़ रहा हूं वह निम्नलिखित बताती है: यहाँ छवि विवरण दर्ज करें

मैंने पहले पूछा है कि एक अस्वीकृति क्षेत्र (आरआर) को परिभाषित करने के लिए किन मानदंडों का उपयोग किया जाना चाहिए, इस प्रश्न के उत्तर देखें , और मुख्य एक आरआर का चयन करना था जिसने परीक्षण को यथासंभव शक्तिशाली बना दिया।

इस मामले में, विकल्प एक द्विपक्षीय समग्र परिकल्पना होने के साथ आमतौर पर कोई यूएमपी परीक्षण नहीं होता है। इसके अलावा, पुस्तक में दिए गए उत्तर से, लेखक यह नहीं दिखाते हैं कि उन्होंने अपनी आरआर की शक्ति का अध्ययन किया है या नहीं। फिर भी, उन्होंने दो-पूंछ वाले आरआर को चुना। ऐसा क्यों है, क्योंकि परिकल्पना 'एकतरफा' आरआर निर्धारित नहीं करती है?

संपादित करें: यह चित्र 4.14 के अभ्यास के समाधान के रूप में इस पुस्तक के समाधान मैनुअल में है ।



@Scortchi लिंक के लिए धन्यवाद। क्या मैं आपसे इस प्रश्न के बारे में कुछ पूछ सकता हूं? क्या आपको यह दिलचस्प लगता है? मैं यह आकलन करने की कोशिश कर रहा हूं कि क्या मैं दिलचस्प सवाल कर रहा हूं, या अगर मुझे अपने हितों को अन्य क्षेत्रों के लिए निर्देशित करना चाहिए ...
समुद्र में एक बूढ़ा आदमी।

हर कोई सिद्धांत को दिलचस्प नहीं पाता है, लेकिन कुछ लोग करते हैं (मेरे सहित) और हमने लगभग 2k qs के साथ टैग किया हैmathematical-statistics । तो, एक अच्छा क्ष। IMO। यह थोड़ा व्यापक है लेकिन मुझे लगता है कि एक अच्छा जवाब विभिन्न दृष्टिकोणों और विचारों का सर्वेक्षण करेगा, और एक प्रेरक उदाहरण बहुत मदद करता है। (मैंने जितना संभव हो उतना सरल उदाहरण चुना है - एक ज्ञात वितरण के साथ सामान्य वितरण के विचरण के बारे में परीक्षण, या एक घातांक वितरण का मतलब।) [BTW मैं अक्सर qs पर वोट देना भूल जाता हूं जब मैं उन पर टिप्पणी करता हूं। ।]
Scortchi - को पुनः स्थापित मोनिका

@Scortchi आपकी प्रतिक्रिया के लिए धन्यवाद। कभी-कभी मुझे यकीन नहीं होता कि मैं प्रश्न को अच्छी तरह से स्ट्रक्चर करता हूं, क्योंकि मैं स्वयं इसका अध्ययन कर रहा हूं।
समुद्र में एक बूढ़ा आदमी।

2
आपको एक्स
टेलर

जवाबों:


7

मामले के माध्यम से पहले काम करना आसान है, जहां प्रतिगमन गुणांक ज्ञात हैं और अशक्त परिकल्पना इसलिए सरल है। तो पर्याप्त आंकड़ा है , जहां जेड अवशिष्ट है; -चुकता ची अशक्त के तहत इसके वितरण भी एक है द्वारा बढ़ाया σ 2 0 और स्वतंत्रता की डिग्री के साथ नमूना आकार के बराबर एनT=z2zσ02n

के तहत likelihoods के अनुपात लिख और σ = σ 2 और पुष्टि करें कि इसके बारे में एक बढ़ा हुआ कार्य है टी किसी के लिए σ 2 > σ 1 :σ=σ1σ=σ2Tσ2>σ1

लॉग संभावना अनुपात समारोह है , और सीधे के लिए आनुपातिकटीसकारात्मक ढाल जब साथσ2>σ1

(σ2;टी,n)-(σ1;टी,n)=n2[लॉग(σ12σ22)+टीn(1σ12-1σ22)]
टीσ2>σ1

तो कार्लिन-रुबिन प्रमेय एक पूंछ परीक्षण से प्रत्येक के द्वारा बनाम एच : σ < σ 0 और एच 0 : σ = σ 0 बनाम एच : σ < σ 0 समान रूप से सबसे शक्तिशाली है। जाहिर है वहाँ का कोई UMP परीक्षण है एच 0 : σ = σ 0 बनाम एच : σ σ 0 । जैसा कि यहां चर्चा की गई हैएच0:σ=σ0एच:σ<σ0एच0:σ=σ0एच:σ<σ0एच0:σ=σ0एच:σσ0, दोनों एक पूंछ परीक्षण करने और दोनों पूंछ में समान रूप से आकार अस्वीकृति क्षेत्रों के साथ आमतौर पर इस्तेमाल किया परीक्षण करने के लिए एक बहु-तुलना सुधार होता है को लागू करने, और यह काफी उचित है जब आप या तो है कि दावा करने के लिए जा रहे हैं या कि σ < σ 0 जब आप अशक्त अस्वीकार करते हैं।σ>σ0σ<σ0

अगला तहत likelihoods के अनुपात को खोजने , की अधिकतम संभावना अनुमान σ , और σ = σ 0 :σ=σ^σσ=σ0

जैसा कि σ 2 = टी , लॉग संभावना अनुपात परीक्षण आंकड़ा है( σ ;टी,एन)-(σ0;टी,एन)=nσ^2=टीn

(σ^;टी,n)-(σ0;टी,n)=n2[लॉग(nσ02टी)+टीnσ02-1]

यह मात्र निर्धारण के लिए एक अच्छा आंकड़ा है कितना डेटा समर्थन से अधिक एच 0 : σ = σ 0 । और संभावना अंतराल अनुपात के परीक्षण से बनने वाले विश्वास अंतराल के पास आकर्षक संपत्ति होती है जो अंतराल के अंदर सभी पैरामीटर मानों को बाहर की तुलना में अधिक संभावना होती है। दो बार लॉग-लाइबिलिटी अनुपात के विषम वितरण को अच्छी तरह से जाना जाता है, लेकिन एक सटीक परीक्षण के लिए, आपको इसके वितरण को काम करने की आवश्यकता नहीं है - बस प्रत्येक पूंछ में टी के संबंधित मूल्यों की पूंछ संभावनाओं का उपयोग करें ।एच:σσ0एच0:σ=σ0टी

यदि आपके पास एक समान रूप से सबसे शक्तिशाली परीक्षण नहीं हो सकता है, तो आप एक ऐसा विकल्प चाहते हैं जो शून्य के निकटतम विकल्पों के खिलाफ सबसे शक्तिशाली हो। के संबंध में लॉग-संभावना समारोह के व्युत्पन्न का पता लगाएं -इस स्कोर समारोह:σ

(σ;टी,n)σ=टीσ3-nσ

पर इसका परिमाण का मूल्यांकन के एक स्थानीय स्तर पर सबसे शक्तिशाली परीक्षण देता एच 0 : σ = σ 0 बनाम एच : σ σ 0 । क्योंकि परीक्षण के आंकड़े नीचे दिए गए हैं, छोटे नमूनों के साथ अस्वीकृति क्षेत्र ऊपरी पूंछ तक सीमित हो सकता है। फिर से, स्क्वार्ड स्कोर के स्पर्शोन्मुख वितरण को अच्छी तरह से जाना जाता है, लेकिन आप उसी तरह से सटीक परीक्षण प्राप्त कर सकते हैं जैसे एलआरटी के लिए।σ0एच0:σ=σ0एच:σσ0

एक अन्य दृष्टिकोण निष्पक्ष परीक्षण के लिए आपका ध्यान सीमित करने के लिए है, इसके लिए जो किसी भी विकल्प के तहत शक्ति आकार से अधिक है। अपने पर्याप्त आंकड़े की जांच करें कि घातीय परिवार में एक वितरण है; फिर एक आकार के लिए परीक्षण, φ ( टी ) = 1 यदि टी < 1 या टी > 2 , और φ ( टी ) = 0 , तो आप को हल करके समान रूप से सबसे शक्तिशाली निष्पक्ष परीक्षण पा सकते हैं ( φ ( टी ) )αφ(टी)=1टी<सी1टी>सी2φ(टी)=0

(φ(टी))=α(टीφ(टी))=αटी

एक प्लॉट पूर्वाग्रह को समान पूंछ वाले क्षेत्रों के परीक्षण में दिखाने में मदद करता है और यह कैसे उत्पन्न होता है:

विकल्प के खिलाफ परीक्षण की शक्ति का प्लॉट

σσ0

निष्पक्ष होना अच्छा है; लेकिन यह स्व-स्पष्ट नहीं है कि विकल्प के भीतर पैरामीटर स्पेस के एक छोटे से क्षेत्र पर आकार की तुलना में थोड़ी कम शक्ति होना इतना बुरा है जितना कि एक परीक्षण को पूरी तरह से खारिज करना।

उपरोक्त दो पूंछ वाले परीक्षणों में से दो संयोग हैं (इस मामले के लिए, सामान्य रूप से नहीं):

एलआरटी निष्पक्ष परीक्षण के बीच यूएमपी है। ऐसे मामलों में जहां यह सच नहीं है LRT अभी भी asymptotically निष्पक्ष हो सकता है।

मुझे लगता है कि सभी, यहां तक ​​कि एक-पूंछ वाले परीक्षण, स्वीकार्य हैं, यानी सभी विकल्पों के तहत अधिक शक्तिशाली या शक्तिशाली के रूप में कोई परीक्षण नहीं है - आप केवल एक दिशा में विकल्पों के खिलाफ परीक्षण को अधिक शक्तिशाली बना सकते हैं, इसे दूसरे में विकल्पों के मुकाबले कम शक्तिशाली बना सकते हैं। दिशा। जैसे-जैसे नमूना आकार बढ़ता है, चि-वर्ग वितरण अधिक से अधिक सममित हो जाता है, और सभी दो-पूंछ वाले परीक्षण बहुत समान हो जाएंगे (आसान समान-पूंछ वाले परीक्षण का उपयोग करने का दूसरा कारण)।

समग्र अशक्त परिकल्पना के साथ, तर्क थोड़ा और जटिल हो जाते हैं, लेकिन मुझे लगता है कि आप व्यावहारिक रूप से एक ही परिणाम प्राप्त कर सकते हैं, म्यूटिस म्यूटेंडिस। ध्यान दें कि एक नहीं, बल्कि एक-पूंछ वाले परीक्षणों में से एक UMP है!


Scortchi आपके उत्तर के लिए धन्यवाद। मुझे अभी भी कुछ संदेह है, हालांकि। सबसे पहले, आप निम्नलिखित वाक्य पर थोड़ा और विस्तार कर सकते हैं? «कई-तुलनात्मक सुधारों को लागू करने से दोनों पूंछों में समान आकार के अस्वीकृति वाले क्षेत्रों के साथ आमतौर पर इस्तेमाल किया जाने वाला परीक्षण होता है, और यह काफी उचित होता है जब आप या तो you're> σ0 या कि σ <σ0 का दावा करते हैं जब आप अशक्त को अस्वीकार करते हैं।» इसके अलावा आप यह क्यों कहते हैं कि यह उचित है? मुझे लगता है कि अगर मैं गलत नहीं हूं तो यह मेरे सवाल का मूल है। ;)
समुद्र में एक बूढ़ा आदमी।

मैंने इस पैराग्राफ को आप से जुड़े उत्तर से पढ़ा, लेकिन मैंने इसे अच्छी तरह से नहीं समझा था «सबसे कम एक-पूंछ वाले पी-मूल्य को दो-पूंछ वाले परीक्षणों को करने के लिए कई-तुलनात्मक सुधार के रूप में देखा जा सकता है।» यदि आप कृपया इसे थोड़ा और समझा सकते हैं तो मैं आपका आभारी रहूँगा। ;)
समुद्र में एक बूढ़ा आदमी।

α/2αα

1

इस मामले में, विकल्प एक द्विपक्षीय समग्र परिकल्पना होने के साथ आमतौर पर कोई यूएमपी परीक्षण नहीं होता है।

मुझे यकीन नहीं है कि अगर यह सामान्य रूप से सच है। निश्चित रूप से, बहुत से शास्त्रीय परिणाम (नेयोन-पियर्सन, कार्लिन-रूबिन) सरल या एक तरफा परिकल्पना पर आधारित हैं, लेकिन दो-तरफा समग्र परिकल्पना के सामान्यीकरण मौजूद हैं। आप यहाँ पर कुछ नोट्स पा सकते हैं , और यहाँ पाठ्यपुस्तक में अधिक चर्चा कर सकते हैं ।

χ2


3
σ0
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.