पी-मूल्य की दो परिभाषाएँ: उनकी समानता कैसे साबित करें?


11

मैं लैरी वासरमैन की पुस्तक, ऑल स्टैटिस्टिक्स और वर्तमान में पी-वैल्यूज़ (पृष्ठ 187) के बारे में पढ़ रहा हूं । मुझे पहले कुछ परिभाषाएँ (मैं बोली):

परिभाषा 1 अस्वीकृति क्षेत्र के साथ एक परीक्षण की शक्ति समारोह द्वारा परिभाषित किया गया है एक परीक्षण के आकार होने के लिए परिभाषित किया गया है एक परीक्षण में कहा जाता है कि स्तर \ अल्फा है अगर उसका आकार कम या बराबर \ अल्फा से हैRα

β(θ)=Pθ(XR)
α=supθΘ0β(θ)
αα

यह मूल रूप से यह कहता है कि α , आकार I की त्रुटि की "सबसे बड़ी" संभावना है। p -value फिर (I उद्धरण) के माध्यम से परिभाषित किया गया है

परिभाषा 2 मान लीजिए कि प्रत्येक (\ 0,1) प्रत्येक \ अल्फा \ के लिएα(0,1) हमारे पास अस्वीकृति क्षेत्र आर_ \ अल्फा के साथ एक आकार α परीक्षण है । फिर, p \ text {-value} = \ inf \ {\ Alpha: T_ (X ^ n) \ _ R_ \ Alpha \} में जहाँ X ^ n = (X_1, \ dots, X_n)Rα

p-value=inf{α:T(Xn)Rα}
Xn=(X1,,Xn)

मेरे लिए इसका मतलब है: एक विशिष्ट \ अल्फा दिया गया एक αपरीक्षण और अस्वीकृति क्षेत्र Rα ताकि α=supθΘ0(α)Pθ(T(Xn)Rα) । के लिए p -value मैं बस उसके बाद इन सभी में सबसे छोटी ले α

प्रश्न 1 यदि यह मामला होगा, तो मैं स्पष्ट रूप से मनमाने ढंग से छोटे \ epsilon के लिए \ Alpha = \ epsilon चुन सकता था । परिभाषा 2 की मेरी गलत व्याख्या क्या है, इसका सही अर्थ क्या है?α=ϵϵ

अब Wasserman निरंतर है और एक प्रमेय बताता है कि पी के एक "समतुल्य" परिभाषा है pजिसके साथ मैं परिचित हूं (I उद्धरण):

प्रमेय मान लीजिए कि आकार परीक्षण फॉर्म , तो जहां की प्रेक्षित मूल्य है ।एच को अस्वीकार करना α पी -value = sup θ Θ 0 पी θ ( टी ( एक्स एन ) टी ( एक्स एन ) ) एक्स एन एक्स n

reject H0T(Xn)cα
p-value=supθΘ0Pθ(T(Xn)T(xn))
xnXn

तो यहाँ मेरा दूसरा सवाल है:

प्रश्न 2 मैं वास्तव में इस प्रमेय को कैसे सिद्ध कर सकता हूँ? शायद यह -value की परिभाषा के बारे में मेरी गलतफहमी के कारण है , लेकिन मैं इसका पता नहीं लगा सकता।p


4
यह सकारात्मक रूप से अजीब है कि Wasserman शक्ति को " " के रूप में परिभाषित करेगा , क्योंकि प्रतीक का उपयोग लगभग II त्रुटि दर के लिए सार्वभौमिक रूप से किया जाता है (अर्थात शक्ति पर चर्चा करने वाले किसी भी अन्य लेखक के लिए शक्ति = 1- )। मुझे यह जानकर मुश्किल हो रहा है कि नोटेशन के एक विकल्प की कल्पना करना भी बदतर भ्रम पैदा करने में सक्षम है, सिवाय जानबूझकर इसे पैदा करने के। β ββββ
Glen_b -Reinstate मोनिका

1
मैं मानता हूं कि यह अजीब है, ग्लेन - हालांकि, कैसला और बर्जर एक ही काम करते हैं और उनका पाठ, मेरी राय में, सांख्यिकीय सिद्धांत के लिए सोने का मानक है।
मैट ब्रेम

जवाबों:


6

हमारे पास कुछ मल्टीवेरेट डेटा , जो कुछ अज्ञात पैरामीटर साथ एक वितरण से खींचा गया है । ध्यान दें कि नमूना परिणाम हैं।D θ xxDθx

हम एक अज्ञात पैरामीटर बारे में कुछ परिकल्पना का परीक्षण करना चाहते हैं , शून्य परिकल्पना के तहत के मान सेट ।θ θ θθθ0

के स्पेस में , हम एक रिजेक्शन रीजन डिफाइन कर सकते हैं , और इस रीजन की पावर को तब रूप में परिभाषित किया जाता है। । तो शक्ति की गणना एक विशेष मान के लिए की संभावना के रूप में की जाती है कि नमूना परिणाम अस्वीकृति क्षेत्र जब का मूल्य । स्पष्ट रूप से शक्ति क्षेत्र और चुने हुए पर निर्भर करती है ।आर आर पी आर ˉ θ = पी ˉ θ ( एक्स आर ) ˉ θ θ एक्स आर θ ˉ θ आर ˉ θXRRPθ¯R=Pθ¯(xR)θ¯θxR θθ¯Rθ¯

परिभाषा 1 परिभाषित करता है क्षेत्र का आकारR के सभी मूल्यों का supremum के रूप में के लिए में , इसलिए केवल के मूल्यों के लिए तहत । जाहिर है इस, क्षेत्र पर निर्भर करता तो । ˉ θ θ 0 ˉ θ एच 0 α आर = रों यू पी ˉ θθ 0 पी आर ˉ θPθ¯Rθ¯θ0θ¯H0αR=supθ¯θ0Pθ¯R

के रूप में पर निर्भर करता है हम एक और मूल्य जब इस क्षेत्र में परिवर्तन है, और इस पी-मूल्य को परिभाषित करने के लिए आधार है: परिवर्तन क्षेत्र है, लेकिन इस तरह से है कि नमूने मनाया मूल्य अभी भी क्षेत्र के अंतर्गत आता है, के लिए ऐसे प्रत्येक क्षेत्र, गणना ऊपर परिभाषित और infimum ले: । तो पी-मान सभी क्षेत्रों का सबसे छोटा आकार है जिसमें R α R p v ( x ) = i n f R | एक्स आर α आर एक्सαRRαRpv(x)=infR|xRαRx

प्रमेय तो सिर्फ एक इसके बारे में 'अनुवाद', अर्थात् मामले में जहां क्षेत्रों है एक आंकड़ा का उपयोग कर परिभाषित कर रहे हैं और एक मूल्य के लिए यदि आप किसी क्षेत्र को परिभाषित के रूप में । यदि आप उपरोक्त तर्क में इस प्रकार के क्षेत्र का उपयोग करते हैं, तो प्रमेय इस प्रकार है।टी सी आर आर = { एक्स | टी ( एक्स ) } आरRTcRR={x|T(x)c}R

टिप्पणियों के कारण EDIT:

@ उपयोगकर्ता 8: प्रमेय के लिए; यदि आप प्रमेय के रूप में अस्वीकृति क्षेत्रों को परिभाषित करते हैं, तो आकार का अस्वीकृति क्षेत्र एक सेट है जो जैसा दिखता हैकुछ लिए ।आर α = { एक्स | टी ( एक्स ) α } ααRα={X|T(X)cα}cα

किसी देखे गए मान का p- मान , अर्थात आपको सबसे छोटा क्षेत्र , अर्थात का सबसे बड़ा मान ऐसा अभी भी समाहित है , उत्तरार्द्ध (क्षेत्र में ) समतुल्य है (जिस तरह से क्षेत्रों को परिभाषित किया गया है) यह कहने के लिए कि , इसलिए आपको ढूंढना होगा सबसे बड़ा ऐसा किp v ( x ) R c { X | टी ( एक्स ) } एक्स एक्स सी टी ( x ) { एक्स | टी ( एक्स ) सी और सी टी ( x ) }xpv(x)Rc{X|T(X)c} xxcT(x)c{X|T(X)c&cT(x)}

जाहिर है, सबसे बड़ा ऐसा कि होना चाहिए और फिर सेट supra हो जाता हैटी ( x ) = टी ( एक्स ) { एक्स | टी ( एक्स ) = टी ( x ) } = { एक्स | T ( X ) T ( x ) }ccT(x)c=T(x){X|T(X)c=T(x)}={X|T(X)T(x)}


आपके उत्तर के लिए बहुत धन्यवाद। प्रमेय की मान्यता के बारे में सवाल के लिए: क्या किसी तरह से एक ओवर गायब नहीं है? αinfα
गणित

@ user8: मैंने अपने उत्तर के अंत में एक पैराग्राफ जोड़ा, आप अब अनंत के साथ बिंदु देखते हैं?

7

परिभाषा 2 में, एक परीक्षण आंकड़ा की -value सबसे बड़ी कम सभी के लिए बाध्य है ऐसी है कि परिकल्पना आकार का एक परीक्षण के लिए अस्वीकार कर दिया है । याद रखें कि हम जितना छोटा बनाते हैं , टाइप I त्रुटि के लिए कम सहिष्णुता हम अनुमति दे रहे हैं, इस प्रकार अस्वीकृति क्षेत्र भी कम हो जाएगा। तो (बहुत) अनौपचारिक रूप से कहें, तो -value सबसे छोटा जिसे हम चुन सकते हैं कि हम अभी भी हमारे द्वारा देखे गए डेटा के लिए को अस्वीकार कर सकते हैं । हम मनमाने ढंग से एक छोटे चयन नहीं कर सकते क्योंकि कुछ बिंदु पर,α α α आर α पी α एच α आर αpαααRαpαH0αRα इतना छोटा होगा कि यह हमारे द्वारा देखी गई घटना को बाहर कर देगा (अर्थात, शामिल होने में विफल रहेगा)।

अब, उपरोक्त के प्रकाश में, मैं आपको प्रमेय पर पुनर्विचार करने के लिए आमंत्रित करता हूं।


मैं अभी भी थोड़ा भ्रमित हूं। तो पहले, परिभाषा में सभी लिए स्थिर निर्धारित है ? मैं आपके कथन से असहमत हूं: "... कुछ बिंदु पर, इतना छोटा होगा कि वह हमारे द्वारा देखी गई घटना को शामिल नहीं करेगा (अर्थात, शामिल होने में विफल रहेगा)।" पूरी तरह से ठीक है, अगर इतना छोटा है कि इसमें मनाया नमूना नहीं है, तो हम को अस्वीकार नहीं करते हैं । इससे क्या परेशानी है? मदद के लिए धन्यवाद / धैर्यटी α आर α आर α एच 2TαRαRαH0
गणित

हाँ। परीक्षण सांख्यिकीय नमूना का एक पूर्व निर्धारित निश्चित कार्य है, जहां इस अर्थ में "निश्चित" का अर्थ है कि फ़ंक्शन का रूप किसी भी लिए नहीं बदलता है । यह मूल्य (और चाहिए) नमूने पर निर्भर करता है। आपका कथन "हम को अस्वीकार नहीं करते हैं " से पता चलता है कि आपकी असहमति गलत क्यों है: परिभाषा के अनुसार , में उन सभी मानों का सेट शामिल है जिनके लिए परीक्षण आँकड़ा शून्य की अस्वीकृति की ओर जाता है । इसलिए इसे --for "R" इजेक्शन लेबल किया गया है । मैं और अधिक विस्तार से समझाने के लिए अपने उत्तर के लिए एक अपडेट पोस्ट करूंगा। α H 0 R α RTαH0RαR

आपके त्वरित उत्तर के लिए और आपके अपडेट किए गए संस्करण के लिए अग्रिम रूप से बहुत धन्यवाद। मेरा मतलब निम्नलिखित था: हम को अस्वीकार करते हैं यदि , जहां मनाया गया नमूना है। कहते हैं कि मैं बहुत चरम पर हूं और बहुत छोटा चुनता हूं , ताकि दिए गए नमूने जिसका अर्थ है कि हम को अस्वीकार नहीं करते हैं । तो एक छोटा सा isn apriori एक बुरी बात है। स्पष्ट रूप से, एक बिंदु पर यह इतना छोटा है, कि से संबंधित नमूने का निरीक्षण करने की संभावना बहुत कम है । फिर से, आपके धैर्य / मदद के लिए धन्यवाद। वास्तव में सराहनीय! टी ( एक्स एन ) आर α एक्स एन आर α टी ( एक्स एन ) आर α एच 0 आर α आर αH0T(xn)RαxnRαT(xn)RαH0RαRα
गणित

2
पी-मूल्य की दी गई परिभाषा को स्पष्ट रूप से नमूना क्षेत्र के अस्वीकृति क्षेत्र में होने के लिए परीक्षण सांख्यिकीय की आवश्यकता है । आप पी-वैल्यू की परिभाषा के उस हिस्से को बदलने के लिए स्वतंत्र नहीं हैं।
Glen_b -Reinstate मोनिका

@Glen_b टिप्पणी के लिए धन्यवाद। दरअसल, मेरी पिछली टिप्पणी परिभाषा का उल्लंघन करती है। इस पर ध्यान दिलाने के लिए धन्यवाद।
गणित 15
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.