किसी चीज के लगातार अच्छे गुण होने का क्या मतलब है?


12

मैंने अक्सर इस वाक्यांश को सुना है, लेकिन कभी भी पूरी तरह से समझ में नहीं आया कि इसका क्या मतलब है। वाक्यांश "अच्छे लगातार गुण" में वर्तमान में Google पर ~ 2750 हिट्स, 536 scholar.google.com पर, और 4 परysts.stackexchange.com है

सबसे स्पष्ट बात जो मुझे स्पष्ट रूप से मिली, वह स्टैनफोर्ड यूनिवर्सिटी की प्रस्तुति में अंतिम स्लाइड से आई है , जिसमें कहा गया है

[टी] वह ९ ५% आत्मविश्वास अंतराल की रिपोर्ट करने का अर्थ यह है कि आप ९ ५% दावों में सच्चे पैरामीटर "ट्रैप" करते हैं, यहां तक ​​कि विभिन्न अनुमान समस्याओं में भी। यह अच्छे क्रमिक गुणों के साथ अनुमान प्रक्रियाओं की परिभाषित विशेषता है: वे बार-बार उपयोग किए जाने पर जांच तक करते हैं।

इस पर थोड़ा चिंतन करते हुए, मुझे लगता है कि वाक्यांश "अच्छा लगातार गुण" का तात्पर्य एक बायेसियन विधि के कुछ आकलन से है, और विशेष रूप से अंतराल निर्माण की एक बायेसियन विधि। मैं समझता हूं कि बायेसियन अंतराल का मतलब संभावना साथ पैरामीटर का सही मूल्य शामिल करना है । फ़्रीक्वेंटिस्ट अंतराल का निर्माण इस तरह से किया जाता है जैसे कि अगर इंटरवल निर्माण की प्रक्रिया को कई बार के बारे में दोहराया गया तो अंतराल का सही मान होगा। बायेसियन अंतराल सामान्य रूप से कोई वादा नहीं करते हैं कि अंतराल के कितने% पैरामीटर के वास्तविक मूल्य को कवर करेंगे। हालाँकि, कुछ बायेसियन विधियों में भी संपत्ति होती है जिसे यदि कई बार दोहराया जाता है तो वे के सही मूल्य को कवर करते हैंp 100 % p 100 %pp100%p100%समय की। जब उनके पास वह संपत्ति होती है, तो हम कहते हैं कि उनके पास "अच्छे लगातार गुण" हैं।

क्या वह सही है? मेरा यह मानना ​​है कि इससे भी अधिक होना चाहिए, क्योंकि वाक्यांश एक अच्छा निरंतर गुण होने के बजाय अच्छे निरंतर गुणों को संदर्भित करता है ।


1
मैं वास्तव में जिस तरह से आप इस सवाल से बाहर सोचा था। शुरुआती दिनों में सर हेरोल्ड जेफ़रीज़ ने बेसेसियन पोस्टीरियर डिस्ट्रिब्यूशन का निर्माण करने की कोशिश की, जो संभावना कार्यों की तरह व्यवहार करते थे और इसलिए उनके पास लगातार अच्छे गुण थे। तो यह एक "वर्दी" पूर्व वितरण का निर्माण करने के लिए मात्रा। विचार यह है कि इस तरह के पूर्व साधनों का उपयोग करना पूर्व उदासीन है और अनुमान को प्रभावित नहीं करता है। इसलिए यह विश्वसनीय अंतरालों की तरह दिखने वाले भरोसेमंद अंतरालों को लागू करने से अधिक लागू होता है। लेकिन जेफ्रीज़ कुछ परेशानी में भाग गया क्योंकि ऐसे मामले थे जहां "वर्दी" पूर्व उचित नहीं थी।
माइकल आर। चेर्निक

1
अनुचित का अर्थ है कि पूर्व घनत्व 1 से एकीकृत नहीं होता है। ऐसा लगता है कि जेफ्रीस का मानना ​​था कि बायेसियन पद्धति को लगातार पद्धति से सहमत होने के द्वारा उचित ठहराया जाना चाहिए। बायेसियन ने अंततः इस धारणा को खारिज कर दिया क्योंकि वे जिस दृष्टिकोण का दावा करते हैं उसका मूल्य यह है कि पूर्व सूचना है जो प्रभाव को प्रभावित करती है और इसलिए वे उचित "सूचनात्मक" पुजारियों का उपयोग करना पसंद करते हैं।
माइकल आर। चेर्निक

2
@MichaelChernick: क्या आप बेयर्स अनुमानकों के लिए लगातार संपत्तियों की तलाश करने वाले जेफ्री के बारे में एक सटीक संदर्भ प्रदान कर सकते हैं? मैंने यह कहानी कभी नहीं सुनी। और मुझे यह भी संदेह है कि जेफरीस अनुचित पुरोहितों का उपयोग करने के बारे में चिंतित थे, वे सभी थ्योरी ऑफ प्रोबेबिलिटी पर हैं
शीआन

मैं इस सवाल से प्यार करता हूँ !
एलेक्सिस

1
@ शीआन तथ्य की बात के रूप में, बीटा-बिनोमियल मॉडल के लिए यह हल्दाने से पहले (जो कि अनुचित है) वह है जो बार-बार होने वाले अनुमान की ओर जाता है, न कि जेफ्रीस से पहले (जो इस मामले में उचित है)। मैंने यह भी कभी नहीं सुना है कि जेफरीज़ लगातार अच्छे गुणों की तलाश में थे: मुझे लगा कि वह उद्देश्य पुजारियों की तलाश कर रहे थे, और उद्देश्य से उनका मतलब था पुनर्मूल्यांकन के तहत अपरिवर्तनीय।
डेल्टिव डे

जवाबों:


3

अच्छे लगातार गुणों के बारे में एक मुश्किल बात यह है कि वे एक विशेष परिणाम या अनुमान के गुणों के बजाय एक प्रक्रिया के गुण हैं। एक अच्छी क्रमिक प्रक्रिया लंबे समय में मामलों के निर्दिष्ट अनुपात पर सही अनुमान लगाती है, लेकिन एक अच्छी बायेसियन प्रक्रिया अक्सर वह होती है जो प्रश्न में अलग-अलग मामलों में सही अनुमानों का उत्पादन करती है।

उदाहरण के लिए, एक बायेसियन प्रक्रिया पर विचार करें जो सामान्य अर्थ में "अच्छा" है क्योंकि यह एक पश्च संभाव्यता वितरण या विश्वसनीय अंतराल की आपूर्ति करता है जो पूर्व संभाव्यता वितरण के साथ साक्ष्य (संभावना समारोह) के संयोजन का सही प्रतिनिधित्व करता है। यदि पूर्व में सटीक जानकारी होती है (जैसे, खाली राय या किसी प्रकार की अनइनफॉर्मेटिव पूर्व के रूप में), तो पीछे या अंतराल के परिणामस्वरूप एक ही डेटा के लगातार परिणाम की तुलना में बेहतर निष्कर्ष हो सकता है। इस विशेष मामले या संकीर्ण अनुमान अंतराल के बारे में अधिक सटीक अनुमान के लिए अग्रणी के अर्थ में बेहतर है क्योंकि प्रक्रिया सटीक जानकारी वाले एक स्वनिर्धारित पूर्व का उपयोग करती है। लंबे समय के अंतराल में कवरेज प्रतिशत और अनुमानों की शुद्धता प्रत्येक पूर्व की गुणवत्ता से प्रभावित होती है।

ध्यान दें कि प्रक्रिया निर्दिष्ट नहीं करती है कि पूर्व को कैसे प्राप्त किया जाए और इसलिए प्रदर्शन के लंबे समय तक चलने का लेखा-जोखा, संभवतः, प्रत्येक मामले के लिए पहले से डिज़ाइन किए गए कस्टम-डिज़ाइन के बजाय किसी भी पुराने को पहले से मान लें।

एक बायेसियन प्रक्रिया में अच्छे लगातार गुण हो सकते हैं। उदाहरण के लिए, कई मामलों में एक नुस्खा प्रदान की गई अनइंफॉर्मेटिव पूर्व के साथ एक बायेसियन प्रक्रिया उत्कृष्ट लगातार गुणकारी गुणों के लिए काफी अच्छी होगी। उन अच्छे गुणों को डिजाइन सुविधा के बजाय एक दुर्घटना होगी, और ऐसी प्रक्रिया का सीधा परिणाम होगा जो लगातार प्रक्रियाओं के समान अंतराल पैदा करता है।

इस प्रकार एक बायेसियन प्रक्रिया लंबे समय में खराब लगातार गुण होने के दौरान एक व्यक्तिगत प्रयोग में बेहतर हीन गुण हो सकती है। समान रूप से, अच्छे लंबे समय के लगातार संपत्तियों के साथ अक्सर होने वाली प्रक्रियाएं अक्सर व्यक्तिगत प्रयोगों के मामले में खराब प्रदर्शन होती हैं।


2
मैं अनुसरण नहीं करता। अनुभवजन्य Bayes को छोड़कर, सभी Bayesian प्रक्रियाओं में मैंने देखा कि पूर्व डेटा के स्वतंत्र रूप से चुना गया है। इस प्रकार, एक ही डेटा जनरेट करने की प्रक्रिया से आने वाले मल्टीपल डेटा सेट पर इस तरह की प्रक्रिया को लागू करते समय (यह अक्सर फ्रेमवर्क है) बायेसियन एक ही संभावना फ़ंक्शन (डेटा जेनरेट करने की प्रक्रिया समान होती है) का उपयोग करेगा और एक ही पूर्व (पूर्व है) अधिकांश बेय प्रक्रियाओं में डेटा से स्वतंत्र)। बेशक हर बार डेटा बदलने के बाद, संभावना का मूल्य बदल जाता है, लेकिन इसका रूप समान है। अब, यदि प्रत्येक व्यक्ति [१/२]
डेल्टा डिव

2
[२/२] अनुमान अधिक सटीक है, पूरी प्रक्रिया कम सटीक कैसे हो सकती है? यह केवल तभी संभव है जब बायेसियन का अनुमान हमेशा अधिक सटीक न हो। हालाँकि, चूंकि पूर्व में देखे गए डेटा को अनुकूलित नहीं किया गया है, इसलिए मुझे यकीन नहीं है कि यह प्रत्येक एकल मामले और / या "औसतन" के लिए कम या ज्यादा सटीक है।
डेल्टा डिविज़न

@ डेल्टवा मुझे लगता है कि आप गलत संदर्भ सेट के साथ काम कर रहे हैं। किसी प्रक्रिया के बारंबार गुण सभी नए मामलों में लागू प्रक्रिया के लंबे समय के प्रदर्शन से संबंधित हैं, न कि केवल विशेष प्रयोग को दोहराते हैं। इसीलिए द्विपद अनुपात के लिए आत्मविश्वास अंतराल प्रक्रियाएं पैरामीटर के सभी मूल्यों के लिए काम करना है, न कि किसी विशेष उदाहरण के लिए प्रासंगिक मूल्य के लिए जहां प्रक्रिया का उपयोग किया जाता है। उस प्रकार के 'लॉन्ग रन' का अर्थ है कि प्रश्न में मामले के लिए उपयुक्त पूर्वनिर्धारित, लंबे समय के लिए अनुपयुक्त होगा।
माइकल लेव

आप सही हैं कि एक निरंतर विश्वास प्रक्रिया में अज्ञात पैरामीटर के सभी मूल्यों के लिए नाममात्र कवरेज होना चाहिए। यह न्यूमैन और पियर्सन द्वारा स्पष्ट रूप से निर्दिष्ट किया गया था, और आज अक्सर इसकी अनदेखी की जाती है। हालाँकि, जब आप पूर्व चुनते हैं, तो आप यह नहीं जानते कि पैरामीटर का "सही" मान क्या है। आपके पास केवल आपका नमूना है, और पूर्व नमूना से स्वतंत्र होना चाहिए। इस प्रकार मैं अभी भी स्पष्ट रूप से नहीं देख पा रहा हूं कि आप नमूने के आधार पर पूर्वनिर्धारित कैसे कर सकते हैं क्या आप एक व्यावहारिक उदाहरण बना सकते हैं?
डेल्टा डिविज़न

@ डेल्टिव अगर मुझे पता है कि पिछले अध्ययन में ब्याज के मौजूदा पैरामीटर का अनुमान लगाया गया है, तो मैं उस अनुमान के आधार पर एक सूचनात्मक पूर्व आकार दे सकता हूं। इस वर्तमान विश्लेषण के लिए पूर्व उपयुक्त होगा, लेकिन लंबे समय में विधि के अनुप्रयोगों के संवैधानिक सेट के लिए एक समान उपयुक्त जानकारीपूर्ण पूर्व उपलब्ध नहीं है। इस प्रकार विश्लेषण में अलग-अलग वास्तविक मामले में बहुत बेहतर गुण हो सकते हैं, जैसे कि यह लगातार लंबे समय तक चलता है।
माइकल लुईस

2

मैं जवाब दूंगा कि आपका विश्लेषण सही है। कुछ और अंतर्दृष्टि प्रदान करने के लिए, मैं मिलान करने वाले पुजारियों का उल्लेख करूंगा।

मिलान करने वाले पादरी आम तौर पर एक प्रायोजक संपत्ति के साथ बायेसियन मॉडल बनाने के लिए डिज़ाइन किए गए पुजारी होते हैं। विशेष रूप से, उन्हें परिभाषित किया जाता है ताकि प्राप्त एचपीडी अंतराल आत्मविश्वास अंतराल के लगातार कवरेज को पूरा करें (इसलिए 95% एचपीडी के 95% लंबे समय पर सही मान होते हैं)। ध्यान दें कि, 1 डी में, विश्लेषणात्मक समाधान हैं: जेफ़रीज़ पुजारी मेलर्स से मेल खा रहे हैं। उच्च आयाम में, यह आवश्यक नहीं है (मेरे ज्ञात करने के लिए, यह साबित करने का कोई परिणाम नहीं है कि यह मामला कभी नहीं है)।

व्यवहार में, इस मिलान सिद्धांत को कभी-कभी एक मॉडल के कुछ मापदंडों के मूल्य को ट्यून करने के लिए भी लागू किया जाता है: जमीनी सच्चाई डेटा का उपयोग इन मापदंडों को इस अर्थ में अनुकूलित करने के लिए किया जाता है कि उनके मान ब्याज के पैरामीटर के लिए परिणामी विश्वसनीय अंतराल के लगातार कवरेज को अधिकतम करते हैं। । मेरे अपने प्रयोग से, यह एक बहुत ही सूक्ष्म कार्य हो सकता है।


0

पी

अब, आपके प्रश्न का उत्तर देने के लिए: नहीं, यह बायेसियन पद्धति का कोई आकलन नहीं करता है। बारीकियों को छोड़ना और इसे सरल रखने के लिए आकलन प्रक्रिया में ध्यान केंद्रित करना: आंकड़ों में अक्सरवाद यह है कि अज्ञात निश्चित मात्रा का अनुमान लगाने, या एक परिकल्पना का परीक्षण करने और इसके बारे में एक काल्पनिक दोहराव के खिलाफ ऐसी प्रक्रिया का मूल्यांकन करने का विचार है। किसी प्रक्रिया का मूल्यांकन करने के लिए आप कई मानदंड अपना सकते हैं। क्या यह एक लगातार मानदंड है कि एक के बारे में परवाह करता है अगर कोई एक ही प्रक्रिया को बार-बार अपनाता है। यदि आप ऐसा करते हैं, तो आप लगातार गुणों के बारे में परवाह करते हैं। दूसरे शब्दों में: "लगातार गुण क्या हैं?" अगर हम प्रक्रिया को बार-बार दोहराते हैं तो क्या होता है? अब, इस तरह के लगातार गुण अच्छे क्या बनाते हैंमापदंड की एक और परत है। सबसे आम बार-बार होने वाले गुण जो अच्छे गुण माने जाते हैं वे हैं संगति (एक अनुमान में, यदि आप नमूना रखते हैं तो अनुमानक आपके द्वारा निर्धारित मूल्य के अनुरूप होगा), दक्षता (यदि आप नमूना रखते हैं, तो अनुमानक का विचरण शून्य पर जाएगा , तो आप अधिक से अधिक सटीक होंगे), कवरेज संभावना(प्रक्रिया के कई दोहराव में, 95% विश्वास अंतराल में समय का सही मूल्य 95% होगा)। पहले दो को बड़े नमूना गुण कहा जाता है, तीसरा नेमन-जेनुइनली लगातार संपत्ति है इस अर्थ में कि इसे आवश्यक रूप से एसिम्प्टोटिक परिणामों का उपयोग करने की आवश्यकता नहीं है। तो, संक्षेप में, लगातार रूपरेखा में, एक सही और अज्ञात मूल्य है। आप इसका अनुमान लगाते हैं और आप अनुमान में हमेशा (एक दुर्लभ भाग्यशाली दुर्घटना को छोड़कर) गलत होते हैं, लेकिन आप अपने आप को बचाने की कोशिश कर रहे हैं, जो आपके अनुमान के कम से कम अनिश्चित काल के दोहराव के तहत, आप कम या कम गलत होंगे।आप जानते हैं कि आप कुछ समय के लिए सही होंगे। अगर यह समझ में आता है या नहीं, या इसे सही ठहराने के लिए आवश्यक अतिरिक्त मान्यताओं पर चर्चा नहीं करूंगा, तो यह आपके प्रश्न नहीं थे। वैचारिक रूप से, वह है जो लगातार गुणधर्मों को संदर्भित करता है, और इस तरह के संदर्भ में सामान्य रूप से कौन सा अच्छा साधन है।

मैं आपको इस पत्र को इंगित करके बंद कर दूंगा, ताकि आप अपने आप से न्याय करें कि क्या यह समझ में आता है और इसका अर्थ क्या है कि बायसी प्रक्रिया में अच्छे लगातार गुण हैं (आपको वहां अधिक संदर्भ मिलेंगे):

  • लिटिल, आर।, और अन्य, (2011)। विशेष रूप से आंकड़ों के लिए, और विशेष रूप से लापता डेटा के लिए कैलिब्रेटेड बेज़। सांख्यिकीय विज्ञान, 26 (2), 162-174।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.