भविष्य कहनेवाला अनुमान लगाने के लिए कौन से गैर-बायेसियन तरीके हैं?


22

बायेसियन अनुमान में भविष्य के डेटा के लिए एक भविष्यवाणिय वितरण अज्ञात मापदंडों को एकीकृत करके प्राप्त किया जाता है; उन मापदंडों के पीछे वितरण पर एकीकरण से पहले से देखे गए लोगों पर भविष्य के डेटा सशर्त के लिए एक भविष्यवाणिय वितरण - भविष्यवाणिय वितरण मिलता है। भविष्य कहनेवाला अनुमान के लिए गैर-बायेसियन तरीके क्या हैं जो पैरामीटर अनुमानों में अनिश्चितता को ध्यान में रखते हैं (यानी जो अधिकतम-अधिकतम अनुमानों को प्लग नहीं करते हैं या जो एक घनत्व फ़ंक्शन में वापस आते हैं)?

हर कोई जानता है कि एक रेखीय प्रतिगमन के बाद भविष्यवाणी अंतराल की गणना कैसे की जाती है, लेकिन गणना के पीछे सिद्धांत क्या हैं और उन्हें अन्य स्थितियों में कैसे लागू किया जा सकता है (उदाहरण के लिए डेटा के दर पैरामीटर का आकलन करने के बाद एक नए घातीय चर के लिए सटीक भविष्यवाणी अंतराल की गणना)?


6
मुझे लगता है कि यह एक महान प्रश्न है, और मैं कम से कम एक आंशिक उत्तर देना चाहता हूं, लेकिन मुझे शायद इसे थोड़ी देर के लिए न्याय करने का समय नहीं मिलेगा ... इसलिए मैं इस पर एक इनाम रखने जा रहा हूं ।
Glen_b -Reinstate मोनिका सेप

3
@ DavidC.Norris मैं यह नहीं देखता कि किसी को इस बात पर जोर देने की आवश्यकता होगी कि इसके अलावा पैरामीटर अनिश्चितता के किसी अन्य स्रोत की क्या आवश्यकता है (जो कि अनुमान के अनुमान का अनुमान है कि दोनों और इस प्रक्रिया में यादृच्छिक परिवर्तनशीलता की आवश्यकता होगी)। उदाहरण के लिए, पोइसन या नकारात्मक द्विपद प्रतिगमन से भविष्यवाणियों के योग के लिए भविष्यवाणी अंतराल का उत्पादन करने की कोशिश करें। यह भी मानने की आवश्यकता नहीं है कि श्रेणियों के मापदंडों में भिन्नता है (जैसे कि लोग मिश्रित मॉडल का उपयोग करते हैं)।
Glen_b -Reinstate मोनिका

2
@ DavidC.Norris: मैंने गैर-बायेसियन तरीकों के बारे में पूछा क्योंकि केवल पश्चवर्ती भविष्यवाणियों के वितरण को बायेसियन आंकड़ों के हर परिचय में शामिल किया गया है, जबकि भविष्यवाणी अंतराल की गणना के लिए सामान्य निरंतरवादी तरीके व्यापक रूप से ज्ञात नहीं हैं।
Scortchi - को पुनः स्थापित मोनिका

2
@EngrStudent, बूटस्ट्रैपिंग मूल डेटा को फिर से शुरू करके काम करता है, और इसलिए अन्य श्रेणीवादी तरीकों के समान श्रेणी में आता है जो केवल अनिश्चितता के स्रोत के रूप में नमूना भिन्नता के साथ सौदा करते हैं। यह अनिश्चितता की अवधारणा का विस्तार नहीं करता है।
डेविड सी। नोरिस

3
@ डेविडसी.नोरिस: यह अनिश्चितता के स्रोत के रूप में नमूना भिन्नता है - मापदंडों के बारे में अनुमान के बजाय भविष्य की टिप्पणियों की भविष्यवाणियों को प्रभावित करने के रूप में - कि मैं यहां से संबंधित हूं, गैर-बेशियन तरीकों के बजाय अन्य प्रकार की अनिश्चितता को ध्यान में रखना।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


20

गैर-बायेसियन पूर्वानुमानात्मक अनुमान (एसएलआर मामले के अलावा) एक अपेक्षाकृत हाल का क्षेत्र है। "गैर-बेसेसियन" के शीर्षक के तहत हम उन दृष्टिकोणों को तोड़ सकते हैं जो "शास्त्रीय" अक्सरवादी बनाम हैं जो "संभावना" आधारित हैं।

शास्त्रीय आवृत्तिवादी भविष्यवाणी

αβ

अब, मेरे पास आम तौर पर इस बात के मुद्दे हैं कि कैसे शास्त्रीय पीआई को प्रस्तुत किया जाता है और अधिकांश सांख्यिकी पाठ्यक्रमों में पढ़ाया जाता है, क्योंकि भारी प्रवृत्ति इनकी व्याख्या बायेसियन पोस्टीरियर प्रेडिक्टिव अंतराल के रूप में करती है, जो कि वे निश्चित रूप से नहीं हैं। सबसे मौलिक रूप से, वे विभिन्न संभावनाओं के बारे में बात कर रहे हैं! बायेशियन अपनी मात्रा के बार-बार नमूने के प्रदर्शन पर कोई दावा नहीं करते हैं (अन्यथा, वे आवृत्तियों होंगे)। दूसरा, एक बायसियन पीआई वास्तव में एक शास्त्रीय टॉलरेंस इंटरवल की तुलना में एक शास्त्रीय सहिष्णुता अंतराल की भावना के समान कुछ और पूरा कर रहा है।

संदर्भ के लिए: सहिष्णुता अंतराल को दो संभावनाओं द्वारा निर्दिष्ट करने की आवश्यकता है : आत्मविश्वास और कवरेज। आत्मविश्वास हमें बताता है कि दोहराया नमूनों में यह कितनी बार सही है। कवरेज हमें बताता है कम से कम संभावना उपाय के तहत अंतराल के सच वितरण (के रूप में पीआई, जो देता है के लिए विरोध की उम्मीद दोहराया नमूने के तहत संभावना उपाय ... फिर से)। यह मूल रूप से बेयसियन पीआई के रूप में अच्छी तरह से करने की कोशिश कर रहा है, लेकिन बिना किसी दोहराए-नमूने के दावों के।

तो, आँकड़े 101 सरल रैखिक प्रतिगमन का मूल तर्क सामान्यता की धारणा के तहत पीआई के दोहराया नमूना गुणों को प्राप्त करना है। इसका अक्सर होने वाला + गौसियन दृष्टिकोण जिसे आमतौर पर "शास्त्रीय" माना जाता है और इंट्रो सांख्यिकी कक्षाओं में पढ़ाया जाता है। यह परिणामी गणना की सादगी पर आधारित है ( विकिपीडिया को एक अच्छे अवलोकन के लिए देखें )।

गैर-गाऊसी संभावना वितरण आम तौर पर समस्याग्रस्त होते हैं, क्योंकि वे एक अंतराल प्राप्त करने के लिए बड़े पैमाने पर महत्वपूर्ण मात्रा में कमी कर सकते हैं। इसलिए, इन वितरणों के लिए कोई "सटीक" तरीका नहीं है, अक्सर क्योंकि अंतराल के गुण सच्चे अंतर्निहित मापदंडों पर निर्भर करते हैं।

इस अक्षमता को स्वीकार करते हुए, संभावना के दृष्टिकोण के साथ भविष्यवाणी का एक और वर्ग उत्पन्न हुआ (और अनुमान और अनुमान)।

संभावना आधारित आविष्कार

संभावना आधारित दृष्टिकोण, कई आधुनिक सांख्यिकीय अवधारणाओं की तरह, रोनाल्ड फिशर का पता लगाया जा सकता है। इस स्कूल का मूल विचार यह है कि विशेष मामलों को छोड़कर, हमारे सांख्यिकीय निष्कर्ष तार्किक रूप से कमजोर जमीन पर होते हैं, जब हम सामान्य वितरण (जिसका पैरामीटर अनुमान ऑर्थोगोनल होते हैं ) से अनुमानों के साथ काम कर रहे हैं , जहां हम सटीक संभावना बयान कर सकते हैं। निष्कर्ष के इस दृष्टिकोण में, किसी को वास्तव में सटीक स्थिति को छोड़कर संभावना के बारे में बयानों से बचना चाहिए, अन्यथा, किसी को संभावना के बारे में बयान देना चाहिए और स्वीकार करना चाहिए कि किसी को त्रुटि की सटीक संभावना नहीं पता है (अक्सर अर्थ में)।

इसलिए, हम बायेसियन संभावना के समान होने के रूप में संभावना देख सकते हैं, लेकिन बिना पूर्णता की आवश्यकताओं के साथ या लगातार संभावना के साथ संभावित भ्रम के बिना। इसकी व्याख्या पूरी तरह से व्यक्तिपरक है ... हालांकि एकल पैरामीटर अनुमान के लिए अक्सर 0.15 की संभावना अनुपात की सिफारिश की जाती है।

हालांकि, किसी को अक्सर ऐसे पेपर नहीं दिखाई देते हैं जो स्पष्ट रूप से "संभावना अंतराल" देते हैं। क्यूं कर? ऐसा प्रतीत होता है कि यह काफी हद तक समाजशास्त्र का विषय है, क्योंकि हम सभी संभावना-आधारित विश्वास कथनों के आदी हो गए हैं। इसके बजाय, जो आप अक्सर देखते हैं वह एक "अनुमानित" या "असममित" आत्मविश्वास अंतराल और इस तरह के संदर्भ का उल्लेख है। ये अंतराल काफी हद तक संभावना के तरीकों से प्राप्त होते हैं, जहां हम समान अनुपात के एसिम्प्टोटिक ची-वर्गीय वितरण पर निर्भर होते हैं, उसी तरह जहां हम नमूना माध्य की विषमता संबंधी सामान्यता पर भरोसा करते हैं।

इस "फिक्स" के साथ अब हम "लगभग" 95% कॉन्फिडेंस रीजन का निर्माण कर सकते हैं, जिसमें लगभग बेज़ियन के रूप में बहुत तार्किक स्थिरता है।

संभावना फ्रेम में सीआई से पीआई तक

उपरोक्त संभावना दृष्टिकोण की सफलता और सहजता ने विचारों को प्रेरित किया कि कैसे इसे भविष्यवाणी तक बढ़ाया जाए। इस पर एक बहुत अच्छा सर्वेक्षण लेख यहां दिया गया है (मैं इसके उत्कृष्ट कवरेज को पुन: पेश नहीं करूंगा)। यह 1970 के दशक के अंत में डेविड हिंकले ( जेएसटीओआर ) को देखा जा सकता है , जिन्होंने इस शब्द को गढ़ा था। उन्होंने इसे बारहमासी " पियरसन के द्विपद भविष्यवाणी समस्या " पर लागू किया। मैं मूल तर्क को संक्षेप में बताऊंगा।

yyy

भविष्य कहनेवाला संभावना प्राप्त करने के लिए "उपद्रव" मापदंडों से छुटकारा पाने के लिए बुनियादी नियम इस प्रकार हैं:

  1. μ,σ
  2. यदि कोई पैरामीटर यादृच्छिक है (उदाहरण के लिए, अन्य अनबॉस्स्ड डेटा या "यादृच्छिक प्रभाव"), तो आप उन्हें एकीकृत करते हैं (जैसे बायेसियन दृष्टिकोण में)।

एक निश्चित और यादृच्छिक पैरामीटर के बीच का अंतर संभावना के अनुमान के लिए अद्वितीय है, लेकिन इसमें मिश्रित प्रभाव वाले मॉडल के कनेक्शन हैं, जहां ऐसा लगता है कि बेयसियन, लगातार, और संभावना फ्रेमवर्क टकराते हैं।

उम्मीद है कि इसने आपके प्रश्न का उत्तर "गैर-बायेसियन" भविष्यवाणी के व्यापक क्षेत्र (और उस मामले के लिए अनुमान) के बारे में दिया। चूंकि हाइपरलिंक्स बदल सकते हैं, इसलिए मैं "इन ऑल लाइकलीहुड: स्टैटिस्टिकल मॉडलिंग एंड लाइकेंस इन लाइकेलहुड" नामक पुस्तक के लिए एक प्लग भी बनाऊंगा, जिसमें गहराई से आधुनिक संभावना फ्रेमवर्क पर चर्चा होती है, जिसमें संभावना बनाम बायेसियन बनाम एपिस्टेमोलॉजिकल मुद्दों की उचित मात्रा शामिल है। अनुमान और भविष्यवाणी।


संदर्भ

  1. भविष्यवाणी अंतराल: गैर-पैरामीट्रिक तरीके । विकिपीडिया। 9/13/2015 तक पहुँचा।
  2. ब्योर्नस्टैड, जान एफ। प्रेडिक्टिव लिवेलिहुड : ए रिव्यू। सांख्यिकीविद। विज्ञान। 5 (1990), नहीं। 2, 242--254। डोई: 10.1214 / एस एस / +११७७०१२१७५। http://projecteuclid.org/euclid.ss/1177012175
  3. डेविड हिंकले। भविष्य कहनेवाला । सांख्यिकी के इतिहास वॉल्यूम। 7, नंबर 4 (जुलाई, 1979), पीपी। 718-728 द्वारा प्रकाशित: गणितीय सांख्यिकी संस्थान स्थिर URL: http://www.jstor.org/stable/2958920
  4. युदि पवन। सभी संभावना में: सांख्यिकीय मॉडलिंग और संभावना का उपयोग करना। ऑक्सफोर्ड यूनिवरसिटि प्रेस; 1 संस्करण (30 अगस्त, 2001)। आईएसबीएन -10: 0198507658, आईएसबीएन -13: 978-0198507659। विशेषकर अध्याय 5.5-5.9, 10 और 16।

5

मैं विशेष रूप से इस सवाल के लिए अपने जवाब को संबोधित करूंगा, "भविष्य कहनेवाला अनुमान के लिए गैर-बायेसियन तरीके क्या हैं जो पैरामीटर अनुमानों में अनिश्चितता को ध्यान में रखते हैं?" मैं अपने उत्तर को अर्थ के विस्तार के चारों ओर व्यवस्थित करूंगा अनिश्चितता

हमें उम्मीद है कि सांख्यिकीय विश्लेषण भविष्यवाणियों सहित विभिन्न प्रकार के दावों के लिए समर्थन प्रदान करते हैं । लेकिन हम अपने दावों के बारे में अनिश्चित हैं, और यह अनिश्चितता कई स्रोतों से उत्पन्न होती है। बारंबारतापूर्ण आंकड़े चरित्रवान रूप से संगठित होते हैं, जो कि हमारी अनिश्चितता के उस हिस्से को संबोधित करता है जो विशेष रूप से नमूने से उत्पन्न होता है । नमूनाकरण अच्छी तरह से कृषि क्षेत्र के प्रयोगों में अनिश्चितता का मुख्य स्रोत हो सकता है जो ऐतिहासिक रूप से अक्सरवादी आंकड़ों के विकास के लिए बहुत उत्तेजना प्रदान करते हैं। लेकिन कई सबसे महत्वपूर्ण वर्तमान अनुप्रयोगों में, यह मामला नहीं है। अब हम सभी प्रकार की अनिश्चितताओं के बारे में चिंता करते हैं जैसे मॉडल प्रक्षेपीकरण और विभिन्न प्रकार के पूर्वाग्रह --- जिनमें से स्पष्ट रूप से सैकड़ों (!) प्रकार के हैं [1]।

सैंडर ग्रीनलैंड का एक अद्भुत चर्चा पत्र है [2] जो बताता है कि अनिश्चितता के इन अन्य स्रोतों के लिए कितना महत्वपूर्ण हो सकता है, और इसे पूरा करने के साधन के रूप में कई-पूर्वाग्रह विश्लेषण को निर्धारित करता है । वह सिद्धांत को पूरी तरह से बायेसियन शब्दों में विकसित करता है, जो स्वाभाविक है। यदि कोई मॉडल मापदंडों के बारे में अनिश्चितता का औपचारिक, सुसंगत उपचार करना चाहता है, तो स्वाभाविक रूप से मापदंडों पर वितरण (व्यक्तिपरक) संभाव्यता वितरण का नेतृत्व किया जाता है; इस बिंदु पर आप या तो बायेसियन डेविल से हार गए हैं या बेयसियन किंगडम ऑफ हेवेन (आपके धर्म के आधार पर) में प्रवेश कर चुके हैं।

आपके प्रश्न के लिए, @Sortortchi, के बारे में कि क्या यह "गैर-बायेसियन विधियों" के साथ किया जा सकता है, [3] में एक गैर-बायेसियन वर्कअराउंड प्रदर्शित किया जाता है। लेकिन जो कोई भी अपने प्रश्न को लिखने के लिए बेयसियनवाद के बारे में पर्याप्त जानता है, वहां का उपचार बोयेशियन गणनाओं को 'धूर्तता' पर लागू करने के प्रयास के रूप में दिखेगा। दरअसल, जैसा कि लेखक स्वीकार करते हैं (पृष्ठ 4 देखें), आप किताब के अंत की ओर और अधिक उन्नत तरीकों के करीब पहुंचते हैं, उतने ही अधिक तरीके दिखते हैं, जितने आपके प्रश्न में वर्णित एकीकरण के ठीक उलट होते हैं। वे सुझाव देते हैं कि जहां वे बायेसियनवाद से विदा लेते हैं, अंततः केवल अनुमान लगाने से पहले अपने मापदंडों पर स्पष्ट पादरियों को प्रस्तुत नहीं करते हैं।

यह स्पष्ट रूप से भविष्यवाणी करने के लिए टाई करने के लिए , किसी को केवल अनुमानित मापदंडों के कार्य के रूप में 'भविष्यवाणी' की सराहना करनी चाहिए। [2] में, ग्रीनलैंड संकेतन का उपयोग करता हैθ(α), कहा पे α मॉडल मापदंडों का वेक्टर है, और θउन मापदंडों का कार्य है, जिनका अनुमान लगाया जाना है। (ग्रीनलैंड के उदाहरण के आवेदन के संदर्भ में, एक सार्थक भविष्यवाणी बिजली लाइनों को स्थानांतरित करने की नीति की कम बाल चिकित्सा ल्यूकेमिया के प्रभाव में हो सकती है।)

  1. शैवालियारस, डेविड, और जॉन पीए इयानिडिस। "साइंस मैपिंग एनालिसिस, बायोमेडिकल रिसर्च में 235 बायसेज़ की विशेषता है।" जर्नल ऑफ़ क्लिनिकल एपिडेमियोलॉजी 63, सं। 11 (नवंबर 2010): 1205-15 doi: 10.1016 / j.jclinepi.2009.12.011।

  2. ग्रीनलैंड, सैंडर। "अवलोकन डेटा के विश्लेषण के लिए कई-पूर्वाग्रह मॉडलिंग (चर्चा के साथ)।" रॉयल सांख्यिकीय सोसायटी के जर्नल: सीरीज ए (सोसायटी में सांख्यिकी) 168, सं। 2 (मार्च 2005): 267-306। डोई: 10.1111 / j.1467-985X.2004.00349.x।

  3. लैश, टिमोथी एल।, मैथ्यू पी। फॉक्स और एलिजा के। फिंक। महामारी विज्ञान डेटा के लिए मात्रात्मक पूर्वाग्रह विश्लेषण लागू करना। जीव विज्ञान और स्वास्थ्य के लिए आँकड़े। न्यूयॉर्क, एनवाई: स्प्रिंगर न्यूयॉर्क, 2009. http://link.springer.com/10.1007/978-0-387-87959-8


2
धन्यवाद! यह बहुत दिलचस्प लगता है, लेकिन मुझे लगता है कि यह उपयोगी होगा यदि आप एक संक्षिप्त रूपरेखा जोड़ सकते हैं कि पूर्वानुमानात्मक अनुमान में कितने / मात्रात्मक पूर्वाग्रह विश्लेषण का उपयोग किया जाता है।
Scortchi - को पुनः स्थापित मोनिका

मैंने भविष्यवाणी से संबंध स्पष्ट करने के लिए एक अनुच्छेद जोड़ा है । स्पष्टीकरण के लिए आपके अनुरोध के लिए धन्यवाद, @Scortchi।
डेविड सी। नोरिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.