MCMC नमूने के लिए Jeffreys या एन्ट्रापी आधारित पुजारियों का उपयोग करने के खिलाफ सिफारिशें क्यों हैं?


12

पर उनके विकि पृष्ठ , स्टेन राज्य के डेवलपर्स:

कुछ सिद्धांत हमें पसंद नहीं हैं: आक्रमणकारी, जेफ्रीज़, एन्ट्रॉपी

इसके बजाय, मुझे बहुत अधिक सामान्य वितरण अनुशंसा दिखाई देती है। अब तक मैंने बायेसियन विधियों का उपयोग किया था, जो नमूने पर भरोसा नहीं करते थे, और यह समझने में प्रसन्नता का अनुभव करते थे कि क्यों द्विपद संभावना के लिए एक अच्छा विकल्प था।θBeta(α=12,β=12)


1
सामान्य टिप्पणी: सॉफ्टवेयर प्रलेखन हमेशा सॉफ्टवेयर क्या करता है और क्या नहीं करता है के लिए सांख्यिकीय तर्कों को याद नहीं करता है। मेरे द्वारा देखे गए अधिकांश आर पैकेजों के बारे में यह सच है और मैं स्टेन के बारे में सुनकर आश्चर्यचकित नहीं हूं। एंड्रयू गेलमैन, जाहिर है, एक विपुल लेखक है।
निक कॉक्स

1
इसके अलावा सामान्य टिप्पणी: मुझे इस तरह का सवाल बहुत संतोषजनक नहीं लगता, आंशिक रूप से क्योंकि यह विशेष व्यक्तियों के बारे में है। यदि लाइव लेखक कहीं व्याख्या नहीं करते हैं, और स्पष्ट रूप से यहां सक्रिय नहीं हैं, तो उन्हें पूछने के लिए एक ईमेल भेजें। विभिन्न दृष्टिकोणों के सापेक्ष गुणों के बारे में अमूर्त में पूछना अधिक संतोषजनक है। कभी-कभी यह कहना उचित होता है कि यदि आप किसी चीज़ को गायब पाते हैं तो आप हमेशा अलग-अलग सॉफ़्टवेयर का उपयोग कर सकते हैं, जिसमें आपका अपना लिखना भी शामिल है। गैर-प्रकटीकरण: स्टेन का इस्तेमाल कभी नहीं किया।
निक कॉक्स

@NickCox मुझे नहीं लगता कि इस सवाल का अनामीकरण से फायदा हुआ होगा, क्योंकि (1) एक समलिंग सॉफ़्टवेयर का संदर्भ महत्वपूर्ण है (2) मेरी धारणा यह है कि जेफ्रीज़ के पुजारियों की अस्वीकृति असामान्य रूप से पर्याप्त है जो इंगित करना सार्थक है कि एक यश स्रोत है कि दावा करता है। (३) मुझे नहीं लगता कि किसी प्रश्न में किसी का हवाला देना टकराव है।
18'18

1
एंडी ने लिखा "कुछ सिद्धांत जो हमें पसंद नहीं हैं: आक्रमणकारी, जेफ्रीज़, एन्ट्रॉपी" लेकिन यह देखने के लिए कि आपको उनकी पुस्तक
बेन गुडरिक

1
इसके अलावा, इस पत्र में तीन स्टेन डेवलपर्स के बीच पुजारियों पर सबसे हाल की सोच शामिल है।
बेन गुडरिक

जवाबों:


13

यह निश्चित रूप से विविध लोगों का एक समूह है, जिनके पास एक राय है और एक विकि लिखने के लिए। मैं संक्षेप में कुछ टिप्पणी के साथ जानता / समझता हूं:

  • कम्प्यूटेशनल सुविधा के आधार पर अपने पूर्व को चुनना एक अपर्याप्त तर्क है। जैसे एक बीटा (1/2, 1/2) का उपयोग पूरी तरह से क्योंकि यह संयुग्म अद्यतन को अनुमति देता है एक अच्छा विचार नहीं है। बेशक, एक बार जब आप यह निष्कर्ष निकालते हैं कि आपके पास काम करने के प्रकार के लिए अच्छे गुण हैं, तो यह ठीक है और आप बस एक विकल्प चुन सकते हैं जो कार्यान्वयन को आसान बनाता है। ऐसे बहुत सारे उदाहरण हैं, जहाँ सुविधाजनक डिफ़ॉल्ट विकल्प समस्याग्रस्त हो जाते हैं (गामना (0.001, 0.001 देखें) से पहले जो गिब्स के नमूने को सक्षम करता है)।

  • WinBUGS या JAGS के साथ स्टेन के विपरीत - कोई विशेष लाभ (सशर्त रूप से-) संयुग्म पुजारियों के लिए नहीं है। तो आप कुछ हद तक कम्प्यूटेशनल पहलू को अच्छी तरह से अनदेखा कर सकते हैं। हालांकि पूरी तरह से नहीं है, क्योंकि बहुत भारी पूंछ वाले पुजारियों (या अनुचित पुजारियों) और डेटा के साथ जो मापदंडों की अच्छी तरह से पहचान नहीं करते हैं, आप समस्याओं में भागते हैं (वास्तव में एक स्टेन विशिष्ट समस्या नहीं है, लेकिन स्टेन इन मुद्दों की पहचान करने और उपयोगकर्ता को चेतावनी देने में काफी अच्छा है के बजाय खुशी से नमूना दूर)।

  • जेफ़रीज़ और अन्य "कम जानकारी" के पुजारी कभी-कभी अनुचित हो सकते हैं या थोड़े कठोर भी हो सकते हैं जो उच्च आयामों में समझें (उन्हें प्राप्त करने के लिए कभी भी मन नहीं) और विरल डेटा के साथ। यह सिर्फ इतना हो सकता है कि ये लेखकों के लिए परेशानी का कारण बनते हैं ताकि उनके साथ कभी सहज न हो सकें। एक बार जब आप किसी चीज में काम करते हैं तो आप अधिक सीखते हैं और सहज होते हैं, इसलिए कभी-कभार राय उलट हो जाती है।

  • विरल डेटा में पहले से ही वास्तव में मायने रखता है और यदि आप यह निर्दिष्ट कर सकते हैं कि एक पैरामीटर के लिए पूरी तरह से अनुमानित मूल्य अनुमानित हैं, तो इससे बहुत मदद मिलती है। यह कमजोर-सूचनात्मक पुजारियों के विचार को प्रेरित करता है - वास्तव में पूरी तरह से जानकारीपूर्ण पुजारी नहीं हैं, लेकिन प्रशंसनीय मूल्यों के लिए सबसे अधिक समर्थन वाले हैं।

  • वास्तव में, आप आश्चर्यचकित हो सकते हैं कि कोई व्यक्ति बिना सूचना के पुजारी को परेशान क्यों करता है, अगर हमारे पास बहुत सारे डेटा हैं जो मापदंडों को वास्तव में अच्छी तरह से पहचानते हैं (एक बस अधिकतम संभावना का उपयोग कर सकता है)। बेशक, बहुत सारे कारण हैं (पैथोलॉजी से बचना, डाकियों का "वास्तविक आकार" प्राप्त करना), लेकिन "बहुत सारे डेटा" स्थितियों में कमजोर सूचनात्मक पुजारियों के बजाय कोई वास्तविक तर्क नहीं लगता है।

  • शायद थोड़ा अजीब रूप से एक एन (0, 1) कई अनुप्रयोगों के लिए लॉजिस्टिक, पॉइसन या कॉक्स प्रतिगमन में गुणांक से पहले आश्चर्यजनक रूप से सभ्य है। उदाहरण के लिए बहुत अधिक नैदानिक ​​परीक्षणों में बहुत सारे देखे गए उपचार प्रभावों का वितरण है।

विस्तृत उत्तर के लिए धन्यवाद। मुझे लगता है कि मेरा विस्मय सम्वेदनशीलता के बारे में इतना अधिक नहीं है (क्योंकि अगर मैं इसे सही तरीके से समझता हूं, तो जेफरीज़ के पादरियों को पादरियों को संयुग्मित करने की आवश्यकता नहीं है, उन्हें बस पुनर्मूल्यांकन के तहत अपरिवर्तनीय होने की आवश्यकता है)। तो मैं पूरी तरह से संयुग्म पुजारियों के खिलाफ सलाह को समझूंगा।
सिरका

मुझे लगता है कि जेफ्रीज़ के साथ चिंता की बात यह है कि यह पहले से कुछ उच्च आयामी है जो एक उचित पूर्व नहीं हो सकता है और आपके अनुमान पर कुछ प्रभाव हो सकता है जिसे आप पूरी तरह से नहीं समझते हैं। मुझे लगता है कि यह ज्यादातर विरल डेटा के साथ एक चिंता है, हालांकि शायद कोई गैर-विरल डेटा के साथ एक उदाहरण को इंगित कर सकता है, जहां कुछ समस्याएं होती हैं (मुझे किसी के बारे में पता नहीं है)। इसके अलावा जेफ्री से पहले और विभिन्न अन्य "अनइनफॉर्मेटिव" विकल्प हैं, वास्तव में इसे प्राप्त करने की असुविधा है।
ब्योर्न

8

वे ऐसा करने के लिए कोई वैज्ञानिक / गणितीय औचित्य प्रदान नहीं करते हैं। अधिकांश डेवलपर्स इस तरह के पुजारियों पर काम नहीं करते हैं, और वे अधिक व्यावहारिक / हेयुरिस्टिक पादरियों का उपयोग करना पसंद करते हैं, जैसे कि बड़े वेरिएंट वाले सामान्य पुजारी (जो कुछ मामलों में जानकारीपूर्ण हो सकते हैं)। हालांकि, यह थोड़ा अजीब है कि वे पीसी पुरोहितों का उपयोग करके खुश हैं, जो कि इस विषय पर काम करना शुरू करने के बाद एंट्रोपी (केएल विचलन) पर आधारित हैं।

WinBUGS के साथ एक समान घटना तब हुई , जब डेवलपर्स ने को गैर-सूचनात्मक के रूप में सटीक मापदंडों से पहले अनुशंसित किया क्योंकि यह के आकार से पहले जैसा दिखता है। सटीक मापदंडों के लिए यह पूर्व डिफ़ॉल्ट बन गया। बाद में, यह ( गेलमैन द्वारा! ) दिखाया गया था कि वे अत्यधिक जानकारीपूर्ण हो सकते हैं।Gamma(0.001,0.001)


आप एक जानकारीपूर्ण हाइपरलिंक प्रदान कर सकते हैं / स्रोत Gelman दावा।
जिम

@ जैम ज़रूर, यह पेपर है: projecteuclid.org/euclid.ba/1340371048
इससे पहले
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.