क्या MCMC विधियों के बड़े पैमाने पर अध्ययन हुए हैं जो परीक्षण घनत्व के एक सूट पर कई अलग-अलग एल्गोरिदम के प्रदर्शन की तुलना करते हैं? मैं Rios और साहिनिडिस के पेपर (2013) के समकक्ष कुछ सोच रहा हूं , जो कि परीक्षण कार्यों के कई वर्गों पर बड़ी संख्या में व्युत्पन्न-मुक्त ब्लैक-बॉक्स ऑप्टिमाइज़र की पूरी तरह से तुलना है।
MCMC के लिए, प्रदर्शन का अनुमान लगाया जा सकता है, उदाहरण के लिए, घनत्व मूल्यांकन या कुछ अन्य उपयुक्त मीट्रिक प्रति नमूनों (ईएसएस) की प्रभावी संख्या।
कुछ टिप्पणियाँ:
मैं सराहना करता हूं कि प्रदर्शन दृढ़ता से लक्ष्य पीडीएफ के विवरण पर निर्भर करेगा , लेकिन एक समान (संभवतः समान नहीं) तर्क अनुकूलन के लिए रखता है, और फिर भी बेंचमार्क फ़ंक्शंस, सुइट्स, प्रतियोगिताओं, पेपर आदि का ढेर है जो बेंचमार्किंग अनुकूलन के साथ संबंधित है। एल्गोरिदम।
इसके अलावा, यह सच है कि MCMC अनुकूलन में भिन्न है कि तुलनात्मक रूप से बहुत अधिक देखभाल और ट्यूनिंग उपयोगकर्ता से आवश्यक है। फिर भी, अब कई MCMC विधियाँ हैं जिनके लिए बहुत कम या बिना ट्यूनिंग की आवश्यकता होती है: वे विधियाँ जो सैंपलिंग या मल्टी-स्टेट (जिसे पहनावा भी कहा जाता है ) विधियों (जैसे Emcee ) के दौरान जलने वाले चरण में अनुकूलित होती हैं, जो कई परस्पर क्रिया श्रृंखलाओं को विकसित करती हैं और उपयोग करती हैं। नमूने का मार्गदर्शन करने के लिए अन्य जंजीरों से जानकारी।
मैं विशेष रूप से मानक और बहु-राज्य (उर्फ पहनावा) तरीकों के बीच तुलना में दिलचस्पी रखता हूं। बहु-राज्य की परिभाषा के लिए, मैकके की पुस्तक की धारा 30.6 देखें :
एक बहु-राज्य विधि में, कई पैरामीटर वैक्टर बनाए रखे जाते हैं; वे महानगर और गिब्स जैसे कदमों के तहत व्यक्तिगत रूप से विकसित होते हैं; वैक्टर के बीच बातचीत भी कर रहे हैं।
- यह प्रश्न यहीं से उत्पन्न हुआ ।
अपडेट करें
- मल्टी-स्टेट उर्फ पहनावा के तरीकों पर एक दिलचस्प कदम के लिए, गैल्मन के ब्लॉग पर बॉब कारपेंटर द्वारा इस ब्लॉग पोस्ट को देखें , और मेरी टिप्पणी इस सीवी पोस्ट का जिक्र करती है।