multiarmed-bandit पर टैग किए गए जवाब

3
सर्वश्रेष्ठ डाकू एल्गोरिथ्म?
सबसे प्रसिद्ध दस्यु एल्गोरिथ्म ऊपरी विश्वास बाध्य (यूसीबी) है जिसने एल्गोरिदम के इस वर्ग को लोकप्रिय बनाया। तब से मुझे लगता है कि अब बेहतर एल्गोरिदम हैं। वर्तमान सर्वश्रेष्ठ एल्गोरिथ्म (अनुभवजन्य प्रदर्शन या सैद्धांतिक सीमा के संदर्भ में) क्या है? क्या यह एल्गोरिथ्म कुछ अर्थों में इष्टतम है?

4
किस तरह की वास्तविक जीवन स्थितियों में हम एक मल्टी-आर्म बैंडिट एल्गोरिथ्म का उपयोग कर सकते हैं?
मल्टी-आर्म बैंडिट्स उस स्थिति में अच्छी तरह से काम करते हैं, जहां आपके पास विकल्प हैं और आप सुनिश्चित नहीं हैं कि कौन सा आपकी भलाई को अधिकतम करेगा। आप कुछ वास्तविक जीवन स्थितियों के लिए एल्गोरिथ्म का उपयोग कर सकते हैं। एक उदाहरण के रूप में, सीखना एक अच्छा …

1
प्रासंगिक डाकुओं के लिए लागत कार्य
मैं एक संदर्भ-दस्यु समस्या को हल करने के लिए वॉवेल वैबबिट का उपयोग कर रहा हूं । मैं उपयोगकर्ताओं को विज्ञापन दिखा रहा हूं, और मेरे पास उस संदर्भ के बारे में थोड़ी जानकारी है जिसमें विज्ञापन दिखाया गया है (जैसे कि उपयोगकर्ता कौन है, वे किस साइट पर हैं, …

2
आम आदमी की शर्तों में थॉम्पसन नमूनाकरण क्या है?
मैं थॉम्पसन सैंपलिंग को समझने में असमर्थ हूं और यह कैसे काम करता है। मैं मल्टी आर्म बैंडिट के बारे में पढ़ रहा था और अपर कॉन्फिडेंस बाउंड अल्गोरिद्म पढ़ने के बाद, कई टेक्स्ट ने सुझाव दिया कि थॉम्पसन सैंपलिंग यूसीबी से बेहतर प्रदर्शन करता है। थोमसन सैंपलिंग, आम आदमी …

1
एन-सशस्त्र डाकू समस्याओं को हल करने के लिए इष्टतम एल्गोरिदम?
मैंने एन-सशस्त्र दस्यु समस्याओं जैसे -greedy, softmax, और UCB1 को हल करने के लिए कई एल्गोरिदम के बारे में पढ़ा है , लेकिन मुझे खेद कम करने के लिए सबसे अच्छा तरीका क्या है के माध्यम से छंटनी करने में थोड़ी परेशानी हो रही है।ϵϵ\epsilon क्या एन-सशस्त्र डाकू समस्या को …

1
सामान्य इनाम वितरण के लिए बहु सशस्त्र डाकू
मैं एक बहु-सशस्त्र दस्यु समस्या पर काम कर रहा हूँ जहाँ हमें पुरस्कार वितरण के बारे में कोई जानकारी नहीं है। मुझे कई कागजात मिले हैं, जो ज्ञात बाउंड के साथ वितरण के लिए पछतावा सीमा की गारंटी देते हैं, और [0,1] में समर्थन के साथ सामान्य वितरण के लिए। …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.