नमूनाकरण लागत बनाम


9

मुझे निम्नलिखित सिमुलेशन समस्या आई: ज्ञात वास्तविक संख्याओं का एक सेट , पर एक वितरण द्वारा परिभाषित किया गया है जहां का सकारात्मक भाग को दर्शाता है । मैं इस वितरण लक्ष्यीकरण एक महानगरों-हेस्टिंग्स नमूना के बारे में सोच सकता है, मुझे आश्चर्य है कि अगर वहाँ एक कुशल प्रत्यक्ष नमूना मौजूद है, शून्य संभावनाओं की बड़ी संख्या का लाभ लेने से एल्गोरिथ्म के आदेश को कम करने के के लिए ।{ω1,,ωd}{1,1}d

P(X=(x1,,xd))(x1ω1++xdωd)+
(z)+zO(2d)O(d)

जवाबों:


4

यहाँ एक काफी स्पष्ट पुनरावर्ती नमूना है जो सबसे अच्छा मामले में (वज़न संदर्भ में ) है, लेकिन सबसे खराब स्थिति में घातांक है।O(d)ωi

मान लीजिए कि हमने पहले ही का चयन कर लिया है, और चुनना चाहते हैं । हमें और संभाव्यता साथ चुनें भाजक नमूने के किसी भी वैध विकल्प के लिए ।x1,,xi1xi

w(x1,,xi1,xi)=xi+1{1,1}xd{1,1}(j=1dωjxj)+
xi=1
w(x1,,xi1,1)w(x1,,xi1,1)+w(x1,,xi1,1).
x1,,xi1

अब, निश्चित रूप से, सवाल यह है कि गणना कैसे की जाए ।w(x1,,xi)

अगर हमारे पास वह , तो किसी भी के लिए अग्रणी प्रविष्टियाँ , और इसलिए : C:=j=1iωjxjj=i+1d|ωj|ωx0xx1:iw

xi+1xdωx=ω(xi+1xdx)=j=1iωj(xi+1xdxj)2dixj+j=i+1dωj(xi+1xdxj)0=2diC.

विपरीत स्थिति में, , हमारे पास वह और इसलिए ।Cj=i+1d|ωj|ωx0w(x1,,xi)=0

अन्यथा, हमें का उपयोग करके पुनरावृत्ति करनी चाहिए ।w(x1,,xi)=w(x1,,xi,1)+w(x1,,xi,1)

मान लें कि स्मृति कोई समस्या नहीं है और हम एक पेड़ में , में सभी उप-गणनाओं को कैश कर सकते हैं - इस बिंदु तक कि हम "अच्छा" मामलों में से एक को मारते हैं, जिसके बाद कोई भी कॉल में निरंतर समय लगता है। (हमें इस पूरे पेड़ को का चयन करने के लिए वैसे भी गणना करने की आवश्यकता होगी ।) फिर, एक बार संगणनाओं के इस पेड़ के निर्माण के बाद, नमूना केवल समय लेगा । सवाल यह है कि पेड़ को बनाने में कितना समय लगता है, या समकक्ष कितना बड़ा है।w(1)w(1)x1wO(d)


हम निश्चित रूप से "अच्छा" मामलों को तेजी से यदि को सॉर्ट किया जाता है, ।ωiω1ω2ωd

सर्वोत्तम स्थिति में, । फिर हम तुरंत या लिए "अच्छा" केस हिट करते हैं , इसलिए ट्री कंस्ट्रक्शन में लगातार समय लगता है, और पूरे सैंपलर में समय लगता है।|ω1|>j=2d|ωj|w(1)w(1)wO(d)

सबसे खराब (सॉर्ट किए गए) मामले में, । फिर सवाल यह है कि कुल पेड़ कितना बड़ा है?ω1=ω2==ωd

ठीक है, समाप्त करने के लिए पहला रास्ता बेशक और लंबाई । पेड़ इसीलिए उस गहराई तक पूरा होता है, और इसलिए कम से कम नोड्स होते हैं। (यह अधिक है; आप शायद इसे एक तर्क के साथ पा सकते हैं जैसे जुआरी की बर्बादी की समस्याओं में इस्तेमाल होने वाले, लेकिन मैं इसे दो मिनट के Googling में नहीं पा सकता था और विशेष रूप से परवाह नहीं है -  बुरा है बस....)(1,1,,1)(1,1,,1)d/2O(2d/2)2d/2

यदि आपकी सेटिंग में केवल कुछ बहुत बड़े , तो यह संभवतः एक उचित व्यावहारिक दृष्टिकोण है। यदि सभी समान परिमाण के हैं, तो यह संभवतः अभी भी घातीय है और बड़े लिए बहुत महंगा है ।ωiωid


इस Viterbi प्रकार के उन्मूलन के लिए धन्यवाद। जब आप "विपरीत मामले में" , तो मुझे लगता है कि आप इसे पहले मामले के पूरक का मतलब नहीं लेते हैं।
Cij=i+1d|ωj|
Cij=i+1d|ωj|
शीआन

1
नहीं, पूरक नहीं: जब यह बहुत बड़ा होता है तो आप जानते हैं कि ट्रंकेशन लागू नहीं होता है, जब यह बहुत छोटा होता है तो यह हमेशा लगाया जाता है, और बीच में आपको यह पता लगाने के लिए पुनरावृत्ति करनी चाहिए कि यह कब लागू होता है या नहीं।
डगल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.