बहुपद समय में अनुमानित औसत


20

बता दें कि एक फ़ंक्शन है। हम के औसत का अनुमान लगाना चाहते हैं ; वह है: ।f:{0,1}n(2n,1]fE[f(n)]=2nx{0,1}nf(x)

NOTE: In the OP, the range of f was [0,1]. I changed this a bit for technical reasons. (This should simplify the problem; if not, forget it!)

आज्ञा देना (यादृच्छिक) अनुमानक एल्गोरिथ्म। मान लें कि पास से ब्लैक-बॉक्स एक्सेस है । हम इसे द्वारा दर्शाते हैंEEfEf

दो शर्तें हैं:

1) अनुमानक के चलने का समय: वहाँ एक भी बहुपद मौजूद p() ऐसा है कि सभी के लिए n और सभी f , का चलने का समय Ef(1n) से घिरा है p(n)E[f(n)]

2) विश्वास के साथ अनुमानक की सटीकता δ : एक एकल बहुपद q() , जैसे कि सभी और सभी , हमारे पास प्रायिकता के साथ कम से कम ।nf1q(n)<Ef(1n)E[f(n)]<q(n)δ

NOTE: The confidence δ was not in the OP. The parameter δ is in (0,1), and may depend on n. For instance, it may be 1-1/2^n.

क्या ऐसे अनुमानक मौजूद हैं?

पृष्ठभूमि और प्रेरणा

मैंने शुरुआत में अपनी प्रेरणा का उल्लेख नहीं किया क्योंकि इसके लिए पृष्ठभूमि ज्ञान की बहुत आवश्यकता है। वैसे भी, उत्साही लोगों के लिए, मैं इसका संक्षेप में वर्णन करता हूं: ऐसे अनुमानकों की आवश्यकता "योग्यता के प्रमाण" के संदर्भ में उत्पन्न होती है, जैसा कि निम्नलिखित लेख में परिभाषित किया गया है:

मिहिर बेलारे, ओडेड गोदरेज। कम्प्यूटिंग योग्यता क्षमता , 1992. अप्रकाशित पांडुलिपि।

विशेष रूप से, पृष्ठ 5 के नीचे, लेखकों ने स्पष्ट रूप से ऐसे अनुमानकों के अस्तित्व को माना है (इसमें सटीक होने का कोई उल्लेख नहीं है, और चलने का समय ठीक से परिभाषित नहीं है; फिर भी संदर्भ स्पष्ट रूप से सब कुछ परिभाषित करता है।)

मेरा पहला प्रयास था " नमूना का एक नमूना --- नमूनाकरण पर एक कम्प्यूटेशनल परिप्रेक्ष्य ।" यह एक बहुत ही समान समस्या से संबंधित है, फिर भी परिभाषित त्रुटि संभावना additive है, जबकि हमारा गुणक है। (मैंने कागज को पूरी तरह से नहीं पढ़ा था, शायद इसमें उल्लेख है कि मुझे कहीं और क्या चाहिए।)

EDIT (त्सुयोशी के अनुरोध के अनुसार): वास्तव में, "कम्प्यूटेशनल एबिलिटी के सबूत" की परिभाषा के लिए एक "नॉलेज एक्सट्रैक्टर" की आवश्यकता होती है, जिसका (अपेक्षित) रनिंग टाइम । चूँकि हम नहीं जानते हैं , हम इसका अनुमान लगाना चाहते हैं; अभी तक यह चल रहे समय को काफी नहीं बदलना चाहिए: इसे एक बहुपद कारक तक बदलना चाहिए। सटीक स्थिति ऐसी आवश्यकता को पकड़ने की कोशिश करती है।p(n)E[f(n)]E[f(n)]


मैं सटीक स्थिति नहीं समझ सकता। एल्गोरिदम ई को हमेशा 1 आउटपुट देने से क्या रोकता है? क्या आपका मतलब 1 / q (n) <(True value) / (अनुमानित मूल्य) <q (n) है?
त्सुयोशी इतो

ऐसा लगता है कि पी (एन) = क्यू (एन) = ओ (1) और तुच्छ एल्गोरिथ्म जो "1" आउटपुट करता है उसे काम करना चाहिए। यह समय चल रहा है O (1), जो p ( n ) से घिरा हैEf(1n) । और यह सटीक है <= 1, जो q (n) से कम है। p(n)E[f(n)]
रॉबिन कोठारी

@Tsuyoshi और रॉबिन: क्षमा करें दोस्तों, मैं परिशुद्धता में एक शर्त याद किया। अब इसे जांचें!
एमएस डौस्ती

इसके अलावा, मुझे लगता है कि अनुमानक यादृच्छिक है (सिर्फ इसलिए कि यह अन्यथा असंभव दिखता है)। क्या यह मामला है? इसके अलावा, यदि यह है, तो क्या चल रहे समय की स्थिति और सटीक स्थिति की आवश्यकता है?
त्सुयोशी इतो

1
मुझे लगता है कि मैं इस प्रश्न को स्पष्ट रूप से नहीं समझता। क्यों एक chernoff बाध्य के साथ एक भोली नमूना एक अच्छा अनुमानक नहीं है?
सिल्वेन पाइरोननेट

जवाबों:


15

EDIT: यह उस समस्या के संस्करण को हल करता है जहाँ f केवल 0 या 1 आउटपुट करता है। लेकिन मुझे लगता है कि समाधान को अधिक सामान्य स्थिति के लिए काम करने के लिए अनुकूलित किया जा सकता है।

हो सकता है कि मैंने इस सवाल को गलत समझा हो, लेकिन यह बहुत कठिन नहीं है।

आकलन करने के बजाय, औसत, चलो 1s की संख्या का अनुमान लगाने के बारे में सोचते हैं, और उस नंबर को k कहते हैं। चलो । तो औसत k / N है। आप समय में एक बहुपद गुणक कारक के भीतर यह अनुमान लगाना चाहते हैं ओ (एन बहुभुज (एन) / के)।N=2n

मुझे लगता है कि यह किसी भी निरंतर गुणक कारक के भीतर भी किया जा सकता है। उदाहरण के लिए, मान लें कि आप इसका अनुमान लगाना चाहते हैं 2. कारक के भीतर। इसलिए एल्गोरिथम का आउटपुट / 2 और 2k के बीच होगा।k

मैं एक एल्गोरिथ्म स्केच करूंगा, जिसमें उपयुक्त रनिंग टाइम होना चाहिए। पहले जांच लें कि क्या कश्मीर एन / 2 और एन के बीच है। यह आसान है, बस कुछ यादृच्छिक मूल्यों का नमूना लें और यदि आपको आधे से अधिक 1 एस मिलता है, तो यह इस अंतराल में है। तो आपके पास 2-सन्निकटन है। यदि नहीं, तो जांचें कि क्या यह एन / 4 और एन / 2 के बीच है। और इसी तरह। हर बार जब आप अंतराल छोटा करते हैं, तो यह अनुमान लगाना अधिक महंगा होता है कि क्या कश्मीर उस सीमा में है। लेकिन लागत इसके विपरीत आनुपातिक है कि अंतराल कितना छोटा है।

उदाहरण के लिए, यदि आप जाँच रहे हैं कि क्या कश्मीर और 2 N / 2 q के बीच है , तो आपको O ( 2 q ) प्रश्न बनाने की आवश्यकता है । वैसे भी, इस प्रक्रिया को पर्याप्त बार दोहराने के बाद, आपको उस अंतराल को प्राप्त करना चाहिए जिसमें कश्मीर निहित है। Say k, N / 2 q और 2 N / 2 q के बीच स्थित है । तब k लगभग N / 2 q है । तो 2 क्यूN/2q2N/2qO(2q)N/2q2N/2qN/2q2qk / N के बारे में है। तो इस चरण में हम O (k / N) क्वेरीज़ खर्च करेंगे। लेकिन इस कदम के लिए q अन्य चरणों की आवश्यकता है, लेकिन यह सिर्फ एक अतिरिक्त पॉलीग्लॉट (एन) कारक है। तो 2-सन्निकटन के लिए समग्र चलने का समय O (N polylog (N) / k) है।

(प्रत्येक चरण में सभ्य परिशुद्धता प्राप्त करने के लिए वास्तव में त्रुटि प्रवर्धन करना होगा। लेकिन यह केवल एक अतिरिक्त बहुवचन कारक है।)


मुझे इस कई चरण प्रक्रिया में सोचने का कारण यह है कि यह प्रक्रिया को एक अनुमान के रूप में रेखांकित करता है और पूर्ववर्ती जाँच करता है। अगर किसी तुमसे कहा था के बीच है एन / 2 क्ष और 2 n / 2 क्ष , तो आप इसे करने के लिए और भी बेहतर परिशुद्धता का अनुमान बाध्य वादा किया समय में इस तथ्य को जानने, कर सकता है। तो हम कश्मीर के लिए एक अनुमान दिया जा रहा है के कदम को खत्म करने की जरूरत है । यह उस प्रकार के सभी संभावित अंतराल पर द्विआधारी खोज द्वारा किया जाता है।kN/2q2n/2qk

गैर-बूलियन आउटपुट के मामले के लिए यह काम करने के लिए, 1s की संख्या गिनने के बजाय, देखे गए मानों को योग करें। मैं यह दिखाने का प्रयास करूँगा कि यह सख्ती से काम करता है।


(1) चूंकि फ़ंक्शन च गैर-अभिन्न मान ले सकता है, आप शायद 1s की संख्या के बजाय मानों का योग उपयोग करना चाहते हैं। (२) क्या हमें मंच द्वारा मंच का अनुमान लगाना है? मैं अनुमान लगा रहा हूं कि हम इसे एक ही चरण में कर सकते हैं, जब तक कि योग एक निश्चित बहुपद से अधिक न हो जाए। प्रश्न के लिए मेरी टिप्पणी भी देखें।
त्सुशी जोतो

ओह, मैंने ध्यान नहीं दिया कि सीमा [0,1] है। मुझे लगा कि यह {0,1} है। लेकिन मुझे लगता है कि वही प्रक्रिया काम करती है। शायद हम एक समस्या को दूसरे तक कम कर सकते हैं क्योंकि हम पर्याप्त सटीकता के साथ आउटपुट के बाइनरी प्रतिनिधित्व की एक विशेष स्थिति में 1s की संख्या को "गिन" सकते हैं। (2) के बारे में, मुझे लगता है कि आपकी प्रक्रिया समान है। मुझे लगता है कि यह इस तरह से लगता है क्योंकि यह एक अनुमान की तरह लगता है और जांच प्रक्रिया, यानी, कश्मीर का एक घटिया अनुमान दिया, एक बेहतर मिलता है। मैं इसे अपने उत्तर में जोड़ूंगा।
रॉबिन कोठारी

मैं सहमत हूं कि दो एल्गोरिदम अनिवार्य रूप से समान हैं। इसके अलावा, [0,1] और {0,1} के लिए, आपका एल्गोरिथ्म संभवतः एक सिक्का फ्लिप (1 wp f (x) और 0 wp द्वारा गैर-अभिन्न मूल्य f (x) के प्रत्येक मूल्यांकन को बदलने के बाद कहा गया है) 1-f (x))।
त्सुशी जोतो

@ रॉबिन: उत्तर के लिए धन्यवाद। मेरे लिए भी कुछ स्पष्ट नहीं है: आपने कहा: "बस कुछ यादृच्छिक मूल्यों का नमूना लें और यदि आपको आधे से अधिक 1s मिलता है, तो यह इस अंतराल में है।" मेरा मानना ​​है कि इसकी मात्रा निर्धारित की जानी चाहिए: कितने नमूनों का परिणाम क्या सटीक है? (मैंने इस तरह के आत्मविश्वास पर विचार करने के लिए ओपी को बदल दिया। अन्यथा आवश्यक नमूना तैयार करना असंभव होगा!)
एमएस डौस्टी

@ सादिक: यह एक चेरनॉफ बाउंड है। यदि आप k को n / 2 (उदाहरण के लिए एक उचित सिक्का) होने की उम्मीद करते हैं, तो आप जल्दी से n (1 + eps) / 2 से अधिक देखने के लिए बाध्य पूंछ लिख सकते हैं और इसी तरह नीचे की ओर भी।
सुरेश वेंकट

3

चलो के मूल्यों को निरूपित से यादृच्छिक नमूने की एक अनंत अनुक्रम (प्रतिस्थापन के साथ) के लिए आवेदन किया { 0 , 1 } एन । चलो कश्मीर कम से कम सकारात्मक पूर्णांक ऐसा है कि हो सकता है Σ k मैं = 1मैंएम कुछ मूल्य के लिए एम , शायद एम = पी एल वाई एल जी ( एन ) । मुझे लगता है कि अनुमानक एम / होगाf1,f2,f{0,1}nki=1kfiMMM=polylog(n) को वह पूरा करना चाहिए जो आप चाहते हैं।M/k

विश्लेषण के लिए आप सीधे यादृच्छिक चर पर चेरनॉफ सीमा को लागू नहीं कर सकते हैं, लेकिन एक चाल है जो आपको वैसे भी चेरोफ़ का उपयोग करने की अनुमति देगा। Let μ अज्ञात अपेक्षा E ( f ) को दर्शाता है । स्थिरांक का पता लगाएं कश्मीर एल डब्ल्यू और कश्मीर मैं (के कार्यों μ ) ताकि संभावना कम से कम के साथ 1 - δ हमारे पास Σ कश्मीर एल डब्ल्यू मैं = 1मैं < एम और Σ कश्मीर kμE(f)klowkhighμ1δi=1klowfi<Mमैं केउन sumsचेरनॉफ़ का उपयोग करके बाध्य किया जा सकता है। ऐसा नहीं है कि इस प्रकारकश्मीरएलडब्ल्यू<कश्मीर<कश्मीरमैंसंभावना कम से कम के साथ1-δऔर इसलिए आकलनकर्ताएम/कश्मीरमें अच्छी तरह से ध्यान केंद्रित किया है।i=1khighfi>Mfiklow<k<khigh1δM/k

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.