समान पक्षपाती सिक्कों से पास-टू-फेयर सिक्का टॉस प्राप्त करने का सबसे अच्छा तरीका क्या है?


21

(वॉन न्यूमैन ने एक एल्गोरिथ्म दिया जो समान पक्षपाती सिक्कों तक पहुंच के लिए दिए गए एक उचित सिक्के का अनुकरण करता है। एल्गोरिथ्म में संभवतः अनंत संख्या में सिक्कों की आवश्यकता होती है (हालांकि अपेक्षा में, बारीक रूप से कई प्रत्यय)। यह सवाल उस मामले की चिंता करता है जब सिक्के की संख्या की अनुमति दी जाती है। घिरे।)

मान लीजिए हम पूर्वाग्रह के साथ समान सिक्के । उद्देश्य पूर्वाग्रह को कम करते हुए एक ही सिक्के को उछालना है।nδ=P[Head]P[Tail]

अनुकरण निम्नलिखित अर्थों में कुशल होना चाहिए: बहुपद समय में चल रहा एक एल्गोरिथ्म यादृच्छिक बिट्स को देखता है और एक एकल बिट आउटपुट करता है। एल्गोरिथ्म के को रूप में परिभाषित किया गया हैजहां nid बिट्स द्वारा परिभाषित वितरण पर अपेक्षा की जाती है जैसे कि ।B i a s ( A ) = | [ = ] - [ = ] | n एक्स 1 , ... , एक्स एन पी आर बी [ एक्स मैं = 1 ] - पी आर बी [ एक्स मैं = 0 ] = δnBias(A)=|E[A=0]E[A=1]|nx1,,xnProb[xi=1]Prob[xi=0]=δ

बहुपद समय में कौन सा एल्गोरिदम चल रहा है जिसमें सबसे कम पूर्वाग्रह है ?बी आई एस ( )ABias(A)

यह प्रश्न मुझे बहुत स्वाभाविक लगता है और यह बहुत संभावना है कि इसे पहले माना जा चुका है।

इस समस्या के बारे में क्या ज्ञात है? एल्गोरिदम के कमजोर वर्ग ( , आदि में) को माना जाता है?AC0

जवाबों:


15

N पक्षपाती सिक्कों को टॉस करना और सिर की समता लेने से तेजी से करीब हो जाता है ।12

[एक सबूत के लिए, एक यादृच्छिक चर पर विचार करें, जो -1 है जब सिर और 1 जब पूंछ होती है, तो संभावना है कि एक विषम संख्या में सिर बस ]E[12+12iXi]=12+12δn

शायद यह भी निम्नलिखित कारण के लिए इष्टतम है। चलो इन बिट्स की किसी भी रचना समारोह हो। फिर, और सबसे अच्छा समानता कार्य (ऐसा नहीं है?) लगता है।पूर्वाग्रह ( ) = Σ एस एफ ( एस ) δ | एस | fBias(f)=Sf^(S)δ|S|f

यदि आप निम्न जटिलता के रचना कार्यों में रुचि रखते हैं, तो शायद 'एनपी के भीतर कठोरता प्रवर्धन' पर रयान ओ'डॉनेल का एक पेपर बहुत प्रासंगिक होगा। वहां वह कठोरता प्रवर्धन के लिए मोनोटोन रचना कार्यों का उपयोग करता है और कार्य जो काम करते हैं उनकी शोर संवेदनशीलता की विशेषता है।


क्या आप विस्तार से बता सकते हैं कि समता सबसे अच्छा कार्य क्यों होना चाहिए? (इसके अलावा, ऐसा नहीं है कि यह बहुत ही महत्वपूर्ण है, लेकिन यह नहीं होना चाहिए कि फूरियर विस्तार में बाद से ?)। कागज के लिए सूचक के लिए धन्यवाद! [ एक्स मैं ] = δdelta|S|E[xi]=δ
हृषिकेश

ओह, मुझे क्षमा करें, आप सही हैं। अभिव्यक्ति गलत थी और अब इसे ठीक कर दिया है। मेरे पास इष्टतमता का प्रमाण नहीं है (शायद यह इष्टतम नहीं है) लेकिन मैंने जो अनुमान लगाया था, उसका कारण यह था कि यह अभिव्यक्ति के बजाय चूंकि यह एक उत्तल संयोजन है। Sf^(S)2δ|S|
रामप्रसाद

शायद यह कुछ प्रकाश डाल सकता है। कॉची-श्वार्ज़ द्वारा, हम जानते हैं कि । अनुकूलन का एक तरीका जितना संभव हो उतना ऊपरी-सीमा को कम करना होगा और यह तब होता है जब फ़ंक्शन समता फ़ंक्शन होता है और उस मामले में हम जिस मात्रा में रुचि रखते हैं, वह ऊपरी-बाउंड से भी मेल खाता है। हालांकि, यह मामला हो सकता है कि फूरियर गुणांक के वेक्टर पूरी तरह से ऑर्थोगोनल टू द -वेक्टर है जिस स्थिति में एलएचएस सिर्फ शून्य है! की विशेष मान हैं जिसके लिए हम इस तरह के उदाहरण पता है? δδSf^(S)S:f^(S)0δ2|S|fδδ
रामप्रसाद

वास्तव में, यदि कोई कुछ गैर-तुच्छ मोनोटोन फ़ंक्शन , तो पर की संभावना की संभावना 0 है और at यह । इसलिए, कुछ मध्यवर्ती , इसे मान । इसलिए यह उम्मीद करना उचित नहीं है कि प्रत्येक , समता फ़ंक्शन इष्टतम है। δ = - 1 ( एक्स 1 , , एक्स एन ) = 1 δ = 1 1 δ 1fδ=1f(x1,,xn)=1δ=11δ δ12δ
रामप्रसाद

क्या आप पिछली टिप्पणी को अधिक विस्तार से समझा सकते हैं? च की जटिलता के मुद्दों की अनदेखी, अपने निष्कर्ष सही नहीं है केवल अगर एक के लिए के बाद से समता से पूर्वाग्रह लेता है के लिए ? δ 1E[f]=1/2δ121/nδδn
हृषिकेश

12

आप यह नहीं कहते कि पूर्वाग्रह ज्ञात है या अज्ञात। वॉन न्यूमैन के एल्गोरिथ्म का जादू यह है कि यह किसी भी स्थिति में काम करता है।

माना कि यह ज्ञात है। फिर सबसे अच्छा जवाब पूर्वाग्रह की संख्या-सैद्धांतिक विशेषताओं पर गंभीर रूप से निर्भर करता है। चलो पी = 2/3 लेते हैं। दो बार सिक्का टॉस करें और एचएच को 0 और टीएच और एचटी को 1 पर मैप करें, यदि परिणाम टीटी है तो प्रयोग को दोहराएं। तब 0 और 1 समान रूप से होने की संभावना है और पुनरावृत्ति की संभावना वॉन न्यूमैन के एल्गोरिथ्म के साथ 5/9 के बजाय केवल 1/9 है। या इसे अपनी शर्तों में रखें, तो आप केवल 1/9 के परिणामों में से एक को पूर्वाग्रह करते हैं यदि आपकी पुनरावृत्ति सीमा 2 है।

यह सभी सूचना सिद्धांत और कोडिंग सिद्धांत से निकटता से संबंधित है। जब पी एक अधिक जटिल अंश और हर के साथ एक अंश होता है, तो सर्वश्रेष्ठ एल्गोरिथ्म को 2 से अधिक लंबी लंबाई की आवश्यकता होगी। आप एक शैनन-शैली के अस्तित्व तर्क का उपयोग कर सकते हैं यह दिखाने के लिए कि किसी दिए गए पूर्वाग्रह के लिए एक प्रक्रिया है जो जितनी इष्टतम है आप चाहते हैं, लेकिन ब्लॉक की लंबाई बहुत बड़ी हो सकती है।

रैंडम बिट्स को निकालने के लिए वॉन न्यूमैन के प्रक्रिया को दोहराते हुए अपने पेपर में पेरेस साबित करते हैं कि वॉन न्यूमैन के एल्गोरिथ्म का एक संस्करण शान्नोन सीमा तक मनमाने ढंग से पहुंच सकता है। इस क्षेत्र में बहुत सारे काम जानकारी सिद्धांतकारों और सांख्यिकीविदों द्वारा किए गए हैं, इसलिए मैं किसी भी पेपर के बारे में एक जटिलता-सिद्धांत-संबंधी तिरछा के साथ नहीं सोच सकता जो आपको आपके प्रश्न का सीधा जवाब देगा।

एक मजेदार संबंधित समस्या है जो विपरीत पूछती है: यदि आपके पास निष्पक्ष बिट्स का स्रोत है, तो आप कुशलतापूर्वक कुछ गैर-पावर-ऑफ-टू सेट में समान वितरण कैसे उत्पन्न करते हैं? समस्या का पुनरावृत्ति-सीमित संस्करण जो आपके प्रश्न के समान है, एक निष्पक्ष सिक्के के nsses के साथ एन्ट्रॉपी को अधिकतम करने के लिए कहता है (यानी वितरण को यथासंभव समान बनाएं)।


1
यह मेरे साथ हुआ है कि रनिंग टाइम सब्जेक्ट को बिना पूर्वाग्रह (पेपर क्या करता है) के लिए लेग्रेंज डुअल अरेंजिंग है। तो, मुझे लगता है कि कागज वास्तव में आपके प्रश्न का उत्तर देता है!
प्रति सॉगन

5

मैं निम्नलिखित सामान्यीकृत रूप में प्रश्न के बारे में सोचना पसंद करता हूं: हमारे पास h n की पूरी बाइनरी ट्री है, जहां प्रत्येक नोड को संख्याओं का एक संख्या सेंट निर्दिष्ट किया जाता है। 1. क्या हम पत्तियों को दो सेटों में बांट सकते हैं जैसे सेंट्स संख्या वे करीब हैं?

यदि हमारे पास पैरामीटर और q = 1 - p के साथ पक्षपाती सिक्का है , तो नोड्स में मान p i q n - i होगाpq=1ppiqni

जैसा कि अन्य उत्तरों में कहा गया है, अधिकांश समुद्री प्रयोजनों के लिए बिट्स की समता लेना अच्छा है। पूर्वाग्रह i(ni)parity(x)piqni=i(ni)(p)iqni=(qp)n

सामान्य तौर पर, यदि हमारे पास पर्याप्त कंप्यूटिंग संसाधन (कहते हैं, यादृच्छिक संख्या की संख्या में), तो हम नोड्स को सर्वोत्तम संभव तरीके से विभाजित कर सकते हैं।PSpace

EDIT "यह मूल रूप से शैनन कोडिंग समस्या है।" (प्रति संज्ञेय के लिए धन्यवाद।) EDIT का अंत

दूसरी ओर, यदि हमें केवल का उपयोग करने की अनुमति है , तो यह दर्शाना कठिन नहीं है कि हम लेम्मा स्विच करने के कारण बहुत कुछ हासिल नहीं कर सकते। सर्किट को सीएनएफ द्वारा तेजी से अच्छी तरह से अनुमानित किया जाएगा और यह दिखाना मुश्किल नहीं है कि एक सीएनएफ एक अच्छे पूर्वाग्रह के साथ एक उत्तर की गणना नहीं कर सकता है।AC0

(इस उत्तर में त्रुटियां हो सकती हैं, मैंने विवरणों की जांच नहीं की है।)


2
"क्या हम पत्तों को दो सेटों में विभाजित कर सकते हैं जो संख्याओं के समीप हैं जो वे करीब हैं?" यह मूल रूप से शैनन कोडिंग की समस्या है। शैनन-फ़ानो एल्गोरिथ्म शीर्ष-डाउन है और प्रायिकता-भारित तत्वों के एक सेट के साथ शुरू होता है और एक समान-संभव द्विध्रुव के लिए पूछता है। इसे पुनरावर्ती रूप से लागू करने से एक अभिन्न उपसर्ग-मुक्त कोड प्राप्त होता है। हफमैन एल्गोरिथ्म नीचे-ऊपर है: यह सिंगलटन पेड़ों से शुरू होता है और बार-बार जोड़े को निकटतम संभावना के साथ जोड़ता है। यदि आप अंकगणित कोडिंग के बारे में जानते हैं, तो यह भी ठीक ही बताता है कि एक समय में एक से अधिक बार एक से अधिक निष्पक्ष बिट्स उत्पन्न करना बेहतर है।
प्रति सोग्न

4

आप पक्षपाती सिक्कों में से कई यादृच्छिक बिट्स भी प्राप्त कर सकते हैं, उत्पाद वितरण के तहत गैबियोन के पेपर डर्ज़िमाइज़िंग एल्गोरिदम देखें (http://sites.google.com/site/arielgabizon1/)



1

यदि आप एक पक्षपाती सिक्के के साथ सिक्के की संख्या को कम करना चाहते हैं, तो पूर्वाग्रह को हटाने का आसान तरीका हर दूसरे टॉस का परिणाम उल्टा है।


1
यह निश्चित रूप से समान रूप से यादृच्छिक अनुक्रम में परिणाम नहीं देगा। सीमित मामले की कल्पना करें क्योंकि सिक्के का पूर्वाग्रह 1 तक जाता है - आपको बस बिट्स का एक नियतकालिक वैकल्पिक क्रम मिलता है।
हारून रोथ

कोई भी रणनीति जो विशेष रूप से परिणामों को निरस्त करती है, एन्ट्रॉपी को संरक्षित करेगी, इसलिए यह गैर-अधिकतम एन्ट्रापी (पक्षपाती) से अधिकतम एन्ट्रापी (निष्पक्ष) में वितरण को नहीं बदल सकती है।
प्रति सोग्न
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.