उदाहरण जिसमें वर्णमाला का आकार (


9

चलो Σएक वर्णमाला, यानी एक गैर-रिक्त परिमित सेट हो। एक स्ट्रिंग तत्वों (वर्णों) से किसी भी परिमित अनुक्रम हैΣ। उदहारण के लिए,{0,1} द्विआधारी वर्णमाला है और 0110 इस वर्णमाला के लिए एक स्ट्रिंग है।

आमतौर पर, जब तक Σ 1 से अधिक तत्व शामिल हैं, तत्वों की सटीक संख्या Σकोई फर्क नहीं पड़ता: सबसे अच्छा हम कहीं और एक अलग निरंतर के साथ समाप्त होता है। दूसरे शब्दों में, यह वास्तव में मायने नहीं रखता है अगर हम बाइनरी वर्णमाला, संख्याओं, लैटिन वर्णमाला या यूनिकोड का उपयोग करते हैं।

क्या ऐसी स्थितियों के उदाहरण हैं जिनमें यह मायने रखता है कि वर्णमाला कितनी बड़ी है?

इसका कारण मुझे इसमें दिलचस्पी है क्योंकि मैं एक ऐसे उदाहरण पर ठोकर खाने के लिए हुआ:

किसी भी वर्णमाला के लिए Σ हम यादृच्छिक ओरेकल को परिभाषित करते हैं OΣ एक ओरेकल होना जो यादृच्छिक तत्वों को वापस करता है Σ, जैसे कि हर तत्व के वापस होने का एक समान मौका है (इसलिए हर तत्व के लिए मौका है) 1|Σ|)।

कुछ अल्फ़ाज़ों के लिए Σ1 तथा Σ2 - संभवत: विभिन्न आकारों में - पहुँच के साथ ओरेकल मशीनों के वर्ग पर विचार करें OΣ1। हम इस वर्ग में ओरेकल मशीनों में रुचि रखते हैं जो समान व्यवहार करते हैंOΣ2। दूसरे शब्दों में, हम एक तांडव में परिवर्तित करना चाहते हैंOΣ1 एक तांडव में OΣ2ट्यूरिंग मशीन का उपयोग करना। हम ऐसी ट्यूरिंग मशीन को रूपांतरण कार्यक्रम कहेंगे।

चलो Σ1={0,1} तथा Σ={0,1,2,3}। परिवर्तितOΣ1 एक तांडव में OΣ2 आसान है: हम क्वेरी करते हैं OΣ1 दो बार, परिणामों को इस प्रकार परिवर्तित करना: 000, 011, 102, 113। जाहिर है, इस कार्यक्रम में चलता हैO(1) समय।

अब छोडो Σ1={0,1} तथा Σ={0,1,2}। इन दो भाषाओं के लिए, सभी रूपांतरण कार्यक्रम चलते हैंO() समय, अर्थात् से कोई रूपांतरण कार्यक्रम नहीं हैं OΣ1 सेवा OΣ2 उस में दौड़ो O(1) समय।

यह विरोधाभास द्वारा सिद्ध किया जा सकता है: मान लीजिए कि एक रूपांतरण कार्यक्रम मौजूद है C से OΣ1 सेवा OΣ2 में चल रहा है O(1)समय। इसका मतलब है कि एdN ऐसा है कि C अधिक से अधिक बनाता है d से पूछताछ की Σ1

C से कम कर सकते हैं dकुछ निष्पादन पथों में प्रश्न। हम आसानी से रूपांतरण कार्यक्रम का निर्माण कर सकते हैंC वह निष्पादित करता है C, यह देखते हुए कि कितनी बार एक ओरेकल क्वेरी बनाई गई थी। चलोk ओरेकल प्रश्नों की संख्या हो। C तब बनाता है dk अतिरिक्त ओरेकल प्रश्न, परिणाम को त्यागकर, क्या लौटा C लौट आया होगा।

इस तरह, बिल्कुल हैं |Σ1|d=2d निष्पादन के रास्ते C। बिल्कुल सही1|Σ2|=13 इन निष्पादन पथों में परिणाम होगा C लौटने 0। तथापि,2d3एक पूर्णांक संख्या नहीं है, इसलिए हमारे पास एक विरोधाभास है। इसलिए, ऐसा कोई कार्यक्रम मौजूद नहीं है।

अधिक आम तौर पर, अगर हमारे पास अक्षर हैं Σ1 तथा Σ2 साथ में |Σ1|=n तथा |Σ2|=k, तो वहाँ से एक रूपांतरण कार्यक्रम मौजूद है OΣ1 सेवा OΣ2 अगर और केवल यदि सभी प्राइम में फैली प्राइमिंग n के मुख्य कारक में भी दिखाई देते हैं k (इसलिए गुटबंदी में अपराधों के प्रतिपादक मायने नहीं रखते)।

इसका एक परिणाम यह है कि अगर हमारे पास एक यादृच्छिक संख्या जनरेटर है जो लंबाई का एक बाइनरी स्ट्रिंग पैदा करता है l, हम उस रैंडम संख्या जनरेटर का उपयोग किसी संख्या को उत्पन्न करने के लिए नहीं कर सकते हैं {0,1,2} बिल्कुल समान संभावना के साथ।

मैंने सुपरमार्केट में खड़े होने पर विचार किया कि रात के खाने के लिए क्या करना है। मैं सोचता था कि क्या मैं पसंद, ए, बी और सी के बीच का फैसला करने के लिए सिक्का का उपयोग कर सकता हूं। जैसा कि यह निकला, यह असंभव है।


5
पीसीपी प्रमेय के दिनूर का प्रमाण वर्णमाला के आकार में हेरफेर पर बहुत निर्भर करता है, विशेष रूप से इसे उड़ाने और फिर इसे पीसीपी रचना के माध्यम से बार-बार कम करना। चरण के दूसरे टुकड़े के बिना (वर्णमाला के आकार को वापस खींचते हुए), सबूत काम नहीं करता है।
डैनियल एपोन

2
@ डैनियल अपॉन: जवाब के रूप में फिर से पोस्ट क्यों नहीं?
जोशुआ ग्रोको

@ जोशुआ, उफ़। ज़रूर। :)
डैनियल अपॉन

जवाबों:


11

औपचारिक भाषा सिद्धांत में कुछ उदाहरण हैं जहां 2-चरित्र और 3-चरित्र अक्षर गुणात्मक रूप से भिन्न व्यवहार देते हैं। कोजेन निम्नलिखित अच्छा उदाहरण देता है (पैराफ्रास्ड):

अक्षर होने दो Σ= {1, .., k} मानक संख्यात्मक क्रम के साथ, और सॉर्ट (x) को परिभाषित करें x शब्द का क्रमपरिवर्तन जिसमें x के अक्षर क्रमबद्ध क्रम में प्रकट होते हैं। सॉर्ट प्रकार (A) = {सॉर्ट (x) | एक्स A}, और निम्नलिखित दावे पर विचार करें:

यदि A संदर्भ-मुक्त है तो सॉर्ट (A) संदर्भ-मुक्त है।

यह दावा k = 2 के लिए सही है, लेकिन k के लिए गलत है 3।


11

पीसीपी प्रमेय के दिनूर का प्रमाण वर्णमाला के आकार के हेरफेर पर बहुत अधिक निर्भर करता है।

विशेष रूप से, प्रमाण की समग्र संरचना एक ग्राफ पॉवरिंग तकनीक का पुनरावृत्त अनुप्रयोग है जो कई बार ग्राफ आकार की संख्या में लघुगणक होता है। प्रत्येक पुनरावृत्ति पर, ग्राफ को एक नियमित विस्तार ग्राफ में पूर्व-संसाधित किया जाता है, जिसे एक शक्ति द्वारा प्रवर्धित किया जाता है (जो वर्णमाला के आकार को बढ़ाता है), और फिर एक पीसीपी रचना को लागू किया जाता है (प्रत्येक बाधा को एक बड़ी वर्णमाला पर एक बाधा प्रणाली में बदल दिया जाता है) एक छोटी वर्णमाला)।

प्रक्रिया का निहित लक्ष्य है कि जब तक UNSAT मान एक स्थिर अंश (PCP प्रमेय साबित नहीं होता) हो जाता है, तब तक प्रवर्धन चरण का उपयोग करने का एक तरीका खोजा जाता है। मुख्य बिंदु यह है कि जब तक कि वर्णमाला का आकार हर बार वापस नहीं लिया जाता है, तब तक परिणामी ग्राफ वह नहीं है जो अंतिम कमी के लिए आवश्यक है।


9

आपके उदाहरण की आवश्यकताएं काफी सख्त हैं। यदि आप इसे केवल आराम की आवश्यकता है कि रूपांतरण में काम करता हैO(1)में उम्मीद । से समान रूप से नमूना लेना संभव है{0,1,2} उपयोग में, अपेक्षा में, सिक्के की एक निरंतर संख्या कम हो जाती है।

मैं इस पर एक विशेषज्ञ नहीं हूं, लेकिन एक अच्छा उदाहरण था वर्णमाला का आकार मायने रखता है कोडिंग और रसीला डेटा संरचनाएं हैं। कल्पना कीजिए कि आप वर्णमाला पर एक संदेश का प्रतिनिधित्व करना चाहते हैं{0,1,2} वर्णमाला में {0,1}(अपने बाइनरी कंप्यूटर में इसे स्टोर करने के लिए)। आप आवश्यक स्थान को कम से कम करना चाहते हैं, लेकिन साथ ही, आप संदेश के अलग-अलग वर्णों को तेजी से पढ़ना और लिखना चाहते हैं (चलो में बताएं)O(1))। पिछले कुछ समय से इस तरह की समस्याओं का अध्ययन किया जा रहा है। डोडिस, पैट्रस्कु, और थोरुप द्वारा हाल ही में कागज और उस पर संदर्भ, शुरू करने के लिए एक अच्छा बिंदु होना चाहिए।


8

कोड को सही करने में त्रुटि, यह संभव है कि द्विआधारी कोड और कोड के बीच एक बड़ा अंतर होता है, जिसमें गिलबर्ट वार्शमोव कोड के लिए उदाहरण देते हैं जो त्रुटियों के एक अंश को सही करते हैं (जो अनिवार्य रूप से लालची या यादृच्छिक उदाहरण हैं) कुछ के बारे में माना जाता है द्विआधारी मामले में तंग हो और बीजीय-ज्यामिति कोड के माध्यम से एक बड़ी वर्णमाला पर तंग नहीं जाना जाता है। इससे कुछ लोगों ने अनुमान लगाया कि एक बड़ी वर्णमाला के लिए कोड को सही करने की त्रुटि की मानक परिभाषा बाइनरी त्रुटि सुधार कोड का सही एनालॉग नहीं है।


5

मुझे अपने स्वयं के शोध में एक दिलचस्प मामले का सामना करना पड़ा है जिसके परिणामस्वरूप वर्णमाला के आकार में छोटे अंतर हैं, जिसके परिणामस्वरूप सिद्धांत में नाटकीय अंतर है। संभाव्य सर्किटों को सीखने की समस्या का एक मोटा विवरण निम्नलिखित है: एक शिक्षार्थी एक छिपे हुए सर्किट के द्वार को ओवरराइड कर सकता है और परिणामी आउटपुट का निरीक्षण कर सकता है, और लक्ष्य "कार्यात्मक रूप से समकक्ष" सर्किट का उत्पादन करना है। बूलियन सर्किट के लिए, जब भी किसी गेट का आउटपुट पर "प्रभाव" होता है, तो उस गेट से एक प्रभावशाली पथ को सर्किट के आउटपुट में अलग किया जा सकता है। वर्णमाला के आकार के सर्किट के लिए3यह अब मामला नहीं है - अर्थात्, ऐसे सर्किट हैं जिनके आउटपुट मूल्य पर बड़े प्रभाव के साथ द्वार हैं, लेकिन आउटपुट के लिए किसी एक मार्ग के साथ कोई प्रभाव नहीं है! हमें यह परिणाम काफी आश्चर्यजनक लगा।

परिणाम कुछ तकनीकी है, लेकिन यदि आप रुचि रखते हैं, तो आप प्रमेय कथनों के लिए धारा 4.1 के साथ लेम्मा 8 के विपरीत कर सकते हैं।


यह बहुत दिलचस्प लगता है। क्या आपने यह देखने के लिए प्रभाव की परिभाषा को संशोधित करने की कोशिश की है कि क्या आप बूलियन केस के समान कुछ प्राप्त कर सकते हैं?
केवह

प्रभाव की हमारी परिभाषा बहुत स्वाभाविक है - आप लक्ष्य के विभिन्न सेटिंग्स को दिए गए आउटपुट नोड की संभावना वितरण को देखते हैं। यदि सभी सेटिंग्स समान सटीक संभावना वितरण प्राप्त करती हैं, तो हम कहते हैं कि लक्ष्य का कोई प्रभाव नहीं है। यदि आप रुचि रखते हैं, तो जिस मॉडल के तहत हमने काम किया है, उसे VIQ मॉडल कहा जाता है, जो मुझे लगता है कि सबसे दिलचस्प सर्किट लर्निंग मॉडल है। यह एंग्लुइन एट अल द्वारा ( cs.yale.edu/homes/aspnes/… ) में परिभाषित किया गया था । STOC '06 में।
लेव Reyzin
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.