नियमित अभिव्यक्तियों को देखते हुए , क्या के लिए सबसे छोटे संदर्भ-मुक्त व्याकरण के आकार पर कोई गैर-तुच्छ सीमाएं हैं ?आर 1 ∩ ⋯ ∩ आर एन
नियमित अभिव्यक्तियों को देखते हुए , क्या के लिए सबसे छोटे संदर्भ-मुक्त व्याकरण के आकार पर कोई गैर-तुच्छ सीमाएं हैं ?आर 1 ∩ ⋯ ∩ आर एन
जवाबों:
यह एक महान प्रश्न है और यह वास्तव में मेरे हितों के भीतर है। मुझे खुशी है कि आपने इसे मैक्स से पूछा।
चलो साथ DFA के सबसे पर हे ( एन ) प्रत्येक दिए जाने कहा गया है। यह अच्छा होगा यदि डीएएफए की भाषाओं के प्रतिच्छेदन को स्वीकार करने वाले कई राज्यों में उप-घातांक के साथ एक पीडीए मौजूद हो। हालाँकि, मेरा सुझाव है कि ऐसा पीडीए हमेशा मौजूद नहीं हो सकता है।
कॉपी भाषा पर विचार करें। अब, इसे लंबाई n के स्ट्रिंग्स की प्रतिलिपि बनाने के लिए प्रतिबंधित करें।
औपचारिक रूप से, -copy पर विचार करें : = { x x ।
हम सबसे अधिक O ( n ) पर n DFA के आकार के प्रतिच्छेदन के रूप में -copy का प्रतिनिधित्व कर सकते हैं । हालांकि, सबसे छोटा डीएफए जो एन- कोपी स्वीकार करता है, में 2 D ( एन ) राज्य हैं।
इसी तरह, यदि हम खुद को एक द्विआधारी स्टैक वर्णमाला तक सीमित रखते हैं, तो मुझे संदेह है कि सबसे छोटा पीडीए जो कोपी को स्वीकार करता है, उसके कई राज्यों में तेजी है।
पुनश्च मुझे एक ईमेल भेजने के लिए स्वतंत्र महसूस करें यदि आप आगे चर्चा करना चाहते हैं। :)
मुझे नहीं लगता कि कोई गैर-तुच्छ निचला या ऊपरी सीमा हो सकती है।
निचली सीमा के लिए, एक निश्चित k के लिए भाषा पर विचार करें । सबसे छोटे संदर्भ-मुक्त व्याकरण का आकार L 1 के नियमित अभिव्यक्ति के आकार में लघुगणकीय है , जबकि L 1 के लिए सबसे छोटे ऑटोमेटन का आकार L 1 के regex के आकार में रैखिक है । यदि हम अन्य भाषाओं के साथ L 1 को काटते हैं तो यह घातीय अंतर समान रहता है ।
ऊपरी सीमा के लिए, एक भाषा L 2 पर विचार करें जिसमें बिल्कुल एक हो
deBruijn-Sequence of length । यह ज्ञात है कि L 2 के लिए सबसे छोटे व्याकरण का आकार सबसे खराब है, अर्थात O ( n), इसलिएएल2 केलिए "सबसे छोटे" ऑटोमेटन का अंतरकेवल एक लघु कारक है, प्रस्ताव 1
एक गैर-तुच्छ सामान्य निचली या ऊपरी सीमा उन परिणामों का विरोधाभास करेगी, क्योंकि 1 भाषाओं के प्रतिच्छेदन के लिए भाषाओं के प्रतिच्छेदन के लिए क्या सही होना चाहिए ।
मुझे माइकल का दूसरा निर्णय लेने दें, यह वास्तव में एक दिलचस्प सवाल है। माइकल के मुख्य विचार को साहित्य से परिणाम के साथ जोड़ा जा सकता है, इस प्रकार एक कठोर प्रमाण के साथ एक समान निचली सीमा प्रदान करता है।
मैं सीएफजी आकार पर सीमा का उल्लेख करता हूं, जो कि नियमित अभिव्यक्ति में अल्फाबेटिक प्रतीकों की कुल संख्या के संदर्भ में है । इस संख्या को k द्वारा निरूपित किया जाए । (जैसा कि john_leo ने उल्लेख किया है, चौराहे पर भाग लेने वाले नियमित अभिव्यक्तियों की संख्या के संदर्भ में हमें कोई उपयोगी सीमा नहीं मिलेगी।)
न तो ओपी और न ही माइकल ने इसका उल्लेख करना आवश्यक समझा, लेकिन नियमित अभिव्यक्ति के एक चौराहे को एनएफए में बदलने के लिए (राज्यों की संख्या पर) की एक ऊपरी सीमा को आसानी से साबित किया जा सकता है। रिकॉर्ड के लिए, यह यहां है: Glushkov ऑटोमेटा में नियमित अभिव्यक्तियों को परिवर्तित करें, जो सभी गैर-रिटर्निंग हैं। फिर इन भाषाओं के प्रतिच्छेदन के लिए NFA प्राप्त करने के लिए उत्पाद निर्माण लागू करें। (मुझे लगता है कि एक सुधार कर सकते हैं करने के लिए बाध्य 2 कश्मीर + 1 या तो।) एक रों -state NFA एक सही रेखीय व्याकरण में बदला जा सकता आकार की (जो एक CFG की एक विशेष मामला है) हे ( रों 2 )(यदि हम व्याकरण के आकार को बाईं ओर- और दाएं-हाथों की प्रस्तुतियों के कुल प्रतीकों के रूप में मापते हैं), तो इस प्रकार आकार दिया जाता है । यदि आपके मन में व्यावहारिक अनुप्रयोग हैं, तो यह निश्चित रूप से भयानक लगता है। NFA के आकार का अनुमान लगाने के लिए nondeterministic राज्य जटिलता के बजाय nondeterministic संक्रमण जटिलता का उपयोग करके एक बेहतर बाध्य साबित करने की कोशिश करना प्रयास के लायक हो सकता है।
दूसरे भाग में एक साक्षी भाषा मिल रही है, जिसे नियमित रूप से नियमित अभिव्यक्तियों के प्रतिच्छेदन के रूप में व्यक्त किया जा सकता है, लेकिन एक सीएफजी के साथ वर्णन करने के लिए जरूरी बोझिल है। (यहाँ हम एक कम भाषा पैदा सभी CFGs, जिनमें से असीम कई किया जा सकता है के आकार पर बाध्य स्थापित करने के लिए की जरूरत है।) निम्न तर्क एक देता है निचला बाउंड।
परिमित भाषा पर विचार करें , जहां डब्ल्यू आर का प्रत्यावर्तन को दर्शाता है डब्ल्यू । फिर L n को निम्नलिखित 2 n + 1 नियमित अभिव्यक्तियोंके प्रतिच्छेदन के रूप में व्यक्त किया जा सकता है:
कुल संख्या अभिव्यक्ति के इस चौराहे में वर्णमाला प्रतीकों में से है हे ( एन 2 ) ।
Theorem 13 के प्रमाण में दिए गए तर्क का उपयोग करते हुए ( 1 ), कोई भी यह साबित कर सकता है कि उत्पन्न करने वाले प्रत्येक चक्रीय CFG में कम से कम 2 n / ( 2 n ) = 2 Ω ( the) होने चाहिएभिन्न चर, यदि प्रत्येक नियम के दाईं ओर की लंबाई अधिकतम2 है। चरों की संख्या के बारे में बहस करने के लिए बाद की स्थिति आवश्यक है, क्योंकि हम एक एकल चर के साथ एक परिमित भाषा उत्पन्न कर सकते हैं। लेकिन व्याकरण के आकार के दृष्टिकोण से, यह स्थिति वास्तव में प्रतिबंध नहीं है, क्योंकि हम इस सीएफजी को आकार में केवल एक रैखिक ब्लोअप के साथ बदल सकते हैं, देखें (2)। ध्यान दें कि अरविंद एट अल द्वारा उपयोग की जाने वाली भाषा। आकारnकी एक वर्णमाला के ऊपर है, और यहnn/(2n)की एक सीमा देता है; लेकिन तर्क स्पष्ट संशोधनों के साथ किया जाता है।
फिर भी, और उपर्युक्त निचली सीमा के बीच एक बड़ा अंतर रहता है ।
संदर्भ:
वी। अरविंद, पुष्कर एस। जोगलेकर, श्रीकांत श्रीनिवासन। अंकगणित सर्किट और बहुपत्नी के Hadamard उत्पाद , FSTTCS 2009, वॉल्यूम। 4 LIPIcs, पीपी। 25-36
लैंग, मार्टिन; लीओ, हंस (2009)। " CNF को CNF या नहीं? CYK एल्गोरिथम का एक कुशल अभी तक प्रस्तुत करने योग्य संस्करण "। इंफॉर्मेटिका डिडक्टिका 8।