संदर्भ-मुक्त व्याकरण के रूप में नियमित भाषाओं के प्रतिच्छेदन की जटिलता


20

नियमित अभिव्यक्तियों को देखते हुए , क्या के लिए सबसे छोटे संदर्भ-मुक्त व्याकरण के आकार पर कोई गैर-तुच्छ सीमाएं हैं ?आर 1आर एनR1,,RnR1Rn


??? यह कल्पना करने की कोशिश कर रहा है। क्या कोई तरकीब है? का चौराहा नियमित है। कोई भी मानक विधियों के माध्यम से न्यूनतम DFA (wrt राज्य गणना) पा सकता है जो कि CFG भी है। Rn
vnn

@vzn: आप सही हैं। समस्या यह है कि यह डीएफए, और इसलिए सीएफजी, बहुत बड़ी हो सकती है। मैं सोच रहा था कि कोई व्यक्ति चौराहे का अधिक संक्षिप्त विवरण प्राप्त करने के लिए सीएफजी की अतिरिक्त शक्ति का उपयोग कर सकता है या नहीं।
मैक्स

अनुमान नहीं। संदेह है कि हर सीएफएल जो पहचानता है (यानी एक बराबर है) एक आरएल अपने स्टैक का उपयोग नहीं करता है या एक को ऐसे राज्यों में वृद्धि नहीं के साथ परिवर्तित नहीं किया जा सकता है, और न्यूनतम ऐसे पीडीए (wrt राज्य गणना) न्यूनतम के समान आकार है DFA। इस बात का प्रमाण कभी नहीं देखा / देखा है। शायद यह मुश्किल नहीं है? एक सरल प्रश्न, क्या कोई पीडीए है जो एक आरएल को पहचानता है जो डीएफए से छोटा है? सोचिए मत।
15 सितंबर को vzn

@vzn: उपयोगी अनुमान, लेकिन गलत: चलोLk दो प्रकार के कोष्ठक पर डाइक भाषाओं का सबसेट है जहां अधिकतम घोंसले की गहराई । वहाँ के लिए एक CFG है एल कश्मीर आकार की हे ( कश्मीर ) , लेकिन कम से कम DFA (यहां तक कि, मुझे लगता है, कम से कम NFA) आकार की है हे ( 2 कश्मीर )kLkO(k)O(2k)
मैक्स

डाइक भाषाएँ सीएफएल हैं लेकिन आरएलएस नहीं ...? लेकिन देखें कि आप अधिकतम घोंसले की गहराई को सीमित कर रहे हैं ... तो क्या आप आरएल चौराहों के साथ उसी भाषा का निर्माण कर सकते हैं? क्या / जहां सबूत है कि न्यूनतम डीएफए वह बड़ा है? क्या वह है ? आप एक न्यूनतम मानदंड या कहीं और परिभाषित नहीं करते हैं और राज्यों को एक प्राकृतिक मामले के रूप में लिया है, लेकिन केवल एक ही नहीं है। O(2k)
vnn

जवाबों:


6

यह एक महान प्रश्न है और यह वास्तव में मेरे हितों के भीतर है। मुझे खुशी है कि आपने इसे मैक्स से पूछा।

चलो साथ DFA के सबसे पर हे ( एन ) प्रत्येक दिए जाने कहा गया है। यह अच्छा होगा यदि डीएएफए की भाषाओं के प्रतिच्छेदन को स्वीकार करने वाले कई राज्यों में उप-घातांक के साथ एक पीडीए मौजूद हो। हालाँकि, मेरा सुझाव है कि ऐसा पीडीए हमेशा मौजूद नहीं हो सकता है।nO(n)

कॉपी भाषा पर विचार करें। अब, इसे लंबाई n के स्ट्रिंग्स की प्रतिलिपि बनाने के लिए प्रतिबंधित करें।

औपचारिक रूप से, -copy पर विचार करें : = { x xn:= {xx|x{0,1}n}

हम सबसे अधिक O ( n ) पर n DFA के आकार के प्रतिच्छेदन के रूप में -copy का प्रतिनिधित्व कर सकते हैं । हालांकि, सबसे छोटा डीएफए जो एन- कोपी स्वीकार करता है, में 2 D ( एन ) राज्य हैं।nnO(n)n2Ω(n)

इसी तरह, यदि हम खुद को एक द्विआधारी स्टैक वर्णमाला तक सीमित रखते हैं, तो मुझे संदेह है कि सबसे छोटा पीडीए जो कोपी को स्वीकार करता है, उसके कई राज्यों में तेजी है।n

पुनश्च मुझे एक ईमेल भेजने के लिए स्वतंत्र महसूस करें यदि आप आगे चर्चा करना चाहते हैं। :)


5

मुझे नहीं लगता कि कोई गैर-तुच्छ निचला या ऊपरी सीमा हो सकती है।
निचली सीमा के लिए, एक निश्चित k के लिए भाषा पर विचार करें । सबसे छोटे संदर्भ-मुक्त व्याकरण का आकार L 1 के नियमित अभिव्यक्ति के आकार में लघुगणकीय है , जबकि L 1 के लिए सबसे छोटे ऑटोमेटन का आकार L 1 के regex के आकार में रैखिक है । यदि हम अन्य भाषाओं के साथ L 1 को काटते हैं तो यह घातीय अंतर समान रहता है । ऊपरी सीमा के लिए, एक भाषा L 2 पर विचार करें जिसमें बिल्कुल एक होL1={a2k}kL1L1एल1एल1
एल2deBruijn-Sequence of length । यह ज्ञात है कि L 2 के लिए सबसे छोटे व्याकरण का आकार सबसे खराब है, अर्थात O ( n)nएल2, इसलिएएल2 केलिए "सबसे छोटे" ऑटोमेटन का अंतरकेवल एक लघु कारक है, प्रस्ताव 1हे(nलॉगn)एल2

एक गैर-तुच्छ सामान्य निचली या ऊपरी सीमा उन परिणामों का विरोधाभास करेगी, क्योंकि 1 भाषाओं के प्रतिच्छेदन के लिए भाषाओं के प्रतिच्छेदन के लिए क्या सही होना चाहिए ।n1


सिंगल डे ब्रिजन-सीक्वेंस के लिए सबसे छोटे व्याकरण के आकार पर टिप्पणी काफी दिलचस्प है। क्या आप कृपया एक संदर्भ प्रदान कर सकते हैं। धन्यवाद।
बजे माइकल वीहर

इसके अलावा, मुझसे गलती हो सकती है, लेकिन ऐसा लगता है कि आपने केवल एक नियमित अभिव्यक्ति के लिए समस्या को संबोधित किया (बजाय नियमित अभिव्यक्ति के उत्पाद के)?
माइकल वीहर

@ मिचेलयर वेप, मैंने केवल एक ही नियमित अभिव्यक्ति पर विचार किया। क्योंकि अगर यह भाषाओं के प्रतिच्छेदन के लिए सही होना चाहिए , तो यह निश्चित रूप से तुच्छ चौराहे के लिए सही होना चाहिए। मुझे नहीं पता कि इन मामलों को बाहर करने के लिए प्रश्न का कैसे सुधार किया जाए। मैंने संदर्भ जोड़ा, ठीक है, माफ करना चाहिए था। n
john_leo

1
धन्यवाद! आप एक विशिष्ट उदाहरण का वर्णन करने में सक्षम थे। यहाँ एक सरल टिप्पणी है जो ऐसे उदाहरणों के अस्तित्व की ओर ले जाती है। N को दिया जाए। लंबाई n के 2 ^ n तार हैं। इसके अलावा, अधिकांश n / log (n) राज्यों में 2 ^ n ट्यूरिंग मशीनें नहीं हैं। इसलिए, लंबाई n के कुछ स्ट्रिंग x जैसे कि n / log (n) से कम वाली कोई ट्यूरिंग मशीन भाषा {x} को स्वीकार नहीं करती है। इसलिए, {x} n राज्यों के साथ DFA द्वारा स्वीकार किया जाता है और n / log (n) राज्यों से कम पीडीए द्वारा स्वीकार नहीं किया जा सकता है।
माइकल वीहर

5

मुझे माइकल का दूसरा निर्णय लेने दें, यह वास्तव में एक दिलचस्प सवाल है। माइकल के मुख्य विचार को साहित्य से परिणाम के साथ जोड़ा जा सकता है, इस प्रकार एक कठोर प्रमाण के साथ एक समान निचली सीमा प्रदान करता है।

मैं सीएफजी आकार पर सीमा का उल्लेख करता हूं, जो कि नियमित अभिव्यक्ति में अल्फाबेटिक प्रतीकों की कुल संख्या के संदर्भ में है । इस संख्या को k द्वारा निरूपित किया जाए । (जैसा कि john_leo ने उल्लेख किया है, चौराहे पर भाग लेने वाले नियमित अभिव्यक्तियों की संख्या के संदर्भ में हमें कोई उपयोगी सीमा नहीं मिलेगी।)n

न तो ओपी और न ही माइकल ने इसका उल्लेख करना आवश्यक समझा, लेकिन नियमित अभिव्यक्ति के एक चौराहे को एनएफए में बदलने के लिए (राज्यों की संख्या पर) की एक ऊपरी सीमा को आसानी से साबित किया जा सकता है। रिकॉर्ड के लिए, यह यहां है: Glushkov ऑटोमेटा में नियमित अभिव्यक्तियों को परिवर्तित करें, जो सभी गैर-रिटर्निंग हैं। फिर इन भाषाओं के प्रतिच्छेदन के लिए NFA प्राप्त करने के लिए उत्पाद निर्माण लागू करें। (मुझे लगता है कि एक सुधार कर सकते हैं करने के लिए बाध्य 2 कश्मीर + 1 या तो।) एक रों -state NFA एक सही रेखीय व्याकरण में बदला जा सकता आकार की (जो एक CFG की एक विशेष मामला है) हे ( रों 2 )2+12+1रोंहे(रों2)(यदि हम व्याकरण के आकार को बाईं ओर- और दाएं-हाथों की प्रस्तुतियों के कुल प्रतीकों के रूप में मापते हैं), तो इस प्रकार आकार दिया जाता है । यदि आपके मन में व्यावहारिक अनुप्रयोग हैं, तो यह निश्चित रूप से भयानक लगता है। NFA के आकार का अनुमान लगाने के लिए nondeterministic राज्य जटिलता के बजाय nondeterministic संक्रमण जटिलता का उपयोग करके एक बेहतर बाध्य साबित करने की कोशिश करना प्रयास के लायक हो सकता है।हे(4)

दूसरे भाग में एक साक्षी भाषा मिल रही है, जिसे नियमित रूप से नियमित अभिव्यक्तियों के प्रतिच्छेदन के रूप में व्यक्त किया जा सकता है, लेकिन एक सीएफजी के साथ वर्णन करने के लिए जरूरी बोझिल है। (यहाँ हम एक कम भाषा पैदा सभी CFGs, जिनमें से असीम कई किया जा सकता है के आकार पर बाध्य स्थापित करने के लिए की जरूरत है।) निम्न तर्क एक देता है निचला बाउंड।2Ω(/लॉग)

परिमित भाषा पर विचार करें , जहां डब्ल्यू आर का प्रत्यावर्तन को दर्शाता है डब्ल्यू । फिर L n को निम्नलिखित 2 n + 1 नियमित अभिव्यक्तियोंके प्रतिच्छेदन के रूप में व्यक्त किया जा सकता है:एलn={wwआरw{,}*||w|=n}wआरwएलn2n+1

  • , के लिए 1 आरमैं=(+)मैं(+)2(n-मैं-1)(+)*+(+)मैं(+)2(n-मैं-1)(+)* ;1मैंn
  • , के लिए 1 रोंमैं=(+)*(+)2(n-मैं-1)(+)मैं+(+)*(+)2(n-मैं-1)(+)मैं ;1मैंn
  • =(+)3n

कुल संख्या अभिव्यक्ति के इस चौराहे में वर्णमाला प्रतीकों में से है हे ( एन 2 )हे(n2)

Theorem 13 के प्रमाण में दिए गए तर्क का उपयोग करते हुए ( 1 ), कोई भी यह साबित कर सकता है कि उत्पन्न करने वाले प्रत्येक चक्रीय CFG में कम से कम 2 n / ( 2 n ) = 2 Ω ( the) होने चाहिएएलnभिन्न चर, यदि प्रत्येक नियम के दाईं ओर की लंबाई अधिकतम2 है। चरों की संख्या के बारे में बहस करने के लिए बाद की स्थिति आवश्यक है, क्योंकि हम एक एकल चर के साथ एक परिमित भाषा उत्पन्न कर सकते हैं। लेकिन व्याकरण के आकार के दृष्टिकोण से, यह स्थिति वास्तव में प्रतिबंध नहीं है, क्योंकि हम इस सीएफजी को आकार में केवल एक रैखिक ब्लोअप के साथ बदल सकते हैं, देखें (2)। ध्यान दें कि अरविंद एट अल द्वारा उपयोग की जाने वाली भाषा। आकारnकी एक वर्णमाला के ऊपर है, और यहnn/(2n)की एक सीमा देता है; लेकिन तर्क स्पष्ट संशोधनों के साथ किया जाता है।2n/(2n)=2Ω(/लॉग)2nnn/(2n)

फिर भी, और उपर्युक्त निचली सीमा के बीच एक बड़ा अंतर रहता है ।हे(4n)

संदर्भ:

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.