क्या संदर्भ मुक्त भाषाओं को पकड़ने वाले नियमित अभिव्यक्तियों का विस्तार मौजूद है?


25

संदर्भ-मुक्त व्याकरण (सीएफजी) से जुड़े कई पत्रों में, वहाँ प्रस्तुत ऐसे व्याकरणों के उदाहरण अक्सर उनके द्वारा उत्पन्न भाषा की आसान विशेषताओं को स्वीकार करते हैं। उदाहरण के लिए:

SaaSb
S

जनरेट करता है ,{a2ibi|i0}

SaSb
SaaSb
S

, और उत्पन्न करता है{aibjij0}

SaSa
SbSb
S

जनरेट करता है , या समतुल्य रूप से (जहां संदर्भित भाग ) को संदर्भित करता है ।{wwRw(a|b)}{((a|b))1((a|b))2p1=p2R}p1(...)1

उपरोक्त उदाहरण सभी सूचकांकों ( ) को जोड़कर उत्पन्न हो सकते हैं , इन सूचकांकों पर सरल बाधाएं ( ) और नियमित अभिव्यक्तियों से मेल खाते पैटर्न। यह मुझे आश्चर्यचकित करता है कि क्या सभी संदर्भ-मुक्त भाषाएँ नियमित अभिव्यक्तियों के कुछ विस्तार से उत्पन्न हो सकती हैं।aii>j

क्या नियमित अभिव्यक्तियों का एक विस्तार है जो संदर्भ मुक्त भाषाओं के सभी या कुछ महत्वपूर्ण सबसेट उत्पन्न कर सकता है?


3
गौर करें कि सूचकांक और बाधाओं को जोड़ने बहुत शक्तिशाली है: आप को परिभाषित करने में सक्षम हो जाएगा , जो एक सीएफएल नहीं है। anbncn
Shaull

जवाबों:


34

हाँ वहाँ है। निम्नलिखित व्याकरण द्वारा उत्पन्न शब्द होने के लिए एक संदर्भ-मुक्त अभिव्यक्ति को परिभाषित करें :

g::=ϵEmpty string|cCharacter c in alphabet Σ|ggConcatenation|Failing pattern|ggDisjunction|μα.gRecursive grammar expression|αVariable expression

यह क्लेन स्टार को छोड़कर नियमित भाषाओं के लिए सभी निर्माणकर्ता है, जिसे सामान्य फिक्स्ड-पॉइंट ऑपरेटर μ α द्वारा बदल दिया गया है , और एक चर संदर्भ तंत्र। (क्लीन तारा की जरूरत नहीं है, क्योंकि यह के रूप में परिभाषित किया जा सकता है जी * μ अल्फा μα.g ।)gμα.ϵgα

एक संदर्भ-मुक्त अभिव्यक्ति की व्याख्या के लिए मुक्त चर की व्याख्या के लिए लेखांकन की आवश्यकता होती है। तो एक परिभाषित पर्यावरण भाषाओं (यानी, के सबसेट को चर से एक नक्शे के होने की Σ * ), और [ ρ | α : L ] वह फ़ंक्शन हो , जो α को छोड़कर सभी इनपुट पर ρ की तरह व्यवहार करता है , और जो α के लिए L को भाषा में लौटाता है ।ρΣ[ρ|α:L]ραएलα

अब, संदर्भ-मुक्त अभिव्यक्ति की व्याख्या को निम्नानुसार परिभाषित करें:

[[ε]]ρ={ε}[[सी]]ρ={सी}[[जी1जी2]]ρ={w1w2||w1[[जी1]]ρw2[[जी2]]ρ}[[]]ρ=[[जी1जी2]]ρ=[[जी1]]ρ[[जी2]]ρ[[α]]ρ=ρ(α)[[μαजी]]ρ=nएनएलnकहा पेएल0=एलn+1=एलn[[जी]][ρ|α:एलn]

नस्टर-टार्स्की प्रमेय का उपयोग करते हुए, यह देखना आसान है कि की व्याख्या g अभिव्यक्ति का कम से कम निश्चित है।μαजी

यह सीधा है (यद्यपि पूरी तरह से तुच्छ नहीं है) यह दिखाने के लिए कि आप एक संदर्भ-मुक्त अभिव्यक्ति दे सकते हैं, जो किसी भी संदर्भ-मुक्त व्याकरण और उसी के विपरीत भाषा हो। गैर-तुच्छता इस तथ्य से उत्पन्न होती है कि संदर्भ-मुक्त अभिव्यक्तियों में निश्चित बिंदु होते हैं, और संदर्भ-मुक्त व्याकरण आपको एक एकल बिंदु पर एक निश्चित बिंदु देता है। इसके लिए बीकिक के लेम्मा के उपयोग की आवश्यकता होती है, जो ठीक कहता है कि एक नेस्टेड निश्चित बिंदुओं को एक उत्पाद (और इसके विपरीत) पर एकल निश्चित बिंदु में परिवर्तित किया जा सकता है। लेकिन यह एकमात्र सूक्ष्मता है।

संपादित करें: नहीं, मैं इसके लिए एक मानक संदर्भ नहीं जानता: मैंने इसे अपने हित के लिए काम किया। हालांकि, यह एक स्पष्ट पर्याप्त निर्माण है जो मुझे विश्वास है कि यह पहले आविष्कार किया गया है। कुछ आकस्मिक Googling ने Joost Winter, Marcello Bonsangue और Jan Rutten के हालिया पेपर कॉन्सेप्ट-फ्री लैंग्वेजेस, Coalgebraically का खुलासा किया , जहां वे इस परिभाषा का एक संस्करण देते हैं (सभी निश्चित बिंदुओं पर पहरा देने की आवश्यकता होती है, जिसे वे संदर्भ-मुक्त अभिव्यक्ति भी कहते हैं।


यह बहुत बढ़िया है। क्या इसके लिए कोई मानक नाम या संदर्भ है?
एलेक्स दस ब्रिंक

5
आर्टो सलोमा ने 1973 में अपनी पुस्तक "औपचारिक भाषा" में इसे शामिल किया है। वह उन्हें "रेगुलर-लाइक एक्सप्रेशंस" कहते हैं।
टिम शेफ़र

3

उन भाषाओं के बारे में MathOverflow पर एक निकट से संबंधित प्रश्न (और कई उत्तर) थे जिनके निर्माण कार्य होलोनोमिक हैं

दिलचस्प है, ऊपर के शब्दार्थों की नील की परिभाषा अंतर्निहित प्रजाति प्रमेय के माध्यम से पुनरावर्ती प्रजाति समीकरणों के लिए प्रजाति समाधान के अस्तित्व के बिल्कुल (रचनात्मक) प्रमाण से मेल खाती है । दुर्भाग्य से, उसकी प्रमाणिक रूपरेखा में एक सूक्ष्म गलती भी होनी चाहिए, क्योंकि ऐसे मामले हैं जहां चीजें 'अनंत' हो जाती हैं। दूसरे शब्दों में, व्याकरण द्वारा परिभाषित गैर-एकवचन होने के लिए परिभाषित परिवर्तन के जेकबियन पर एक शर्त है जो आवश्यक है। संभवत: यही कारण है कि बोंसंग्यू-रुट्टेन को निर्धारित बिंदुओं की रक्षा करने की आवश्यकता होती है, जैसा कि जैकोबियन पर इस स्थिति का बीमा करने का एक तरीका है।μ


μαजी[μαजी/α]जी

1

हमने हाल ही में एक रूपरेखा की रूपरेखा प्रकाशित की है जो कि बस यही करेगी। Comp.compilers के नीचे देखो , जहां मैंने कुछ लिंक के साथ एक अधिसूचना भेजी थी।

नए घटनाक्रम चॉम्स्की-शूएटज़ेनबर्गर प्रमेय से काम करते हैं और इसे इस परिणाम के पूरा होने के रूप में माना जा सकता है। चॉम्स्की ने खुद को घटनाक्रम से अवगत कराया है और "पकड़ने" की इच्छा को इंगित करता है।

इस विकास के साथ, हम संदर्भ-मुक्त अभिव्यक्तियों के लिए दो अलग-अलग योगों की समतुल्यता स्थापित करते हैं - एक जो "न्यूनतम निर्धारित बिंदु" म्यू-कैलकुलस रूप का विस्तार / पूर्णता है (मूल रूप से ग्रुस्का, येंटेमा और मैकविटर द्वारा -) जिसे 2014 में अंतिम रूप दिया गया - और दूसरा 2008 में प्रकाशित हुआ।


4
कृपया सभी प्रासंगिक जानकारी उत्तर में ही शामिल करें। "Comp.compilers के तहत देखो" अब पहले से ही एक unhelpul जवाब है, और यह कुछ महीनों में पूरी तरह से बेकार हो जाएगा।
एमिल जेकाबेक मोनिका

यह पूरी तरह से गलत है। Comp.compilers (इस साइट और अन्य ब्लॉगों के विपरीत, वैसे) स्थायी रूप से संग्रहीत है। वहां आपको अपनी जरूरत का सारा विवरण मिल जाएगा। कई लिंक हैं जो वहां पाए जा सकते हैं, सबसे हाल ही में पोस्ट किए गए लेख में भी। इसके अलावा, ब्लॉग साइटों के विपरीत, यह बाहर की ओर खुला है और बहुत व्यापक दर्शकों के लिए उपयोगी है। आपको USENET पर कुछ भी खोजने में कोई कठिनाई नहीं होनी चाहिए - जो कि इस तरह के प्रश्नों को संबोधित और चर्चा की जानी चाहिए। यदि आपको कठिनाई है, तो यहां लिंक है। groups.google.com/forum/#!topic/comp.compilers/YCa5jHUR1iQ
NinjaDarth

2
मुद्दा यह नहीं है कि यह संग्रहीत नहीं है, लेकिन यह कि अभिलेख विशाल हैं। जब मैं अभिलेखागार देखो अब मैं शीर्ष के निकट अपनी पोस्ट कहीं पा सकते हैं, लेकिन जब कोई भविष्य में इस जवाब में कुछ महीनों या वर्षों दिखाई देंगी और वे पता नहीं जहां खुदाई शुरू करने के लिए होगा। यह अभिमानी और अशिष्ट है कि पाठकों को एक लंबी और अविश्वसनीय खोज करें जब आप उन्हें अधिक विशिष्ट स्थान पर इंगित कर सकते हैं। अब, मैंने इसे आपके लिए किया। इसमें 30 सेकंड का समय लगता था। आप खुद ऐसा कर सकते थे।
एमिल जेकाबेक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.