संघ, संघटन और स्टार संचालन के साथ नियमित अभिव्यक्ति क्यों परिभाषित की जाती हैं?


11

एक नियमित एक्सप्रेस के रूप में पुनरावर्ती रूप से परिभाषित किया गया है

  1. a लिए एक नियमित अभिव्यक्ति है,aΣ
  2. ε एक नियमित अभिव्यक्ति है,
  3. एक नियमित अभिव्यक्ति है,
  4. (R1R2) जहां और नियमित अभिव्यक्ति हैं, एक नियमित अभिव्यक्ति है,आर 2R1R2
  5. (R1R2) जहाँ और नियमित अभिव्यक्ति हैं, एक नियमित अभिव्यक्ति है,आर 2R1R2
  6. (R1) जहाँ एक नियमित अभिव्यक्ति है एक नियमित अभिव्यक्ति है।R1

यह परिभाषा 64 के पृष्ठ से ली गई है

Sipser, माइकल। संगणना के सिद्धांत का परिचय, तीसरा संस्करण। सेंगेज लर्निंग, 2012।

अब, मेरे पास निम्नलिखित प्रश्न हैं।

  • क्यों परिभाषा शामिल नहीं है intersection, complementया reverseआपरेशन?
  • अगर हम 4th आइटम को , तो क्या हमें एक समतुल्य परिभाषा मिलती है, अर्थात प्रत्येक नियमित भाषा के लिए, एक नियमित रेगुलर एक्सप्रेशन है और इसके विपरीत?R1R2
  • मुझे पता है कि यह परिभाषा पूर्ण और अच्छी तरह से परिभाषित है, लेकिन इसे अन्य समान, अच्छी तरह से परिभाषित और पूर्ण परिभाषाओं के लिए क्यों पसंद किया जाता है?

2
कृपया अपने आप को प्रति पोस्ट एक प्रश्न तक सीमित रखें।
राफेल

जवाबों:


16

1) यदि हम प्रतिच्छेदन और पूरक की भी अनुमति देते हैं, तो परिणामी अभिव्यक्तियों को कभी-कभी विस्तारित नियमित अभिव्यक्ति कहा जाता है; चूंकि नियमित भाषाएं बूलियन ऑपरेशन के तहत बंद होती हैं, इसलिए उनके द्वारा कुछ भी प्राप्त नहीं किया जाता है। यह सिंटैक्टिक शुगर है। इसी तरह का निष्कर्ष रिवर्स ऑपरेशन के लिए है। इस कारण का कारण है कि पहले उदाहरण में अन्य सभी कार्यों का उल्लेख नहीं किया गया है, परिभाषा को यथासंभव सरल रखने का लक्ष्य है, ताकि (आगमनात्मक) सबूतों को कई मामलों का ध्यान न रखना पड़े। एक और कारण यह हो सकता है कि यदि हम कुछ कार्यों की अनुमति देते हैं, लेकिन अन्य नहीं, तो कुछ मामलों में, कुछ अलग (उप-अनियमित) भाषा कक्षाओं के परिणाम, उदाहरण के लिए यदि हम स्टार ऑपरेटर के बिना विस्तारित नियमित अभिव्यक्ति पर विचार करते हैं, तो हमें नियमित लोगों का उचित उपवर्ग प्राप्त होता है। , तथाकथित स्टार-मुक्त या एपेरियोडिक भाषाएं, विकिपीडिया देखें : स्टार-मुक्त भाषा

2) यदि हम आइटम 1. रखते हैं - 6. लेकिन सिर्फ आइटम को बदल दें 4. संघ के बजाय चौराहे का उपयोग करने में, हमें नियमित भाषाओं का उचित उपवर्ग प्राप्त होता है। उदाहरण के लिए हम अब भाषा का वर्णन नहीं कर सकते हैं क्योंकि इसमें और का मिलन होगा (नीचे प्रमाण देखें)। यदि हम पूरकता की अनुमति देते हैं, तो चीजें बदल जाती हैं क्योंकि हमारे पास DeMorgan के कानूनों द्वारा संघ वापस आ गया है।{ a } { b }L={a,b}{a}{b}

3) यह आंशिक रूप से मेरे द्वारा 1 में उत्तर दिया गया था), लेकिन जब आप कहते हैं कि इस परिभाषा को प्राथमिकता दी जाती है, तो आपका क्या मतलब है? मुझे पता है कि 2. कहाँ छोड़ा गया है (जैसा कि हमारे पास 6. है कि ), या 3. छोड़ा गया है (जैसा कि हमारे पास ), या दोनों छूट गए हैं; इसलिए यह न्यूनतम संभव परिभाषा नहीं है (यह हमें कुछ सिंटैक्टिक चीनी भी देता है क्योंकि हमारे पास और का वर्णन करने के लिए अतिरिक्त प्रतीक हैं ।= एल ( ¯ एक्स * { ε } L()={ε}=L(X¯{ε}

संपादित करें : 2 में मेरी पहली उल्लेखित टिप्पणी गलत थी, तहत आगमनात्मक बंद करने वाली भाषाएं , और नहीं है, कुछ लिए उपसमुच्चय हैं , उदाहरण के लिए पर विचार करें । फिर भी हमारे पास वर्णन इस तरह की अभिव्यक्ति से नहीं किया जा सकता है। मैं एक प्रमाण दूंगा, अर्थात् मैं प्रमाण देता हूं कि यदि कुछ अभिव्यक्ति के लिए संशोधित 4th आइटम के साथ है, तो यदि (और इसलिए ) " प्रमाण अभिव्यक्ति पर प्रेरण द्वारा जाता है*एक्स * एक्स एक्स एल ( एक ) = { एक } एल = { एक , } एल = एल ( आर ) एक्स = { एक , } एक { एक , } एल एक एल आर एल ( आर 1 )xxXL(ab)={ab}L={a,b}L=L(R)X={a,b}ab

{a,b}LabL.
R । बेस केस के लिए यह रिक्तता से चलता है, अब मान लीजिए यह । यदि और , तो इसलिए इंडक्शन परिकल्पना के अनुसार हमने । यदि तो हमें होना चाहिए। और या इसके विपरीत । पहला मामला मान लीजिए। यदि , तो प्रेरण परिकल्पना के अनुसारएल = एल ( आर 1आर 2 ) एल ( आर 2 ) { एक , } एल ( आर 1आर 2 ) = एल ( आर बी L(R1),L(R2){ एक , } एल { एक , } एल ( आर मैं ) , मैं = 1 , 2 एक एल ( आर 1 ) L=L(R1R2)=L(R1)L(R2){a,b}L{a,b}L(Ri),i=1,2abL(R1)L(R2)एक = एक ε = ε एक एक एल ( आर 1 ) ε एल ( आर 2 ) एल ( आर 1 ) एक{a,b}L(R1R2)=L(R1)L(R2)a=aε=εaaL(R1)εL(R2)bL(R1)एक = एक ε एल ( आर 1 ) एल ( आर 2 ) एल ( आर 2 ) एक एल ( आर 2 ) एल ( आर 2 ) एल ( आर 1 ) एल ( आर 2 ) एक , एलabL(R1)ab=abεL(R1)L(R2) । अब मान लें कि , तो हमारे पास की परिभाषा के द्वारा । अंत में यदि , तो और में कुछ । यदि हम इंडक्शन परिकल्पना के द्वारा पाते हैं, तो मान लीजिए , लेकिन यह देता , इसी तरह या देता है। और इंडक्शन परिकल्पना देता है।bL(R2)abL(R2)L(R2)L(R1)L(R2)एक एल ( आर 1 ) nएल ( आर 2 ) मीटर n , मी > 0a,bL(R1)aL(R1)nbL(R2)mn,m>0एक एल ( आर 1 ) n > 1 एक एल ( आर 1 ) मीटर = 1 मीटर > 1 बी एल ( आर 1)n=m=1abL(R1)n>1aL(R1)m=1m>1एक एल ( आर 1 ) एल ( आर * 1 ) bL(R1)abL(R1)L(R1)

टिप्पणी: आमतौर पर एक निष्कर्ष निकाला जाता है: यदि , तो या । यह निम्नानुसार है, इसलिए और या और । पहले मामले में हमारे पास और इसलिए ।u = a w = a 1 = | | = | यू डब्ल्यू | = | यू | + | w | | यू | = 0 | w | = 1 | यू | = 1 | w | = 0 यू = ε एक = wa=uwu=aw=a1=|a|=|uw|=|u|+|w||u|=0|w|=1|u|=1|w|=0u=εa=w


2
वास्तव में "उपचारात्मक" भाषाओं के सेट में नहीं है, लेकिन है क्योंकि । { एक , } * { एक , } * = ( एक ** ) *{a,b}{a,b}{a,b}=(ab)
रिसी

हां, कभी-कभी यह देखना थोड़ा मुश्किल होता है कि क्या व्यक्त किया जा सकता है और क्या नहीं जैसा कि स्टार और अन्य लोगों के एक चतुर संयोजन से आप काफी दूर हो सकते हैं।
स्टेफान

10

तकनीकी रिपोर्ट जो नियमित भाषा, नियमित अभिव्यक्ति और परिमित ऑटोमेटा पेश करती है, पृष्ठ 70 पर आपका प्रश्न पूछती है:

प्रश्न पाठक के लिए हो सकता है, हमने विशेष तीन संचालन , और चयन क्यों किया ?EFEFEF

(इसके तुरंत बाद, यह नोट किया गया कि तुलना में अधिक सुविधाजनक ऑपरेटर है और शक्ति में समकक्ष है। इसलिए इन दिनों, हम इसके बजाय उपयोग करते हैं।EEFE

उत्तर कई पृष्ठों पर है। सबसे पहले, यह टिप्पणी की जाती है कि उत्तर की तलाश की जानी चाहिए कि क्या परिणामस्वरूप भाषाएं एक दिलचस्प वर्ग बनाती हैं और उनकी तुलना अन्य माध्यमों से की गई भाषाओं से कैसे की जाती है। पृष्ठ 72 पर, यह टिप्पणी की गई है कि नकारात्मकता और संयोजन बेमानी हैं: वे किसी भी अभिव्यंजक शक्ति को नहीं जोड़ते हैं। पृष्ठ ,० और उसके बाद, यह साबित हो जाता है कि नियमित भाषा ठीक-ठाक राज्य मशीनों द्वारा मान्यता प्राप्त भाषाएँ हैं।

दूसरे शब्दों में: स्टीफन के उत्तर को सुरक्षित रूप से निर्णायक माना जा सकता है, क्योंकि यह पहले से ही रिपोर्ट में दिया गया था कि पहले इन अवधारणाओं को पेश किया गया था।


लिंक के लिए धन्यवाद। मैं हमेशा अपने छात्रों को समझाता हूं कि ऑपरेशन पसंद से प्राकृतिक सार हैं (जैसे अगर-तब-तब) अनुक्रम (एक दूसरे का पालन करने वाले निर्देश) और पुनरावृत्ति (जैसे-जबकि)। लेकिन स्पष्ट रूप से क्लेन द्वारा इसका उल्लेख नहीं किया गया है?
हेंड्रिक जनवरी

मैं सिर्फ एक लड़का हूं जिसने क्लेने के लेख को देखा और आश्चर्यचकित था कि मेरे जवाब में सब कुछ पहले से ही था। मैं और कुछ नहीं जानता। तो मुझे लगता है कि उत्तर लेख को पढ़ने के लिए है और शायद कुछ भी है जो क्लेन ने इस पर पहले लिखा था।
रीइनियरियरपोस्ट

4

ऑपरेटरों (संघ, संघ, और स्टार) के इस चयन से कोई भी अभिव्यक्ति के आकार के रैखिक आकार के साथ NFA का निर्माण कर सकता है। दूसरी ओर, यदि आप प्रतिच्छेदन और पूरकता जोड़ते हैं, तो समतुल्य ऑटोमेटन का आकार गैर-तत्व रूप से फट सकता है, जो आमतौर पर वांछनीय नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.