एक नियमित भाषा में शब्द लंबाई के संभावित सेट क्या हैं?


15

एक भाषा को देखते हुए L , की लंबाई सेट को परिभाषित L में शब्दों की लंबाई के सेट के रूप में L :

LS(L)={|u|uL}

पूर्णांकों का कौन सा सेट एक नियमित भाषा की लंबाई सेट हो सकता है?

जवाबों:


14

सबसे पहले, एक अवलोकन जो महत्वपूर्ण है, लेकिन सुविधाजनक नहीं है: सेट S पूर्णांकों का सेट की है कि कर रहे हैं LS(L) कुछ नियमित भाषा के लिए L एक गैर खाली वर्णमाला पर A वर्णमाला की पसंद पर निर्भर नहीं करता है। यह देखने के लिए, एक परिमित ऑटोमेटन पर विचार करें जो L पहचानता है ; L में जो शब्द हैं उनकी लंबाई ऑटोमोबैटन पर पथों की लंबाई है जिन्हें स्टार्ट स्टेट से किसी भी स्वीकार किए गए राज्य में एक अनलेबल ग्राफ के रूप में देखा जाता है। विशेष रूप से, आप के लिए हर तीर relabel कर सकते हैं a और वर्णमाला में एक ही लंबाई सेट के साथ एक नियमित रूप से भाषा मिल {a} । इसके विपरीत, यदिL एक तत्व-वर्णमाला पर एक नियमित भाषा है, इसे तुच्छ रूप से एक बड़ी वर्णमाला में इंजेक्ट किया जा सकता है, और परिणाम अभी भी एक नियमित भाषा है।

इसलिए हम एक सिंगलटन वर्णमाला पर शब्दों के लिए संभावित लंबाई सेट की तलाश कर रहे हैं। : एक सिंगलटन वर्णमाला पर, भाषा लंबाई सेट एकल में लिखा है LS(L)={nNanL} । ऐसी भाषाओं को एकात्मक भाषा कहा जाता है।

बता दें कि L एक नियमित भाषा है, और एक नियत परिमित ऑटोमोटन (DFA) पर विचार करें जो L पहचानता है । L के शब्दों की लंबाई का सेट डीएफए में पथों की लंबाई का सेट है जिसे एक निर्देशित ग्राफ के रूप में देखा जाता है जो स्टार्ट स्टेट पर शुरू होता है और स्वीकार किए गए राज्यों में से एक में समाप्त होता है। एक तत्व-वर्णमाला पर एक डीएफए बहुत ही प्रसिद्धि है (एनएफए जंगल होगा): यह या तो एक परिमित सूची या एक गोलाकार सूची है। यदि सूची परिमित है, तो सूची क्रम का अनुसरण करते हुए राज्यों को 0 से h तक की संख्या दें ; यदि यह परिपत्र है, तो सूची के प्रमुख के बाद 0 से h को राज्यों की संख्या और लूप के साथ h से h+r करें।

सूची के आकार का ऑटोमेटा

चलो F अप करने के लिए राज्यों को स्वीकार के सूचकांकों के सेट हो h , और G से राज्यों को स्वीकार के सूचकांकों के सेट हो h को h+r । फिर

LS(L)=F{kr+xxG,kN}

इसके विपरीत, चलो h और r दो पूर्णांकों हो सकता है और F और G पूर्णांकों के दो परिमित सेट हो ऐसी है कि xF,xh और xG,hxh+r । फिर सेट LF,G,r={akr+xxG,kN}एक नियमित रूप से भाषा है: यह DFA द्वारा मान्यता प्राप्त भाषा में ऊपर वर्णित है। एक नियमित अभिव्यक्ति है कि इस भाषा का वर्णन करता हैaFaG(ar)

अंग्रेजी में संक्षेप करने के लिए, नियमित भाषाओं की लंबाई सेट पूर्णांक के सेट हैं जो एक निश्चित मूल्य से ऊपर के आवधिक हैं

Well एक अच्छी तरह से स्थापित धारणा पर लटकने के लिए , आवधिक का अर्थ है सेट की विशेषता फ़ंक्शन (जो एक फ़ंक्शन N{false,true} जो हम एक फ़ंक्शन के लिए उठाते हैंZ{false,true} ) आवधिक है। एक निश्चित मूल्य का मतलब है ऊपर समय-समय पर कार्य करने के लिए प्रतिबंधित है कि[h,+[ एक आवधिक कार्य में लंबे समय तक किया जा सकता है।


वर्णमाला की अप्रासंगिकता के बारे में आपका अवलोकन बताता है कि पारिख की प्रमेय को लागू किया जा सकता है। विशेष रूप से, आप दिखाते हैं कि एलएस (एल) = एलएस (एल ') जहां एल' में सभी अक्षर एक ही वर्णमाला में ढह जाते हैं। लेकिन एलएस (एल ') एल भाषा की पारिख मानचित्रण है, जिसे किसी भी नियमित भाषा के लिए अर्धविराम के रूप में जाना जाता है।
सुरेश

अच्छा तरीका! 1) मुझे लगता है कि पहले पैराग्राफ को ध्यान में रखते हुए प्रतिस्थापित किया जा सकता है कि नियमित भाषाएं स्ट्रिंग होमोमोर्फिम्स के खिलाफ बंद हैं। 2) स्पष्टता के लिए, आप के दूसरे भाग देने पर विचार करना चाहिए के रूप में { + कश्मीर आर + ( एक्स - ) | ... } , बंद-एक करके-त्रुटियों सापेक्ष। 3) पूर्णांकों का "आवधिक" सेट क्या है? LS(L){h+kr+(xh)}
राफेल

1
@ सुरेश, राफेल (1): मैं प्राथमिक रूप से प्रमाण देना पसंद करता हूं, मेरे सीएस 102 वर्ग में न तो होमोमोर्फिम्स और न ही पारिख मैपिंग का उल्लेख किया गया था।
गाइल्स का SO- दुष्ट होना बंद '

@Raphael (2) आप का अनुक्रमण में शुरू बात नहीं है, मैं शर्त को दूर कर सकता है जी , के रूप में एफ के रूप में हम चाहते हैं कई छोटे तत्वों के रूप में अवशोषित कर सकते हैं। (३) एक सेट जो एक निश्चित मान के ऊपर आवधिक है, वह है जिसे ऊपर प्रदर्शित रूप में रखा जा सकता है। GhGF
गाइल्स का SO- दुष्ट होना बंद करें '

5

किसी भी परिमित सबसेट एक नियमित रूप से भाषा की लंबाई निर्धारित किया जा सकता है एल , जब से तुम एक एकल वर्णमाला ले जा सकते हैं{1,,n}NL और परिभाषित एल के रूप में { 0 1 , ... , 0 n } (इसमें खाली भाषा और { ε } शामिल हैं )।{0}L{01,,0n}{ε}

अब अनंत सेट के लिए। मैं एक छोटा विश्लेषण दूंगा, हालांकि अंतिम उत्तर पर्याप्त स्पष्ट नहीं हो सकता है। जब तक आप मुझसे नहीं पूछेंगे, मैं विस्तृत नहीं करूंगा, क्योंकि मुझे लगता है कि यह सहज है और क्योंकि मेरे पास अब ज्यादा समय नहीं है।

चलो नियमित भाषाओं पैदा भाव होना एल 1 और एल 2 , क्रमशः। यह देखना आसान हैr1,r2L1L2

  • LS(L(r1+r2))=LS(L1L2)=LS(L1)LS(L2)
  • । इसे L S ( L 1 ) + L S ( L ) दर्शाया गया हैLS(L(r1r2))=LS(L1L2)={1+2:1LS(L1),2LS(L2)}LS(L1)+LS(L2)
  • LS(L(r1))={0}n1{i=1ni:(1,,n)(LS(L1))n}.

इस प्रकार, पूर्णांक के संभावित सेट जो कि एक नियमित भाषा की लंबाई-सेट हो सकते हैं, वे हैं जो परिमित सबसेट हैं या जिन्हें N के उपसमितियों S 1 , S 2 और N के पिछले सूत्रों का उपयोग करके बनाया जा सकता है। कई बार।NS1,S2N

यहाँ, हम नियमित रूप से एक नियमित अभिव्यक्ति के निर्माण के लिए नियमों को लागू करके, नियमित रूप से भाषाओं का निर्माण कर रहे हैं, कई बार सीमित संख्या में। ध्यान दें कि हम किसी भी परिमित सबसेट के साथ शुरू कर सकते हैं , भले ही नियमित अभिव्यक्तियों में हम लंबाई 0 और 1 के शब्दों के साथ शुरू करते हैं केवल आधार मामले के रूप में। यह इस तथ्य से आसानी से उचित है कि सभी (परिमित) शब्द वर्णमाला के प्रतीकों के सममित (सममित) हैं।N


मुझे कोई अंतिम जवाब नहीं दिख रहा है। (क्या आप बाद में अपना जवाब खत्म करने का इरादा कर रहे थे?) मैं संभावित सेटों के सरल विवरण और ऑटोमेटा के साथ एक कनेक्शन की उम्मीद कर रहा था।
गिल्स एसओ- बुराई को रोकना '

अंतिम उत्तर है: "इस प्रकार, पूर्णांक के संभावित सेट ..."। यह वास्तव में एक सरल विवरण है, हालांकि नियमित अभिव्यक्तियों से जुड़ा हुआ है, ऑटोमेटा नहीं।
Janoma

एक सरल वर्णन है जिसमें एक फ़िक्स पॉइंट लेना शामिल नहीं है। शायद यह सवाल उतना प्राथमिक नहीं है जितना मैंने सोचा था!
गिल्स एसओ-

मुझे नहीं लगता कि आप अंतिम नियम से बच सकते हैं, क्योंकि यह स्टार ऑपरेटर है जो अनंत लंबाई-सेट का उत्पादन कर सकता है, जैसे कि यह अनंत भाषाओं का उत्पादन करता है।
Janoma

@ गिल्स तो आप चाहते हैं कि इंडोमा सॉल्यूशन जैनोमा प्रदान करने वाले सबसे छोटे फिक्स पॉइंट का एक बंद रूप हो?
राफेल

2

नियमित भाषाओं के लिए पम्पिंग लेम्मा के अनुसार, वहाँ एक मौजूद है कि लंबाई के कम से कम n के बराबर एक स्ट्रिंग x को निम्न रूप में लिखा जा सकता है: x = u v w जहां निम्नलिखित तीन स्थितियां हैं: | यू वी | < n | वी | > 0 यू वी कश्मीर डब्ल्यू एलnxn

x=uvw
|uv|<n
|v|>0
uvkwL

यह हमें सेट के लिए एक परीक्षण देता है: एक सेट एक नियमित भाषा की लंबाई सेट नहीं हो सकता है जब तक कि उसके सभी तत्वों को किसी निश्चित तुलना में पूर्णांकों के कुछ मनमाने सेट के रूप में व्यक्त नहीं किया जा सकता है , साथ ही एक अनिर्धारित मूल्य मीटर के कुछ कई (लंबाई) के वी ), प्लस कुछ मनमाने ढंग से परिमित मूल्य।nmv

दूसरे शब्दों में, ऐसा लगता है कि नियमित भाषाओं के लिए भाषा की लंबाई के संभावित सेट संघ के सेट के संबंध में बंद है (जैसा कि EDIT और EDIT2 के तहत चर्चा की गई है, टिप्पणीकारों के लिए धन्यवाद) निम्नानुसार वर्णित सेटों की: के लिए तय एक ,

{a+bn|nN}S
और सभी परिमित सेट एस , पम्पिंग (मेरे मूल संस्करण में एक मूर्खतापूर्ण गलती उनका कहना है, जिससे मैं सेट को परिभाषित किया गया था के लिए धन्यवाद गाइल्स लिए नियमित रूप से भाषाओं के लिए लेम्मा द्वारा एन )।a,bNSN

EDIT: थोड़ी और चर्चा। निश्चित रूप से पूर्णांक के सभी परिमित सेट लंबाई सेट हैं। इसके अलावा, दो लंबाई सेटों का मिलन भी एक लंबाई सेट होना चाहिए, क्योंकि किसी भी लंबाई सेट (इसलिए अंतर, इसलिए अंतर) का पूरक होना चाहिए। इसका कारण यह है कि नियमित भाषाएं इन परिचालनों के तहत बंद हो जाती हैं। इसलिए, मैं जो उत्तर देता हूं वह (संभवतः) अधूरा है; वास्तव में, इस तरह के सेटों का कोई भी संघ कुछ नियमित भाषा का लंबाई सेट है (ध्यान दें कि मैंने चौराहे, पूरक, अंतर आदि की आवश्यकता को छोड़ दिया है, क्योंकि ये इस तथ्य से आच्छादित हैं कि नियमित भाषा इन गुणों के तहत बंद हैं, जैसे कि EDIT3 में चर्चा की गई; मुझे लगता है कि केवल संघ वास्तव में आवश्यक है, भले ही अन्य सही हों, जो कि मामला नहीं हो सकता है)।

EDIT2: और भी अधिक चर्चा। जो उत्तर मैं देता हूं, वह मूल रूप से है जहां आप जानो के उत्तर को थोड़ा और आगे ले जाते हैं; हिस्सा है, क्लीन तारा से आता है एक संयोजन से आता है, और संघ, चौराहे, अंतर की चर्चा और नियमित अभिव्यक्ति की + (और साथ ही नियमित रूप से भाषाओं के अन्य बंद गुण) ऑटोमेटा से साध्य प्रारंभिक) से आते हैं पूरक ।bna

EDIT3: जोंमा की टिप्पणी के आलोक में, भाषा की लंबाई सेट के बंद गुणों को भूल जाते हैं, जिसकी चर्चा मैं पहले EDIT में करता हूं। चूंकि नियमित भाषाओं में ये क्लोजर गुण होते हैं, और चूंकि प्रत्येक नियमित भाषा में डीएफए होता है, इसलिए यह इस प्रकार है कि नियमित भाषाओं के लिए पंपिंग लेम्मा सभी यूनियनों, चौराहों, पूरक और नियमित भाषाओं के अंतर पर लागू होती है, और हम इसे उस पर छोड़ देंगे। ; संघ को छोड़कर, इनमें से किसी पर भी विचार करने की आवश्यकता नहीं है, जो मुझे अभी भी लगता है कि मेरे मूल (संशोधित, गाइल्स से इनपुट के लिए धन्यवाद) को सही बनाने के लिए आवश्यक हो सकता है। तो, मेरा अंतिम जवाब यह है: मैं मूल संस्करण में क्या कहता हूं, साथ ही भाषा की लंबाई बंद होने से सेट के संबंध में सेट होता है।


1
सही रास्ते पर है, लेकिन आप एक परिमाणक गलत कहीं आप कर रहे हैं पैदा हो गया, एन{a+bna,b,nN}SN
गिल्स एसओ- बुराई को रोकना '

1
लंबाई सेट के पूरक के लिए विश्लेषण थोड़ा नाजुक हो सकता है। यदि से अधिक वर्णमाला Σ = { एक , } , तो की लंबाई सेट एल है एन और की लंबाई सेट ¯ एल है एन + , और इन एक-दूसरे के पूरक हैं नहीं कर रहे हैं। L=L(a)Σ={a,b}LNL¯N+
Janoma

@ गिल्स लेकिन सभी प्राकृतिक संख्याओं का सेट एक मान्य लंबाई सेट है, है ना? मैं प्राकृतिक संख्या के सभी सबसेट पैदा नहीं कर रहा हूँ, है ना? मैं मानता हूं कि समस्यात्मक होगा। संपादित करें: ओह प्रतीक्षा करें, मैं देख रहा हूं कि आप क्या कह रहे हैं। हाँ तुम सही हो। कंप्यूटर पर वापस आने पर ठीक हो जाएगा।
पैट्रिक87

@ जानोमा उत्कृष्ट बिंदु, इस बात पर विचार करने की आवश्यकता होगी कि जो चीजें मैं परिभाषित कर रहा हूं, उनका सेट कैसे बदल सकता है ...
पैट्रिक87
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.