एक भाषा को देखते हुए , की लंबाई सेट को परिभाषित में शब्दों की लंबाई के सेट के रूप में :
पूर्णांकों का कौन सा सेट एक नियमित भाषा की लंबाई सेट हो सकता है?
एक भाषा को देखते हुए , की लंबाई सेट को परिभाषित में शब्दों की लंबाई के सेट के रूप में :
पूर्णांकों का कौन सा सेट एक नियमित भाषा की लंबाई सेट हो सकता है?
जवाबों:
सबसे पहले, एक अवलोकन जो महत्वपूर्ण है, लेकिन सुविधाजनक नहीं है: सेट पूर्णांकों का सेट की है कि कर रहे हैं कुछ नियमित भाषा के लिए एक गैर खाली वर्णमाला पर वर्णमाला की पसंद पर निर्भर नहीं करता है। यह देखने के लिए, एक परिमित ऑटोमेटन पर विचार करें जो पहचानता है ; में जो शब्द हैं उनकी लंबाई ऑटोमोबैटन पर पथों की लंबाई है जिन्हें स्टार्ट स्टेट से किसी भी स्वीकार किए गए राज्य में एक अनलेबल ग्राफ के रूप में देखा जाता है। विशेष रूप से, आप के लिए हर तीर relabel कर सकते हैं और वर्णमाला में एक ही लंबाई सेट के साथ एक नियमित रूप से भाषा मिल । इसके विपरीत, यदि एक तत्व-वर्णमाला पर एक नियमित भाषा है, इसे तुच्छ रूप से एक बड़ी वर्णमाला में इंजेक्ट किया जा सकता है, और परिणाम अभी भी एक नियमित भाषा है।
इसलिए हम एक सिंगलटन वर्णमाला पर शब्दों के लिए संभावित लंबाई सेट की तलाश कर रहे हैं। : एक सिंगलटन वर्णमाला पर, भाषा लंबाई सेट एकल में लिखा है । ऐसी भाषाओं को एकात्मक भाषा कहा जाता है।
बता दें कि एक नियमित भाषा है, और एक नियत परिमित ऑटोमोटन (DFA) पर विचार करें जो पहचानता है । के शब्दों की लंबाई का सेट डीएफए में पथों की लंबाई का सेट है जिसे एक निर्देशित ग्राफ के रूप में देखा जाता है जो स्टार्ट स्टेट पर शुरू होता है और स्वीकार किए गए राज्यों में से एक में समाप्त होता है। एक तत्व-वर्णमाला पर एक डीएफए बहुत ही प्रसिद्धि है (एनएफए जंगल होगा): यह या तो एक परिमित सूची या एक गोलाकार सूची है। यदि सूची परिमित है, तो सूची क्रम का अनुसरण करते हुए राज्यों को से तक की संख्या दें ; यदि यह परिपत्र है, तो सूची के प्रमुख के बाद से को राज्यों की संख्या और लूप के साथ से करें।
चलो अप करने के लिए राज्यों को स्वीकार के सूचकांकों के सेट हो , और से राज्यों को स्वीकार के सूचकांकों के सेट हो को । फिर
इसके विपरीत, चलो और दो पूर्णांकों हो सकता है और और पूर्णांकों के दो परिमित सेट हो ऐसी है कि और । फिर सेट एक नियमित रूप से भाषा है: यह DFA द्वारा मान्यता प्राप्त भाषा में ऊपर वर्णित है। एक नियमित अभिव्यक्ति है कि इस भाषा का वर्णन करता है ।
अंग्रेजी में संक्षेप करने के लिए, नियमित भाषाओं की लंबाई सेट पूर्णांक के सेट हैं जो एक निश्चित मूल्य से ऊपर के आवधिक हैं ।
Well एक अच्छी तरह से स्थापित धारणा पर लटकने के लिए , आवधिक का अर्थ है सेट की विशेषता फ़ंक्शन (जो एक फ़ंक्शन जो हम एक फ़ंक्शन के लिए उठाते हैं ) आवधिक है। एक निश्चित मूल्य का मतलब है ऊपर समय-समय पर कार्य करने के लिए प्रतिबंधित है कि एक आवधिक कार्य में लंबे समय तक किया जा सकता है।
किसी भी परिमित सबसेट एक नियमित रूप से भाषा की लंबाई निर्धारित किया जा सकता है एल , जब से तुम एक एकल वर्णमाला ले जा सकते हैं और परिभाषित एल के रूप में { 0 ℓ 1 , ... , 0 ℓ n } (इसमें खाली भाषा और { ε } शामिल हैं )।
अब अनंत सेट के लिए। मैं एक छोटा विश्लेषण दूंगा, हालांकि अंतिम उत्तर पर्याप्त स्पष्ट नहीं हो सकता है। जब तक आप मुझसे नहीं पूछेंगे, मैं विस्तृत नहीं करूंगा, क्योंकि मुझे लगता है कि यह सहज है और क्योंकि मेरे पास अब ज्यादा समय नहीं है।
चलो नियमित भाषाओं पैदा भाव होना एल 1 और एल 2 , क्रमशः। यह देखना आसान है
इस प्रकार, पूर्णांक के संभावित सेट जो कि एक नियमित भाषा की लंबाई-सेट हो सकते हैं, वे हैं जो परिमित सबसेट हैं या जिन्हें N के उपसमितियों S 1 , S 2 और N के पिछले सूत्रों का उपयोग करके बनाया जा सकता है। कई बार।
यहाँ, हम नियमित रूप से एक नियमित अभिव्यक्ति के निर्माण के लिए नियमों को लागू करके, नियमित रूप से भाषाओं का निर्माण कर रहे हैं, कई बार सीमित संख्या में। ध्यान दें कि हम किसी भी परिमित सबसेट के साथ शुरू कर सकते हैं , भले ही नियमित अभिव्यक्तियों में हम लंबाई 0 और 1 के शब्दों के साथ शुरू करते हैं केवल आधार मामले के रूप में। यह इस तथ्य से आसानी से उचित है कि सभी (परिमित) शब्द वर्णमाला के प्रतीकों के सममित (सममित) हैं।
नियमित भाषाओं के लिए पम्पिंग लेम्मा के अनुसार, वहाँ एक मौजूद है कि लंबाई के कम से कम n के बराबर एक स्ट्रिंग x को निम्न रूप में लिखा जा सकता है: x = u v w जहां निम्नलिखित तीन स्थितियां हैं: | यू वी | < n | वी | > 0 यू वी कश्मीर डब्ल्यू ∈ एल
यह हमें सेट के लिए एक परीक्षण देता है: एक सेट एक नियमित भाषा की लंबाई सेट नहीं हो सकता है जब तक कि उसके सभी तत्वों को किसी निश्चित तुलना में पूर्णांकों के कुछ मनमाने सेट के रूप में व्यक्त नहीं किया जा सकता है , साथ ही एक अनिर्धारित मूल्य मीटर के कुछ कई (लंबाई) के वी ), प्लस कुछ मनमाने ढंग से परिमित मूल्य।
दूसरे शब्दों में, ऐसा लगता है कि नियमित भाषाओं के लिए भाषा की लंबाई के संभावित सेट संघ के सेट के संबंध में बंद है (जैसा कि EDIT और EDIT2 के तहत चर्चा की गई है, टिप्पणीकारों के लिए धन्यवाद) निम्नानुसार वर्णित सेटों की: के लिए तय एक ,
EDIT: थोड़ी और चर्चा। निश्चित रूप से पूर्णांक के सभी परिमित सेट लंबाई सेट हैं। इसके अलावा, दो लंबाई सेटों का मिलन भी एक लंबाई सेट होना चाहिए, क्योंकि किसी भी लंबाई सेट (इसलिए अंतर, इसलिए अंतर) का पूरक होना चाहिए। इसका कारण यह है कि नियमित भाषाएं इन परिचालनों के तहत बंद हो जाती हैं। इसलिए, मैं जो उत्तर देता हूं वह (संभवतः) अधूरा है; वास्तव में, इस तरह के सेटों का कोई भी संघ कुछ नियमित भाषा का लंबाई सेट है (ध्यान दें कि मैंने चौराहे, पूरक, अंतर आदि की आवश्यकता को छोड़ दिया है, क्योंकि ये इस तथ्य से आच्छादित हैं कि नियमित भाषा इन गुणों के तहत बंद हैं, जैसे कि EDIT3 में चर्चा की गई; मुझे लगता है कि केवल संघ वास्तव में आवश्यक है, भले ही अन्य सही हों, जो कि मामला नहीं हो सकता है)।
EDIT2: और भी अधिक चर्चा। जो उत्तर मैं देता हूं, वह मूल रूप से है जहां आप जानो के उत्तर को थोड़ा और आगे ले जाते हैं; हिस्सा है, क्लीन तारा से आता है एक संयोजन से आता है, और संघ, चौराहे, अंतर की चर्चा और नियमित अभिव्यक्ति की + (और साथ ही नियमित रूप से भाषाओं के अन्य बंद गुण) ऑटोमेटा से साध्य प्रारंभिक) से आते हैं पूरक ।
EDIT3: जोंमा की टिप्पणी के आलोक में, भाषा की लंबाई सेट के बंद गुणों को भूल जाते हैं, जिसकी चर्चा मैं पहले EDIT में करता हूं। चूंकि नियमित भाषाओं में ये क्लोजर गुण होते हैं, और चूंकि प्रत्येक नियमित भाषा में डीएफए होता है, इसलिए यह इस प्रकार है कि नियमित भाषाओं के लिए पंपिंग लेम्मा सभी यूनियनों, चौराहों, पूरक और नियमित भाषाओं के अंतर पर लागू होती है, और हम इसे उस पर छोड़ देंगे। ; संघ को छोड़कर, इनमें से किसी पर भी विचार करने की आवश्यकता नहीं है, जो मुझे अभी भी लगता है कि मेरे मूल (संशोधित, गाइल्स से इनपुट के लिए धन्यवाद) को सही बनाने के लिए आवश्यक हो सकता है। तो, मेरा अंतिम जवाब यह है: मैं मूल संस्करण में क्या कहता हूं, साथ ही भाषा की लंबाई बंद होने से सेट के संबंध में सेट होता है।