औपचारिक भाषाओं के बीच उपयुक्त समरूपताएं क्या हैं?


9

एक औपचारिक भाषा Lएक वर्णमाला पर का एक सबसेट है, , उस वर्णमाला के शब्दों का एक समूह है। दो औपचारिक भाषाएं और बराबर हैं, यदि संबंधित सेट सबसेट के समान हैं । एक "समस्या की अवधारणा को औपचारिक रूप देने के लिए जटिलता सिद्धांत में भाषाओं का उपयोग कर सकता है।" कोई यह शिकायत कर सकता है कि "सामान्य रूप से" बहुआयामी समानता अकल्पनीय है, लेकिन मेरा मानना ​​है कि यह गलत होगा।ΣΣLLLL

मैं कुछ समय से निम्नलिखित समस्या का समाधान कर रहा हूँ: दो भाषाएँ और अक्षर से अधिक और (जहाँ , , औरLLΣ={a,b}Σ={c,d}abcdअलग-अलग अक्षर हैं) कभी भी बराबर नहीं हो सकते, भले ही वे "बिल्कुल" समान "समस्या" का वर्णन करें। लेकिन उन्हें आइसोमॉर्फिक होना चाहिए, अगर वे वास्तव में "ठीक उसी" समस्या का वर्णन करते हैं। मैं जानना चाहता हूं कि जटिलता सिद्धांत के लिए आइसोमोर्फिज्म के संभावित विचार उपयुक्त हैं। मैंने शुरू में सोचा था कि परिमित-राज्य मशीन की तरह एक कम्प्यूटेशनल रूप से कमजोर "अनुवादक" का उपयोग अनुमत आइसोमोर्फिज्म को परिभाषित करने के लिए किया जा सकता है, लेकिन यह पहले से ही समान तार्किक सूत्रों के बीच तुच्छ वाक्यविन्यास अनुवादों के लिए टूटने लगता है। (उदाहरण के लिए इस तालिका को रैखिक तर्क में दोहरी की वाक्यात्मक परिभाषा के साथA देखें ।)

आज मुझे निम्नलिखित विचार आया: एक निश्चित "निर्णय समस्या" के अनुरूप भाषा की एक परिभाषा में अक्सर दो भाग होते हैं: (1) प्रतीकों की परिमित तार के रूप में अनुमत समस्या उदाहरणों का एन्कोडिंग, और (2) की एक परिभाषा " स्वीकृत "समस्या उदाहरण जो भाषा के हैं। यदि यह जाँच करना कि क्या प्रतीकों की दी गई परिमित स्ट्रिंग एक अनुमत समस्या के उदाहरण के लिए पहले से ही एक मशीन है जिसे परिमित रूप से एक परिमित अवस्था मशीन से अधिक मजबूत बनाने की आवश्यकता है, तो इस मजबूत मशीन का उपयोग अनुमत आइसोमोर्फिम्स की परिभाषा के लिए भी किया जाना चाहिए।

प्रश्न: क्या मेरी समस्या का "हल" करने का कोई मौका तर्क देने की यह रेखा है? क्या मेरी समस्या पहले से ही हल हो गई है, ताकि मुझे सिर्फ सही संदर्भ पढ़ने की जरूरत है? क्या मेरी समस्या का कोई मतलब नहीं है, या यह केवल गुमराह करने के रूप में है क्योंकि यह समानता की अपरिहार्यता के बारे में शिकायत कर रहा है?


संपादित करें (अभी तक कोई जवाब नहीं) मैंने देखा कि "(1) अनुमत समस्याओं की एक एन्कोडिंग प्रतीकों के परिमित तार के रूप में" पहले से ही एक सामान्यीकृत इनपुट की (छिपी हुई) धारणा है। इस धारणा के बिना, दो अलग-अलग परिमित तार एक ही समस्या उदाहरण के अनुरूप हो सकते हैं। यह जाँचने के बजाय कि क्या दिए गए परिमित तार वैध हैं, जाँच एक सामान्यीकृत इनपुट (और विशेष स्ट्रिंग के लिए अवैध स्ट्रिंग का नक्शा) का उत्पादन कर सकती है।

इस सेटिंग का यह फायदा है कि चेकिंग / सामान्यीकरण करने वाली मशीन पहले से ही परिमित तारों को अन्य परिमित तारों में बदलने से सुसज्जित है। इस कार्य के लिए अनुमत मशीन (जटिलता वर्ग) समस्या की परिभाषा का हिस्सा हो सकती है, और (आईएसओ) आकारिकी एक ही मशीन (जटिलता वर्ग) का उपयोग करेगी। (राफेल की टिप्पणी से "पॉली-टाइम कई-एक कटौती" का सुझाव वास्तव में में समस्याओं के लिए एक संभावना होगी ।)P

एक कमी यह है कि विनिर्देशन का यह तरीका केवल नियतात्मक मशीनों के लिए उपयुक्त हो सकता है। गैर-निर्धारक मशीनों को निर्दिष्ट करने या तय करने के लिए अधिक लचीले तरीकों की आवश्यकता हो सकती है कि क्या दो इनपुट स्ट्रिंग एक ही समस्या उदाहरण के अनुरूप हैं।


1
सभी अनंत भाषाएं (परिमित अक्षर से अधिक) समरूप हैं (क्योंकि वे गणनीय हैं)। आपको जो चाहिए उसे निखारने की जरूरत है। इसके अलावा, किस उपाय से आप कहते हैं कि दो समस्याएं "समान" हैं? यकीनन, पॉली-टाइम कई-एक कटौती आपको एक मानचित्रण प्रदान करती है जैसे आप चाहते हैं, लेकिन ये मानचित्र एक दूसरे पर "अलग" (अभी तक समान रूप से कठिन) समस्याएं हैं।
राफेल

@ राफेल मैं आपकी टिप्पणी से थोड़ा भ्रमित हूँ "आपको जो चाहिए उसे परिष्कृत करने की आवश्यकता है।" यह प्रश्न ठीक है कि मैं किस समरूपता का उपयोग करने के लिए "इच्छा" कर सकता हूं। यह जानना कभी-कभी मुश्किल होता है कि आप वास्तव में क्या चाहते हैं! प्रश्न के पारित होने के लिए "बिल्कुल उसी" समस्या का वर्णन करने वाली भाषाओं के बारे में बात करते हुए, "मैं मूल रूप से सिर्फ पहचान के समय मामले के बारे में सोच रहा था साथ में सी तथा साथ में बनाएगा एल तथा एल'बराबरी का। तर्क की इस पंक्ति को जारी रखना, जो शुरू में मुझे परिमित-राज्य मशीनों को "अनुवादक" मानने के लिए लाया था, जो अंततः मेरी समस्या का समाधान नहीं करता है।
थॉमस क्लिंपेल

@ राफेल मेरा अनुमान है कि अधिकांश समस्याओं के लिए, पॉली-टाइम कई-एक कटौती रास्ता है जो कि मेरे मन में होने वाले आइसोमॉर्फिम्स के लिए बहुत शक्तिशाली है। मैं नहीं चाहता कि आइसोमोर्फिज्म मेरे लिए समाधान की गणना करे, या एक ग्राफ थ्योरेटिक समस्या को तर्क संतोषजनक समस्या के रूप में कम करे। मैं बस यही चाहता हूं कि एक ही समस्या के उदाहरण के दो अलग-अलग लेकिन अनिवार्य रूप से समकक्ष एन्कोडिंग की पहचान करें। मुझे कोई समस्या नहीं है, अगर समतावाद की यह धारणा कुछ (एन्कोडिंग) ग्राफ थ्योरिटिक समस्याओं के साथ कुछ (एनकोडिंग) लॉजिक संतोषजनकता समस्याओं की पहचान करने के लिए भी होनी चाहिए।
थॉमस क्लिंपेल

मोटे तौर पर, कटौती से जुड़ी जटिलता का उपयोग इस उद्देश्य के लिए किया जाता है। P समय की तुलना में कम मजबूत कमी है जैसे लॉग स्पेस रिडक्शन,O(nc)समय, आदि
vzn

जवाबों:


6

क्या मेरी समस्या पहले से ही हल हो गई है, ताकि मुझे सिर्फ सही संदर्भ पढ़ने की जरूरत है?

भाषाओं के अमूर्त परिवार का सिद्धांत प्रासंगिक है। उदाहरण के लिए, परिमित राज्य ट्रांसड्यूसर द्वारा परिभाषित आकारिकी शंकु परिवार को जन्म देती है । 1970 से इलेनबर्ग की संक्षिप्त आईसीएम वार्ता इस रूपरेखा को स्पष्ट करती है, यह भी देखें कि अध्याय 11 "भाषाओं के परिवारों के बंद होने के गुण" परिचय से लेकर ऑटोमेटा थ्योरी, भाषाएं, और संगणना (1 एड।) जे होपक्रॉफ्ट और जे। एलमैन द्वारा 1979 से। हालांकि। , केवल nondeterministic भाषाएँ इस ढांचे में फिट होती हैं 1 । अंत में, 1985 से जे। बर्स्टेल और डी। पेरिन द्वारा कोड की पुस्तक थ्योरी ने मुझे मेरी समस्या के उचित समाधान के साथ आने में मदद की। कोड और ऑटोमेटा2009 से जे। बर्स्टेल, डी। पेरिन और सी। रेउटनॉयर इस पुस्तक का एक प्रमुख संशोधन है, जिसमें बहुत व्यापक कवरेज है।

क्या मेरी समस्या का "हल" करने का कोई मौका तर्क की यह पंक्ति है? क्या मेरी समस्या का कोई मतलब नहीं है, या यह केवल गुमराह है ...?

यह धारणा कि "समस्या की अवधारणा को औपचारिक बनाने" के लिए भाषाओं के बीच समरूपता मॉडलिंग के लिए एक सही श्रेणी है, गुमराह है। कई अलग-अलग श्रेणियां हैं जो औपचारिक भाषाओं के संदर्भ में दिलचस्प हो सकती हैं।

यहां कई-एक कटौती से संबंधित तीन दिलचस्प श्रेणियां हैं, जिन्हें कुल , आंशिक और संबंधपरक कहा जाएगा । श्रेणियों की वस्तुएँ जोड़े हैं(Σ,एल) परिमित वर्णमाला का Σ और एक भाषा एलΣ* के शब्दों पर Σ। के लिए कुल , स्रोत ऑब्जेक्ट के बीच morphisms(Σ,एल) और लक्ष्य वस्तु (Σ',एल') कुल कार्य हैं :Σ*Σ'* साथ में एल=-1(एल')। के लिए आंशिक , morphisms आंशिक कार्य हैं:Σ*Σ'* साथ में एल=-1(एल'), जहां दो आंशिक कार्य करता है , जी समान माना जाता है (रूप के रूप में) यदि f(x)=g(x) सबके लिए xL। के लिए संबंधित , morphisms संबंधों हैंRΣ×Σ साथ में L=R1(L), और समान स्रोत और लक्ष्य के बीच किसी भी दो आकार को समान माना जाता है। दिलचस्प समरूपता वाले श्रेणियों को प्राप्त करने के लिए अनुमत कार्यों या संबंधों के सेट को विभिन्न सरल "अनुवादकों" तक सीमित रखा जा सकता है।

  • से monoid homomorphisms Σ सेवा Σएक बहुत ही मूल कुल श्रेणी दे । इस श्रेणी के समरूपता मूल रूप से बीच के पूर्वाग्रह हैंΣ तथा Σ। भाषाओं के किसी भी उचित परिवार को इन आइसोमोर्फिम्स का बेहतर सम्मान करना चाहिए, अर्थात उलटे होमोमोर्फिम्स के तहत बंद होना चाहिए।
  • नियतात्मक लॉग-स्पेस ट्यूरिंग मशीन अनुवादकों द्वारा परिभाषित आंशिक कार्य काफी स्वाभाविक आंशिक श्रेणी देते हैं। यह कई तुच्छ वाक्यविन्यास परिवर्तनों को निष्पादित करने में सक्षम है (जैसे परमाणुओं को नकारने के लिए डी मॉर्गन के नियमों को लागू करना), इसमें कार्यात्मक परिमित राज्य ट्रांसड्यूसर 1 द्वारा परिभाषित मॉर्फिज़्म शामिल है , और यह भी सॉर्ट कर सकता है। फिर भी यह दो पूरी तरह से असंबंधित भाषाओं की पहचान आइसोमोर्फिक के रूप में नहीं करेगा, क्योंकि एक पहचान रूपवाद के लिए दो आकार की रचना की समानता दोनों दिशाओं में कई-एक कटौती के सिर्फ अस्तित्व की तुलना में बहुत मजबूत आवश्यकता है।
  • Nondeterministic लॉग-स्पेस ट्यूरिंग मशीन अनुवादकों द्वारा परिभाषित संबंध एक दिलचस्प संबंधपरक श्रेणी देते हैं। सैट इस श्रेणी में HORNSAT के लिए आइसोमोर्फिक है, लेकिन यह एक खुला प्रश्न है कि क्या TAUTOLOGY या कोई अन्य सह-एनपी-पूर्ण समस्या isomorphic से HORNSAT है।

दो भाषाएं L तथा L अक्षर से अधिक Σ={a,b} तथा Σ={c,d} (कहाँ पे a, b, c तथा dअलग-अलग अक्षर हैं) कभी भी बराबर नहीं हो सकते, भले ही वे "बिल्कुल" समान "समस्या" का वर्णन करें। लेकिन उन्हें आइसोमॉर्फिक होना चाहिए, अगर वे वास्तव में "ठीक उसी" समस्या का वर्णन करते हैं।

बहुत मूल कुलऊपर वर्णित श्रेणी इस समस्या को हल करती है।

समस्या और अधिक दिलचस्प हो जाती है यदि "बिल्कुल उसी" को "लगभग सभी व्यावहारिक उद्देश्यों के लिए समान" द्वारा प्रतिस्थापित किया जाता है: लेट L भाषा बनो Σ={U,C,A,G} और जाने L भाषा खत्म हो Σ={0,1} प्राप्त हुआ L स्थानापन्न द्वारा U00, C01, A10, तथा G11। ध्यान दें कि किसी भी कुल श्रेणी में,L तथा L के लिए आइसोमोर्फिक नहीं हैं L=Σआंशिक श्रेणियों के लिए भी यही सच होगा , यदि भाग "जहाँ दो आंशिक कार्य होंf, g समान माना जाता है (रूप के रूप में) यदि f(x)=g(x) सबके लिए xL"परिभाषा से छोड़ा गया था।

ऊपर वर्णित काफी प्राकृतिक आंशिक श्रेणी बनाने के लिए पर्याप्त हैL तथा Lisomorphic। अधिक मूल (यानी अधिक प्रतिबंधक) श्रेणी रखना अच्छा होगा जो उन्हें आइसोमॉर्फिक बनाता है। निम्नलिखित (क्रमिक रूप से अधिक प्रतिबंधक) श्रेणियां मुझे उचित लगती हैं:

  • अस्पष्ट परिमित राज्य ट्रांसड्यूसर 2 द्वारा महसूस किए गए आंशिक कार्य जहां एकमात्र स्वीकार करने वाला राज्य प्रारंभिक राज्य है। इस आंशिक श्रेणी के समरूपता पहचानने योग्य परिवर्तनीय लंबाई कोड के बीच के (उपसमूह) हैं ।
  • नियतात्मक परिमित राज्य ट्रांसड्यूसर द्वारा महसूस किए गए आंशिक कार्य जहां एकमात्र स्वीकार करने वाला राज्य प्रारंभिक राज्य है। इस आंशिक श्रेणी के आइसोमोर्फिम्स (उपसमुच्चय) उपसर्गों के बीच के विशेषण हैं ।
  • आंशिक फ़ंक्शंस दोनों एक साथ एक आगे और एक पिछड़े निर्धारक ट्रांसड्यूसर द्वारा महसूस किए गए जहां एकमात्र स्वीकार करने वाला राज्य प्रारंभिक राज्य है। इस आंशिक श्रेणी के समसामयिक जीव बिफिक्स कोड के बीच के (उपसमुच्चय) पूर्वाग्रह हैं ।
  • आंशिक कार्यों के आगे प्रतिबंध जैसे कि आइसोमॉर्फिज्म (एक उपसमूह) ब्लॉक कोड्स के बीच के अनुमान भी समझ में आ सकते हैं।

एक "समस्या की अवधारणा को औपचारिक रूप देने के लिए जटिलता सिद्धांत में भाषाओं का उपयोग कर सकता है।"

श्रेणी सिद्धांत के बारे में जानने से पहले ही, मैंने सोचा है कि क्या "समस्या" की अवधारणा को औपचारिक रूप देने के लिए "अधिक वफादार" तरीके हैं। श्रेणी सिद्धांत से परिचित होने के बाद, मैंने कभी-कभी संभव समाधानों के साथ आने की कोशिश की, लेकिन हमेशा जल्दी से पहले ठोकर पर छोड़ दिया (क्योंकि किसी को भी परवाह नहीं है)। मुझे पता है कि यूरी गुरिविच ने कुछ संबंधित प्रश्नों को हल किया है, लेकिन उनके समाधान व्यावहारिक रूप से लागू हैं, जबकि मैं व्यावहारिक प्रयोज्यता से स्वतंत्र कुछ अच्छा और सार के लिए अधिक देख रहा था।

पिछले तीन हफ्तों के लिए मेरा अधिकांश खाली समय आखिरकार इस समस्या पर कुछ प्रगति कर गया। ज्यादातर समय मेरे मन में संभावित समाधानों में कष्टप्रद मुद्दों को खोजने में व्यतीत होता था। प्रगति करने की भावना (पुरानी) पुस्तकों और लेखों को पढ़ने, और ट्रांसड्यूसर और तर्कसंगत सेट के बारे में कई बुनियादी अवधारणाओं और तथ्यों को सीखने से उत्पन्न हुई। अंत में मैंने एक उपसर्ग कोड और एक बिफिक्स कोड ( बेरेस्टेल की किताब में पूर्व में द्विपदीय कोड ) की धारणा को सीखा , जिसने मुझे ऊपर वर्णित उचित 3 श्रेणियों के साथ आने की अनुमति दी ।

अधिक स्पष्ट श्रेणियों के कुछ मुद्दों को देखे बिना उन (कोड से संबंधित) श्रेणियों की सराहना करना कठिन हो सकता है। एक सामान्य मुद्दा यह है कि रचना के तहत बंद होने से आंशिक कार्यों के एक अच्छी तरह से प्रतिबंधित वर्ग को परिभाषित करना मुश्किल हो सकता है। एक अन्य मुद्दा इस तथ्य से संबंधित है कि एक के अलावा (या एक स्थिर से गुणा) एक "फ़ंक्शन की गणना करने में आसान" है यदि संख्या के अंक कम-एंडियन क्रम में दिए गए हैं, लेकिन यह नहीं कि अंक बड़े में दिए गए हैं- एंडियन ऑर्डर।


1 एक कार्यात्मक परिमित राज्य ट्रांसड्यूसर एक नॉनडेर्मिनिस्टिक परिमित स्टेट ट्रांसड्यूसर है जो एक आंशिक कार्य का एहसास करता है। इन आंशिक कार्यों को नियत परिमित राज्य ट्रांसड्यूसर द्वारा महसूस नहीं किया जा सकता है। उन्हें नियतात्मक बिमचीन्स द्वारा महसूस किया जा सकता है , लेकिन उन्हें आवश्यकता हो सकती हैO(n) आगे और पीछे इनपुट पर स्कैन, अगर वे में काम करना चाहते हैं O(1) अंतरिक्ष।

2 एक अस्पष्ट परिमित राज्य ट्रांसड्यूसर एक नॉनडेटर्मिनिस्टिक परिमित स्टेट ट्रांसड्यूसर है जिसमें प्रत्येक इनपुट के लिए अधिकतम एक स्वीकार पथ है। यह एक आंशिक फ़ंक्शन का एहसास करता है, इसलिए यह एक कार्यात्मक परिमित स्टेट ट्रांसड्यूसर भी है। यह एक निर्णायक परिमित स्टेट ट्रांसड्यूसर असंदिग्ध है कि क्या यह निर्णायक है।

3 मुझे यकीन नहीं है कि कुल और संबंधपरक श्रेणियां वास्तव में कितनी उचित हैं। मैं सिर्फ आंशिक श्रेणी के लिए सीधे विकल्प दिखाना चाहता था । अधिक विकल्पों के साथ आना आसान है, उदाहरण के लिए सह-संबंध , जहां आकारिकी संबंध हैंRΣ×Σ साथ में L=R1(L)R1(ΣL), और समान स्रोत और लक्ष्य के बीच किसी भी दो आकार को समान माना जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.