यह कैसे साबित किया जाए कि कोई भाषा संदर्भ-मुक्त नहीं है?


88

हमने संदर्भ-मुक्त भाषाओं के वर्ग CFL । यह संदर्भ-मुक्त व्याकरण और पुशडाउन ऑटोमेटा दोनों की विशेषता है, इसलिए यह दिखाना आसान है कि एक दी गई भाषा संदर्भ-मुक्त है।

हालांकि, मैं इसके विपरीत कैसे दिखाऊं? मेरा टीए इस बात पर अड़ा हुआ है कि ऐसा करने के लिए, हमें सभी व्याकरणों (या ऑटोमेटा) के लिए दिखाना होगा कि वे हाथ में भाषा का वर्णन नहीं कर सकते हैं। यह एक बड़ा काम लगता है!

मैंने कुछ पंपिंग लेम्मा के बारे में पढ़ा है लेकिन यह वास्तव में जटिल है।


Ntpick: यह है अनिर्णनीय एक भाषा विषय से मुक्त है या नहीं दिखाने के लिए।
रीइनरईपोस्ट

1
@reinierpost मैं यह नहीं देखता कि आपकी टिप्पणी कैसे प्रश्न से संबंधित है। यह चीजों को साबित करने के बारे में है, न कि निर्णय लेने (एल्गोरिदमिक रूप से) के बारे में।
राफेल

बस यह मुद्दा बनाना कि यह दिखाना आसान नहीं है कि भाषा संदर्भ-मुक्त है, सामान्य तौर पर । अगर यह आसान है, तो यह कुछ विशेष परिस्थितियों के कारण होना चाहिए, जो सामान्य रूप से भाषाओं के लिए नहीं होती हैं, जैसे कि एक पुशडाउन ऑटोमैटन दिया जाता है जो भाषा का वर्णन करता है।
रीयरियरपोस्ट

@reinierpost तर्क की वह रेखा यह मानने लगती है कि असाध्य का तात्पर्य (बराबर?) को सिद्ध करना कठिन है। मुझे आश्चर्य है कि अगर यह सच है।
राफेल

जवाबों:


69

मेरी जानकारी के लिए पम्पिंग लेम्मा है अब तक का सबसे आसान और सबसे से इस्तेमाल तकनीक। यदि आपको यह कठिन लगता है , तो पहले नियमित संस्करण का प्रयास करें , यह उतना बुरा नहीं है। भाषाओं के लिए कुछ अन्य साधन हैं जो संदर्भ से मुक्त हैं। उदाहरण के लिए असंदिग्ध भाषाएं तुच्छ रूप से संदर्भ मुक्त नहीं हैं।

उस ने कहा, मैं भी पंपिंग लेम्मा की तुलना में अन्य तकनीकों में दिलचस्पी रखता हूं यदि कोई हो।

संपादित करें: यहाँ पम्पिंग लेम्मा के लिए एक उदाहरण है: मान लीजिए भाषा है संदर्भ मुक्त ( पी प्रधानमंत्री संख्याओं के समूह है)। पम्पिंग लेम्मा में बहुत सारे / so क्वांटिफायर होते हैं, इसलिए मैं इसे एक गेम की तरह बनाऊंगा :L={akkP}P/

  1. पम्पिंग लेम्मा आपको एक p
  2. आप एक शब्द दे की लंबाई कम से कम की भाषा के पीsp
  3. : पंप लेम्मा इस तरह उसे पुनः लिखता है (कुछ शर्तों के साथ | वी एक्स y |पी और | v y |1 )s=uvxyz|vxy|p|vy|1
  4. आप एक पूर्णांक दे n0
  5. अगर में नहीं है एल , आप जीतते हैं, एल नहीं संदर्भ नि: शुल्क है।uvnxynzLL

के लिए इस विशिष्ट भाषा के लिए किसी भी एक कश्मीर (के साथ कश्मीर पी और कश्मीर चाल करना होगा अभाज्य संख्या है)। फिर पम्पिंग लेम्मा आपको u v x y z देता है | v | । प्रसंग-निष्ठा का तिरस्कार करो, तुम्हें ऐसे n खोजने की जरूरत है | u v n x y n z | एक अभाज्य संख्या नहीं है।sakkpkuvxyz|vy|1n|uvnxynz|

|uvnxynz|=|s|+(n1)|vy|=k+(n1)|vy|

और फिर करेंगे: k + k | v | = कश्मीर ( 1 + | v y | ) नहीं प्रधानमंत्री इतना है यू वी एन एक्स वाई एन जेड एल । पम्पिंग लेम्मा लागू नहीं किया जा सकता है इसलिए एल संदर्भ मुक्त नहीं है।n=k+1k+k|vy|=k(1+|vy|)uvnxynzLL

एक दूसरा उदाहरण भाषा है । हमें (निश्चित रूप से) एक स्ट्रिंग का चयन करना होगा और दिखाना होगा कि इसका कोई संभावित तरीका नहीं है कि इसे उन पांच भागों में तोड़ा जा सके और हर व्युत्पन्न पंप स्ट्रिंग को भाषा में बने रहें।{www{a,b}}

स्ट्रिंग इस प्रमाण के लिए एक उपयुक्त विकल्प है। अब हमें सिर्फ यह देखना है कि v और y कहां हो सकते हैं। मुख्य भाग ये हैं कि v या y में कुछ होना चाहिए (शायद दोनों), और यह कि v और y दोनों (और x ) लंबाई p सबस्ट्रिंग में समाहित हैं - इसलिए वे बहुत दूर नहीं हो सकते।s=apbpapbpvyvyvyxp

इस स्ट्रिंग के लिए कई संभावनाएँ हैं जहाँ और y हो सकते हैं, लेकिन यह पता चलता है कि कई मामले वास्तव में बहुत समान दिखते हैं।vy

  1. या वी वाई * । तो फिर वे दोनों एक s या b s के किसी एक खंड में निहित हैं। यह बहस करने के लिए अपेक्षाकृत आसान मामला है, क्योंकि यह इस तरह का कोई फर्क नहीं पड़ता कि वे किसमें हैं। मान लें कि | v | = के पीvyavybab|vy|=kp
    • वे का पहला खंड में हैं, तो है, तो जब हम पंप, नई स्ट्रिंग की पहली छमाही है एक पी + कश्मीरपी - k / 2 , और दूसरा है कश्मीर / 2 एक पी बी पी । जाहिर है इस फार्म के नहीं है डब्ल्यू डब्ल्यूaap+kbpk/2bk/2apbpww
    • अन्य तीन खंडों में से किसी एक के लिए तर्क बहुत अधिक चलता है, यह वहीं है जहां और k / 2 सूचकांकों में समाप्त होता है।kk/2
  2. खंडों में से दो को विभाजित करता है। इस मामले मेंनीचेपंपअपने दोस्त है। फिर से कई जगह हैं जहां यह हो सकता है (3 सटीक होना), लेकिन मैं सिर्फ एक उदाहरण एक करूंगा, और बाकी को वहां से पता लगाना आसान होना चाहिए। vxy
    • मान लें कि पहले के बीच की सीमा फैला एक अनुभाग और पहली अनुभाग। बता दें कि v y = a k 1 b k 2 (यह ठीक नहीं है कि कोई s और b s कहां v और y में हैं , लेकिन हम जानते हैं कि वे क्रम में हैं)। फिर जब हम नीचे पंप (यानी मैं = 0 मामले), हम नए स्ट्रिंग प्राप्त रों ' = एक पी - k 1पी - k 2vxyabvy=ak1bk2abvyi=0 , लेकिन फिर अगर रों ' में विभाजित किया जा सकता है डब्ल्यू डब्ल्यू , मध्य दूसरे में कहीं होना चाहिए एक , खंड इसलिए पहली छमाही है एक पी - k 1पी - k 2 एक ( कश्मीर 1 + कश्मीर 2 ) / 2 , और दूसरी छमाही एक पी है - ( के 1 + के 2 ) / 2 बी पीs=apk1bpk2apbpswwaapk1bpk2a(k1+k2)/2ap(k1+k2)/2bp। स्पष्ट रूप से ये समान स्ट्रिंग नहीं हैं, इसलिए हम वहां और y नहीं डाल सकते हैं ।vy

शेष मामलों को वहां से काफी पारदर्शी होना चाहिए - वे एक ही विचार हैं, बस पहले उदाहरण में अन्य 3 स्थानों में और y डाल रहे हैं , और दूसरे उदाहरण में 2 स्पॉट। हालांकि सभी मामलों में, आप इसे इस तरह से पंप कर सकते हैं कि जब आप स्ट्रिंग को आधे में विभाजित करते हैं, तो ऑर्डर स्पष्ट रूप से गड़बड़ हो जाता है।vy


वास्तव में, कोज़ेन का खेल इस बारे में जाने का तरीका है।
सोसायटीज

45

ओग्डेन के लेम्मा

लेम्मा (ओग्डेन)। चलो एक विषय से मुक्त भाषा हो। तो फिर वहाँ है एक निरंतर एन ऐसी है कि हर एक के लिए z एल और के किसी भी तरह से अंकन एन की या एक से अधिक पदों (प्रतीक) z "प्रतिष्ठित पदों" के रूप में है, तो जेड के रूप में लिखा जा सकता है जेड = यू वी डब्ल्यू एक्स वाई , ऐसा है किLNzL Nzzz=uvwxy

  1. में कम से कम एक विशिष्ट स्थान है।vx
  2. में अधिकांश N प्रतिष्ठित पद हैं।vwxN
  3. सभी के लिए , यू वी मैं डब्ल्यू एक्स मैं y एलi0uviwxiyL

उदाहरण। चलो । मान लें एल विषय से मुक्त है, और एन निरंतर ओग्डेन प्रेमयिका लेमा द्वारा दिए गए हो। चलो जेड = एक एन बी एन + एन ! सी एन + 2 एन ! (जो L से संबंधित है ), और मान लें कि हम चिह्नित हैंL={aibjck:ij,jk,ik}LNz=aNbN+N!cN+2N!Lके रूप में प्रतीक के सभी पदों (यानी जेड के पहले एन पदों )। चलो जेड = यू वी डब्ल्यू एक्स वाई के अपघटन हो z ओग्डेन प्रेमयिका लेमा से स्थिति को संतोषजनक।aNzz=uvwxyz

  • यदि या x में अलग-अलग चिह्न हैं, तो u v 2 w x 2 y because L , क्योंकि गलत क्रम में प्रतीक होंगे।vxuv2wx2yL
  • और x में से कम से कम एक में केवल एक प्रतीक होना चाहिए , क्योंकि केवल एक को प्रतिष्ठित किया गया है। इस प्रकार, यदि एक्स एल ( * ) या एक्स एल ( * ) , तो वी एल ( + ) । चलो पी = | वी | । फिर 1 पी एन , जिसका अर्थ है पी बांटता एन ! । चलो qvxaaxL(b)xL(c)vL(A+)p=|v|1pNpN! । फिर जेड ' = यू वी 2 क्ष + 1 डब्ल्यू एक्स 2 क्ष + 1 y से संबंधित होना चाहिए एल । हालाँकि, v 2 q + 1 = a 2 p q + p = a 2 N ! + पी । के बाद से यू डब्ल्यू y वास्तव में है एन - पी प्रतीकों एक है, तो zq=N!/pz=uv2q+1wx2q+1yLv2q+1=a2pq+p=a2N!+puwyNpa है 2 एन ! + एन प्रतीकों a । लेकिन दोनों वी और एक्स नहीं की है, तो जेड ' भी है 2 एन ! + N प्रतीक c , जिसका अर्थ z and L है , और यह Ogden के लेम्मा का विरोध करता है। ऐसा ही एक विरोधाभास होती है तो एक्स एल ( + ) या एक्स एल ( * ) । हम एल समाप्त करते हैंz2N!+Navxcz2N!+NczLxL(A+)xL(c)L संदर्भ-मुक्त नहीं है।

व्यायाम करें। ओग्डेन के लेम्मा का उपयोग करना, पता चलता है कि विषय से मुक्त नहीं है।L={aibjckd:i=0 or j=k=}

पम्पिंग लेम्मा

यह ओग्डेन के लेम्मा का एक विशेष मामला है जिसमें सभी पदों को प्रतिष्ठित किया गया है।

लेम्मा। चलो एक विषय से मुक्त भाषा हो। तो फिर वहाँ है एक निरंतर एन ऐसी है कि हर एक के लिए z एल , जेड के रूप में लिखा जा सकता है जेड = यू वी डब्ल्यू एक्स वाई , ऐसा है किLNzLzz=uvwxy

  1. |vx|>0
  2. |vwx|N
  3. सभी के लिए , यू वी मैं डब्ल्यू एक्स मैं y एलi0uviwxiyL

पारिख के सिद्धांत

यह ओग्डेन के लेम्मा से भी अधिक तकनीकी है।

परिभाषा। चलो । हम परिभाषित Ψ Σ : Σ *एन एन द्वारा Ψ Σ ( डब्ल्यू ) = ( मीटर 1 , ... , मीटर n ) , जहां मीटर मैं उसकी उपस्थिति की संख्या है एक मैं में डब्ल्यूΣ={a1,,an}ΨΣ:ΣNn

ΨΣ(w)=(m1,,mn),
miaiw

परिभाषा। एक उप समूह के एन एन कहा जाता है रैखिक अगर यह लिखा जा सकता है: एस = { यू 0 + Σ 1 मैं k एक मैं यू मैं :  के कुछ सेट के लिए  यू मैंएन एन  और  एक मैंएन }SNn

S={u0+1ikaiui: for some set of uiNn and aiN}

परिभाषा। एक उप समूह के एन एन कहा जाता है अर्द्ध रैखिक अगर यह रेखीय सेट की एक निश्चित संग्रह का मिलन है।SNn

LΣL

ΨΣ[L]={ΨΣ(w):wL}

L={0m1n:m>n or (m is prime and mn)}

व्यायाम करें। पारिख की प्रमेय का उपयोग करते हुए, दिखाते हैं कि एक अक्षरी वर्णमाला पर कोई भी संदर्भ-मुक्त भाषा भी नियमित है।


1
मैंने जाम के जवाब को स्वीकार किया क्योंकि प्रश्न में पम्पिंग लेम्मा का स्पष्ट उल्लेख है। मैं आपके उत्तर की बहुत सराहना करता हूँ, हालाँकि; सभी प्रमुख विधियों का यहां एकत्र होना एक बड़ी बात है।
राफेल

1
यह ठीक है, लेकिन ध्यान दें कि पम्पिंग लेम्मा ओग्डेन के लेम्मा का एक विशेष मामला है; ;-)
जेनोमा

बेशक। फिर भी, अधिकांश लोग पहले पीएल की कोशिश करेंगे; कई लोग ओएल को भी नहीं जानते हैं।
राफेल

1
पारिख की प्रमेय पर निर्माण, गिन्सबर्ग और स्पैनियर द्वारा एक प्रमेय, बंधे हुए मामले में संदर्भ-निर्दयता के लिए एक महत्वपूर्ण और पर्याप्त स्थिति देता है। math.stackexchange.com/a/122472
sdcvvc

क्या आप अन्य कार्यों के संदर्भ में "प्रतिष्ठित पदों" को परिभाषित कर सकते हैं? या कम से कम अनौपचारिक रूप से? मुझे कई अलग-अलग जगहों पर OL कॉपी किए गए शब्दशः की परिभाषा मिली, लेकिन उनमें से किसी ने भी अब तक यह समझाने की परवाह नहीं की कि इसका क्या मतलब है।
wvxvw

34

बंद करने के गुण

CFL

LCFLLCFLLCFLLCFL

यह कम पूर्व ज्ञान का उपयोग करने वाले अन्य परिणामों में से एक का उपयोग करने से अक्सर कम (और अक्सर कम त्रुटि-प्रवण) होता है। यह एक सामान्य अवधारणा भी है जिसे सभी प्रकार की वस्तुओं के वर्ग पर लागू किया जा सकता है।

उदाहरण 1: नियमित भाषाओं के साथ अंतर

L(e)e

L={ww{a,b,c},|w|a=|w|b=|w|c}

LL(abc)={anbncnnN}CFL

CFLLCFL

उदाहरण 2: (विलोम) होमोमोर्फिज्म

L={(ab)2ncmd2nm(aba)nm,nN}

ϕ(x)={ax=aεx=bbx=cx=d

ϕ(L)={a2nb2na2nnN}.

अब उसके पास

ψ(x)={aax=ax=cbbx=bandL1={xnbnynx,y{a,c}nN},

L1=ψ1(ϕ(L)))

L1L2=L(abc)L3={anbncnnN}

L3=L2ψ1(ϕ(L))

LCFLL3L3LCFL


इंटरचेंज लेम्मा

इंटरचेंज लेम्मा [1] संदर्भ साहस के लिए एक आवश्यक शर्त उससे भी मजबूत है प्रस्ताव ओग्डेन के लेम्मा । उदाहरण के लिए, इसका उपयोग यह दिखाने के लिए किया जा सकता है

{xyyzx,y,z{a,b,c}+}CFL

जो कई अन्य तरीकों का विरोध करता है। यह लेम्मा है:

LCFLcLn2QnLn=LΣnmnm2k|Qn|cLn2ziQn

  1. zi=wixiyii=1,,k
  2. |w1|=|w2|==|wk|
  3. |y1|=|y2|==|yk|
  4. m|x1|=|x2|==|xk|>m2
  5. wixjyiLn(i,j)[1..k]2

n,mQn

इस समय, मेरे पास स्वतंत्र रूप से उपलब्ध संदर्भ नहीं है और ऊपर दिए गए सूत्रीकरण को 1981 से [1] के पहले से लिया गया है। मैं बेहतर संदर्भों को ट्रैक करने में मदद की सराहना करता हूं। ऐसा प्रतीत होता है कि उसी संपत्ति को हाल ही में खोजा गया (पुनः) [2]।


अन्य आवश्यक शर्तें

Boonyavatana और Slutzki [3] पम्पिंग और इंटरचेंज लेम्मा के समान कई स्थितियों का सर्वेक्षण करते हैं।


  1. डब्ल्यू। ओगडेन, आरजे रॉस और के। विंकलमैन द्वारा 1985 के संदर्भ में एक "इंटरचेंज लेम्मा"
  2. टी। यामाकामी (2008) द्वारा नियमित और संदर्भ-मुक्त भाषाओं के लिए लेप्सिंग स्वैपिंग
  3. R. Boonyavatana और जी। स्लटज़ो (42) द्वारा संदर्भ-मुक्त भाषाओं के लिए इंटरचेंज या पंप (DI) लेमेस


19

कोई भी सामान्य विधि नहीं है क्योंकि सेट गैर-संदर्भ-मुक्त-भाषा अर्द्ध-विघटित (एकारे) नहीं है। यदि कोई सामान्य तरीका था, तो हम इसे इस सेट को अर्ध-निर्णय करने के लिए उपयोग कर सकते हैं।

स्थिति और भी खराब है, क्योंकि दो सीएफएल दिए जाने से यह तय करना संभव नहीं है कि उनका चौराहा भी सीएफएल है।

संदर्भ: होपक्रॉफ्ट और उलेमन, "ऑटोमेटा थ्योरी, भाषा और संगणना का परिचय", 1979।


2
एक दिलचस्प (लेकिन शायद अधिक उन्नत और ओपन-एंडेड प्रश्न) गैर-सीएफएल के उपवर्ग को वर्गीकृत करेगा जो एक विशेष पद्धति का उपयोग करके गैर-सीएफएल साबित हो सकता है।
केव

मैं एक अभिकलन विधि की तलाश नहीं कर रहा हूं, बल्कि पेन और पेपर प्रूफ तकनीक की तलाश में हूं । उत्तरार्द्ध आवश्यक रूप से पूर्व का अर्थ नहीं है।
राफेल

13

ओग्डेन की स्थिति ( OC ) का एक मजबूत संस्करण है

बदर-मौरा की हालत (BMC)

LΣnzLd(z)e(z)d(z)>ne(z)+1z=uvwxy

  1. d(vx)1e(vx)=0
  2. d(vwx)ne(vwx)+1
  3. i0uviwxiyL

LBMC(Σ)L

CFL(Σ)BMC(Σ)OC(Σ)

संदर्भ: बैगर, सी।, मौरा, ए।, ओग्डेन के लेम्मा का एक सामान्यीकरण। जेएसीएम 29, सं। 2, (1982), 404407


2
क्यों न सिर्फ डौमसी और कुडलेक के सामान्यीकरण dx.doi.org/10.1007/3-540-48321-7_18 ...
András Salamon

@ AndrásSalamon: मुझे यह नहीं पता था! :-) ... शायद आप इसे एक नए उत्तर के रूप में कह सकते हैं कि OC, BMC, PC इसके विशेष मामले हैं (सभी प्रतिष्ठित या कोई बहिष्कृत स्थिति नहीं)।
वोर

आपका स्वागत है इसे पोस्ट करने के लिए, अभी समय नहीं है।
आंद्र सलाम

यह उत्तर एक उदाहरण से लाभान्वित होगा।
राफेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.