पुशडाउन ऑटोमेटा का उपयोग करते हुए संदर्भ-मुक्त भाषाओं के लिए पंपिंग लेम्मा का प्रमाण


21

नियमित रूप से भाषाओं के लिए पम्पिंग लेम्मा , एक परिमित अवस्था automaton जो अध्ययन भाषा पहचानता है पर विचार राज्यों की संख्या की तुलना में एक अधिक से अधिक लंबाई के साथ एक स्ट्रिंग उठा, और कबूतर का घोंसला सिद्धांत लागू करके साबित कर दिया जा सकता है। विषय से मुक्त भाषाओं के लिए पम्पिंग लेम्मा (और साथ ही ओग्डेन प्रेमयिका लेमा जो थोड़ा अधिक सामान्य है), तथापि, भाषा का एक विषय से मुक्त व्याकरण का अध्ययन पर विचार एक पर्याप्त लंबी स्ट्रिंग उठा, और पार्स पेड़ को देखकर साबित होता है।

दो पंपिंग लेमेस की समानता को देखते हुए, आप उम्मीद करेंगे कि संदर्भ-मुक्त एक को भी एक पुशडाउन ऑटोमैटन पर विचार करके नियमित रूप से उसी तरह साबित किया जा सकता है जो भाषा को पहचानता है, बजाय एक व्याकरण के। हालाँकि, मैंने इस तरह के प्रमाण के लिए कोई संदर्भ खोजने का प्रबंधन नहीं किया।

इसलिए मेरा प्रश्न: क्या संदर्भ-मुक्त भाषाओं के लिए पम्पिंग लेम्मा का प्रमाण है जिसमें केवल पुशडाउन ऑटोमेटा शामिल है और व्याकरण नहीं है?

जवाबों:


16

मैंने इस समस्या के बारे में फिर से सोचा, और मुझे लगता है कि मेरे पास एक पूर्ण प्रमाण है। यह मेरे अनुमान की तुलना में थोड़ा अधिक कठिन है। टिप्पणियाँ बहुत स्वागत है! अद्यतन: मैंने यह सबूत arXiv पर जमा किया है, यदि यह किसी के लिए उपयोगी है: http://arxiv.org/abs/1207.2819

चलो एक वर्णमाला के ऊपर एक विषय से मुक्त भाषा हो Σ । चलो LΣA pushdown automaton जो पहचानता है , ढेर वर्णमाला के साथ down । हम द्वारा निरूपित | | के राज्यों की संख्या । व्यापकता के नुकसान के बिना, हम मान सकते हैं कि A का संक्रमण स्टैक के सबसे ऊपरी चिन्ह को पॉप करता है और या तो स्टैक पर कोई प्रतीक नहीं रखता है या स्टैक पर पिछले सबसे ऊपरी चिन्ह और कुछ अन्य चिन्ह को धक्का देता है।LΓ|A|AA

हम परिभाषित और पी = | | ( | गामा | + 1 ) पी ' पम्पिंग लंबाई, और दिखाएगा कि सभी डब्ल्यू एल ऐसा है कि | w | > पी में फॉर्म का अपघटन होता है w | v | 1 औरp=|A|2|Γ|p=|A|(|Γ|+1)pwL|w|>p ऐसा | v x y | पी ,w=uvxyz|vxy|p|vy|1n0,uvnxynzL

चलो ऐसा है कि | w | > पी । चलो π के लिए कम से कम लंबाई के स्वीकार करने पथ हो डब्ल्यू (के संक्रमण के एक दृश्य के रूप में प्रतिनिधित्व एक ), हम से इसकी लंबाई निरूपित | π | । हम के लिए, परिभाषित कर सकते हैं 0 मैं < | π | , एस मैं स्थिति पर ढेर के आकार मैं स्वीकार करने पथ की। सभी N > 0 के लिए , हम एक N -level को, से परिभाषित करते हैंwL|w|>pπwA|π|0i<|π|siiN>0Nπ तीन सूचकांकों का एक सेट के रूप में के साथ 0 मैं < j < कश्मीर पी ऐसी है कि:i,j,k0i<j<kp

  1. si=sk,sj=si+N
  2. सभी के लिए ऐसा है कि मैं nn , एस मैंरों nरों jinjsisnsj
  3. सभी के लिए ऐसा है कि जे n कश्मीर , रों कश्मीररों nरों कश्मीरnjnksksnsk

(इसका एक उदाहरण के लिए, नीचे केस 2 के लिए चित्र देखें, जो एक बेल को दिखाता है ।)N

हम स्तर को परिभाषित के π अधिक से अधिक के रूप में एन ऐसी है कि π एक है एन स्तर। इस परिभाषा निम्नलिखित संपत्ति से प्रेरित है: यदि एक पथ के ऊपर ढेर के आकार π अपने स्तर से भी बड़ा हो जाता है एल , तो ढेर प्रतीकों की तुलना में अधिक एल स्तर नीचे पॉप जा कभी नहीं होगा। या तो: हम अब दो मामलों भेद होगा एल < पी ' , ऐसी स्थिति में हम जानते हैं कि automaton राज्य के लिए एक ही विन्यास और सर्वोच्च एल ढेर के प्रतीकों में पहली बार दो बार का सामना करना पड़ा है पी + 1 के कदम πlπNπNπlll<plp+1π, या , और वहाँ एक स्टैकिंग और unstacking स्थिति यह है कि कई बार एक मनमाना संख्या, जिससे हम निर्माण दोहराया जा सकता है होना चाहिए वी और वाईlpvy

केस 1. । हम के विन्यास को परिभाषित एक के एक राज्य के जोड़ों के रूप में एक और का एक अनुक्रम एल ढेर प्रतीकों (जहां से भी कम समय आकार के ढेर एल के लिए उन्हें padding द्वारा प्रस्तुत किया जा के साथ एल एक विशेष खाली प्रतीक है, जिसके कारण हम प्रयोग के साथ | गामा | + 1 जब p को परिभाषित करें )। परिभाषा के अनुसार, वहाँ हैं | | ( - ations | + 1 ) l ऐसे विन्यास, जो p से कम है । इसलिए, मेंl<pAAlll|Γ|+1p|A|(|Γ|+1)lpπ के पहले चरण, एक ही कॉन्फ़िगरेशन दो अलग-अलग पदों पर दो बार सामना किया जाता है, i < वाई जेड के साथ y z = ε , यू = wp+1π । द्वारा निरूपित मैं (resp। जे ) के अंतिम पत्र की स्थिति डब्ल्यू कदम पर पढ़ मैं (resp। जे के) π । हम मैंजे । इसलिए, हम कर सकते हैं कारक डब्ल्यू = यू वी एक्सi<ji^j^wijπi^j^w=uvxyzyz=ϵ ,वी= डब्ल्यू मैंj ,एक्स= डब्ल्यू जे| w | । (तक डब्ल्यू एक्स y हम के पत्र निरूपितwसेएक्सतक, दोनों सहितyअनन्य।) निर्माण करके, | vxy | पीu=w0i^v=wi^j^x=wj^|w|wxywxy|vxy|p

हम यह भी पता चलता है कि है , लेकिन यह हमारे अवलोकन ऊपर से इस प्रकार है: की तुलना में गहरी ढेर प्रतीकों एल पॉप कभी नहीं कर रहे हैं, इसलिए वहाँ अलग करने के लिए कोई रास्ता नहीं है कॉन्फ़िगरेशन जो हमारी परिभाषा के अनुसार समान हैं, और यू वी एन एक्स के लिए एक स्वीकार पथ i और j , n बार के बीच के चरणों को दोहराकर w से बनाया गया है ।n0,uvnxynz=uvnxLluvnxwijn

अंत में, हम भी , क्योंकि अगर v = ε , फिर, क्योंकि हम चरणों में एक ही विन्यास है मैं और जे में π , π ' = π 0 मैं π जे |v|>0v=ϵijπके लिए एक को स्वीकार पथ होगाडब्ल्यू, की minimality का खंडनππ=π0iπj|π|wπ

(ध्यान दें कि यह मामला ऑटोमेटन राज्य में सबसे ऊपरी स्टैक प्रतीकों को हार्डकोड करके नियमित भाषाओं के लिए पंपिंग लेम्मा को लागू करने के लिए पर्याप्त है, जो कि पर्याप्त है क्योंकि एल यह सुनिश्चित करने के लिए पर्याप्त छोटा है डब्ल्यू | इस ऑटोमेटन के राज्यों की संख्या से बड़ा है। । मुख्य चाल है कि हम के लिए समायोजित करना चाहिए है ε -transitions।)ll|w|ϵ

प्रकरण 2. । चलो मैं , जे , कश्मीर एक होना पी ' स्तर। किसी भी ढेर आकार करने के लिए एच , एस मैंरों जे , हम सहयोगी पिछले धक्का एल.पी. ( ) = अधिकतम ( { y जे | एस वाई = } )lpi,j,kphsihsj lp(h)=max({yj|sy=h}) और पहली पॉप । परिभाषा के अनुसार, मैं जे fp ( ) कश्मीर । यहाँ इस निर्माण का एक चित्रण है। ड्राइंग को सरल बनाने के लिए, मैं पथ स्थितियों और शब्द पदों के बीच अंतर को छोड़ देता हूं जो हमें बाद में करना होगा।fp(h)=min({yj|sy=h}) औरilp(h)jjfp(h)k

Illustration of the construction for case 2. To simplify the drawing, the distinction between the path positions and word positions are ommitted.

हम कहते हैं कि स्टैक आकार h की पूर्ण स्थिति त्रिभुज द्वारा बनाई गई है:h

  1. स्थिति एलपी ( एच ) में ऑटोमेटन राज्यlp(h)
  2. स्थिति lp ( h ) में सबसे ऊपरी स्टैक प्रतीकlp(h)
  3. स्थिति एफपी ( एच ) में ऑटोमेटन राज्यfp(h)

कर रहे हैं संभव पूर्ण राज्यों, और पी ' + 1 के बीच ढेर आकार रों मैं और एस जे , इसलिए, pidgeonhole सिद्धांत से, वहाँ दो ढेर आकार मौजूद जी , एच के साथ रों मैंजी < रों जे ऐसा है कि जी और एच पर पूर्ण राज्य समान हैं। जैसे केस 1 में, हम ^ lp ( g ) , ^ lp ( h ) , ^ द्वारा परिभाषित करते हैंpp+1sisjg,hsig<hsjghlp(^g)lp(^h)fp(^h) और के अंतिम पत्र के पदों डब्ल्यू में इसी स्थान पर पढ़ π । हम कारक डब्ल्यू = यू वी एक्स वाई जेड जहां यू = डब्ल्यू 0 ^ एल.पी. () , वी = w ^ एल.पी. () ^ एल.पी. () , एक्स = w ^fp(^g)wπw=uvxyzu=w0lp(^g)v=wlp(^g)lp(^h)x=wlp(^h)fp(^h) , , और z = w ^ fp () | w | y=wfp(^h)fp(^g)z=wfp(^g)|w|

यह कारकीकरण सुनिश्चित करता है कि (क्योंकि कश्मीर पी स्तरों की हमारी परिभाषा के द्वारा)।|vxy|pkp

हम यह भी है कि दिखाने के लिए । ऐसा करने के लिए, निरीक्षण करें कि प्रत्येक बार जब हम v दोहराते हैं , हम उसी अवस्था और उसी स्टैक टॉप से ​​शुरू करते हैं और हम स्टैक में अपनी वर्तमान स्थिति से नीचे पॉप नहीं करते हैं (अन्यथा हमें वर्तमान स्थिति में फिर से धक्का देना होगा, उल्लंघन करते हुए एलपी ( जी ) की अधिकतमता , इसलिए हम में उसी पथ का अनुसरण कर सकते हैं और स्टैक पर समान प्रतीक अनुक्रम को धक्का दे सकते हैं। की maximality तक एल.पी. ( ) और के minimality fp (n0,uvnxynzLvlp(g)Alp(h) , एक्स पढ़ते समय, हम स्टैक में हमारी वर्तमान स्थिति से नीचे पॉप नहीं करते हैं, इसलिए ऑटोमेटन में अनुसरण किया जाने वाला पथ समान है, भले ही हमने कितनी बार वी दोहराया हो। अब, अगर हम दोहराने डब्ल्यू कई बार के रूप में हम दोहराने के रूप में वी , क्योंकि हम एक ही राज्य से शुरू करते हैं, क्योंकि हम के बारे में हमारी दोहराता साथ ढेर पर एक ही प्रतीक अनुक्रम धकेल दिया वी , और तब से हम क्या की तुलना में अधिक पॉप नहीं है v है fp ( g ) की न्यूनतमता के कारण , हम A में उसी पथ का अनुसरण कर सकते हैंऔर स्टैक से समान प्रतीक अनुक्रम पॉप कर सकते हैं। इसलिए, यू वी एन से एक स्वीकार पथfp(h)xvwvvvfp(g)Auvnxynz can be constructed from the accepting path for w.

Finally, we also have |vy|>1, because like in case 1, if v=ϵ and y=ϵ, we can build a shorter accepting path for w by removing πlp(g)lp(h) and πfp(h)fp(g).

Hence, we have an adequate factorization in both cases, and the result is proved.

(Credit goes to Marc Jeanmougin for helping me with this proof.)


7

Yes it is possible. We could use the notion of surface configurations; they were introduced by Cook a long time back. With this it should be quite easy to get a version of pumping lemma out.

As to surface configurations, almost any paper on LogCFL should carry its definition. Here is a recent paper and here is a thesis

Maybe someone more energetic can spell out the details!


Thanks for answering! Yes, it is pretty natural to look at the combination of automaton state and topmost stack symbol. I am still thinking about this problem, though, and I can't manage to figure out the details... Help is appreciated. :-)
a3nm

3

For completeness a reference to a proof in this direction.

A.Ehrenfeucht, H.J.Hoogeboom, G.Rozenberg: Coordinated pair systems. I: Dyck words and classical pumping RAIRO, Inf. Théor. Appl. 20, 405-424 (1986)

Abstract. The notion of a coordinated pair system [...] corresponds very closely to (is another formulation of) the notion of a push-down automaton. In this paper we [...] investigate the possibility of obtaining pumping properties of context-free languages via the analysis of computations in cp systems. In order to do this we analyze the combinatorial structure of Dyck words. The properties of Dyck words we investigate stem from the combinatorial analysis of computations in cp systems. We demonstrate how this correspondence can be used for proving the classical pumping lemma.


1

When discussing this problem with Géraud Sénizergues, he pointed me this paper by Sakarovitch that already proves this result. The proof seems to date back to this paper by Ogden.

References:

  • Sakarovitch, Jacques. Sur une propriété d’itération des langages algébriques déterministes. (French. English summary). Math. Systems Theory 14 (1981), no. 3, 247–288.
  • William F. Ogden. 1969. Intercalation theorems for stack languages. In Proceedings of the first annual ACM symposium on Theory of computing (STOC '69).
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.