पुशडाउन ऑटोमेटा का उपयोग करते हुए संदर्भ-मुक्त भाषाओं के लिए पंपिंग लेम्मा का प्रमाण

21

नियमित रूप से भाषाओं के लिए पम्पिंग लेम्मा , एक परिमित अवस्था automaton जो अध्ययन भाषा पहचानता है पर विचार राज्यों की संख्या की तुलना में एक अधिक से अधिक लंबाई के साथ एक स्ट्रिंग उठा, और कबूतर का घोंसला सिद्धांत लागू करके साबित कर दिया जा सकता है। विषय से मुक्त भाषाओं के लिए पम्पिंग लेम्मा (और साथ ही ओग्डेन प्रेमयिका लेमा जो थोड़ा अधिक सामान्य है), तथापि, भाषा का एक विषय से मुक्त व्याकरण का अध्ययन पर विचार एक पर्याप्त लंबी स्ट्रिंग उठा, और पार्स पेड़ को देखकर साबित होता है।

दो पंपिंग लेमेस की समानता को देखते हुए, आप उम्मीद करेंगे कि संदर्भ-मुक्त एक को भी एक पुशडाउन ऑटोमैटन पर विचार करके नियमित रूप से उसी तरह साबित किया जा सकता है जो भाषा को पहचानता है, बजाय एक व्याकरण के। हालाँकि, मैंने इस तरह के प्रमाण के लिए कोई संदर्भ खोजने का प्रबंधन नहीं किया।

इसलिए मेरा प्रश्न: क्या संदर्भ-मुक्त भाषाओं के लिए पम्पिंग लेम्मा का प्रमाण है जिसमें केवल पुशडाउन ऑटोमेटा शामिल है और व्याकरण नहीं है?

— a3nm
स्रोत

16

मैंने इस समस्या के बारे में फिर से सोचा, और मुझे लगता है कि मेरे पास एक पूर्ण प्रमाण है। यह मेरे अनुमान की तुलना में थोड़ा अधिक कठिन है। टिप्पणियाँ बहुत स्वागत है! अद्यतन: मैंने यह सबूत arXiv पर जमा किया है, यदि यह किसी के लिए उपयोगी है: http://arxiv.org/abs/1207.2819

$\DeclareMathOperator{\fp}{fp}$ $\DeclareMathOperator{\lp}{lp}$ $\newcommand{\fpp}[1]{\widehat{\fp{#1}}}$ $\newcommand{\lpp}[1]{\widehat{\lp{#1}}}$

चलो एक वर्णमाला के ऊपर एक विषय से मुक्त भाषा हो । चलो $L$ $\Sigma$ $A$ pushdown automaton जो पहचानता है , ढेर वर्णमाला के साथ । हम द्वारा निरूपित के राज्यों की संख्या । व्यापकता के नुकसान के बिना, हम मान सकते हैं कि संक्रमण स्टैक के सबसे ऊपरी चिन्ह को पॉप करता है और या तो स्टैक पर कोई प्रतीक नहीं रखता है या स्टैक पर पिछले सबसे ऊपरी चिन्ह और कुछ अन्य चिन्ह को धक्का देता है। $L$ $\Gamma$ $|A|$ $A$ $A$

हम परिभाषित और पम्पिंग लंबाई, और दिखाएगा कि सभी ऐसा है कि में फॉर्म का अपघटन होता है और $p' = |A|^2 |\Gamma|$ $p = |A| (|\Gamma|+1)^{p'}$ $w \in L$ $|w| > p$ ऐसा , $w = u v x y z$ $|vxy| \leq p$ $|vy| \geq 1$ । $\forall n \geq 0, u v^n x y^n z \in L$

चलो ऐसा है कि । चलो के लिए कम से कम लंबाई के स्वीकार करने पथ हो (के संक्रमण के एक दृश्य के रूप में प्रतिनिधित्व ), हम से इसकी लंबाई निरूपित । हम के लिए, परिभाषित कर सकते हैं , स्थिति पर ढेर के आकार स्वीकार करने पथ की। सभी , हम एक -level को, से $w \in L$ $|w| > p$ $\pi$ $w$ $A$ $|\pi|$ $0 \leq i < |\pi|$ $s_i$ $i$ $N > 0$ $N$ $\pi$ तीन सूचकांकों का एक सेट के रूप में के साथ ऐसी है कि: $i, j, k$ $0 \leq i < j < k \leq p$

$s_i = s_k, s_j = s_i + N$
सभी के लिए ऐसा है कि $n$ , $i \leq n \leq j$ $s_i \leq s_n \leq s_j$
सभी के लिए ऐसा है कि , । $n$ $j \leq n \leq k$ $s_k \leq s_n \leq s_k$

(इसका एक उदाहरण के लिए, नीचे केस 2 के लिए चित्र देखें, जो एक बेल को दिखाता है ।) $N$

हम स्तर को परिभाषित के अधिक से अधिक के रूप में ऐसी है कि एक है स्तर। इस परिभाषा निम्नलिखित संपत्ति से प्रेरित है: यदि एक पथ के ऊपर ढेर के आकार अपने स्तर से भी बड़ा हो जाता है , तो ढेर प्रतीकों की तुलना में अधिक स्तर नीचे पॉप जा कभी नहीं होगा। या तो: हम अब दो मामलों भेद होगा , ऐसी स्थिति में हम जानते हैं कि automaton राज्य के लिए एक ही विन्यास और सर्वोच्च ढेर के प्रतीकों में पहली बार दो बार का सामना करना पड़ा है के कदम $l$ $\pi$ $N$ $\pi$ $N$ $\pi$ $l$ $l$ $l < p'$ $l$ $p+1$ $\pi$ , या , और वहाँ एक स्टैकिंग और unstacking स्थिति यह है कि कई बार एक मनमाना संख्या, जिससे हम निर्माण दोहराया जा सकता है होना चाहिए और । $l \geq p'$ $v$ $y$

केस 1. । हम के विन्यास को परिभाषित के एक राज्य के जोड़ों के रूप में और का एक अनुक्रम ढेर प्रतीकों (जहां से भी कम समय आकार के ढेर के लिए उन्हें padding द्वारा प्रस्तुत किया जा के साथ एक विशेष खाली प्रतीक है, जिसके कारण हम प्रयोग के साथ जब को परिभाषित करें )। परिभाषा के अनुसार, वहाँ हैं ऐसे विन्यास, जो से कम है । इसलिए, में $l < p'$ $A$ $A$ $l$ $l$ $l$ $|\Gamma| + 1$ $p$ $|A| (|\Gamma| + 1)^l$ $p$ पहले चरण, एक ही कॉन्फ़िगरेशन दो अलग-अलग पदों पर दो बार सामना किया जाता है, के साथ , $p+1$ $\pi$ । द्वारा निरूपित ) के अंतिम पत्र की स्थिति कदम पर पढ़ (resp। के) । हम । इसलिए, हम कर सकते हैं कारक $i < j$ $\widehat{i}$ $\widehat{j}$ $w$ $i$ $j$ $\pi$ $\widehat{i} \leq \widehat{j}$ $w = u v x y z$ $y z = \epsilon$ , ,। (तक हम के पत्र निरूपितसेतक, दोनों सहितअनन्य।) निर्माण करके,। $u = w_{0 \cdots \widehat{i}}$ $v = w_{\widehat{i} \cdots \widehat{j}}$ $x = w_{\widehat{j} \cdots |w|}$ $w_{x \cdots y}$ $w$ $x$ $y$ $|vxy| \leq p$

हम यह भी पता चलता है कि है , लेकिन यह हमारे अवलोकन ऊपर से इस प्रकार है: की तुलना में गहरी ढेर प्रतीकों पॉप कभी नहीं कर रहे हैं, इसलिए वहाँ अलग करने के लिए कोई रास्ता नहीं है कॉन्फ़िगरेशन जो हमारी परिभाषा के अनुसार समान हैं, और लिए एक स्वीकार पथ और , बार के बीच के चरणों को दोहराकर से बनाया गया है । $\forall n \geq 0, u v^n x y^n z = u v^n x \in L$ $l$ $u v^n x$ $w$ $i$ $j$ $n$

अंत में, हम भी , क्योंकि अगर , फिर, क्योंकि हम चरणों में एक ही विन्यास है और में , $|v| > 0$ $v = \epsilon$ $i$ $j$ $\pi$ के लिए एक को स्वीकार पथ होगा, की minimality का खंडन। $\pi' = \pi_{0 \cdots i} \pi_{j \cdots |\pi|}$ $w$ $\pi$

(ध्यान दें कि यह मामला ऑटोमेटन राज्य में सबसे ऊपरी स्टैक प्रतीकों को हार्डकोड करके नियमित भाषाओं के लिए पंपिंग लेम्मा को लागू करने के लिए पर्याप्त है, जो कि पर्याप्त है क्योंकि यह सुनिश्चित करने के लिए पर्याप्त छोटा है इस ऑटोमेटन के राज्यों की संख्या से बड़ा है। । मुख्य चाल है कि हम के लिए समायोजित करना चाहिए है -transitions।) $l$ $l$ $|w|$ $\epsilon$

प्रकरण 2. । चलो एक होना स्तर। किसी भी ढेर आकार करने के लिए , , हम सहयोगी पिछले धक्का $l \geq p'$ $i, j, k$ $p'$ $h$ $s_i \leq h \leq s_j$ $\lp(h) = \max(\{y \leq j | s_y = h\})$ और पहली पॉप । परिभाषा के अनुसार, । यहाँ इस निर्माण का एक चित्रण है। ड्राइंग को सरल बनाने के लिए, मैं पथ स्थितियों और शब्द पदों के बीच अंतर को छोड़ देता हूं जो हमें बाद में करना होगा। $\fp(h) = \min(\{y \geq j | s_y = h\})$ और $i \leq \lp(h) \leq j$ $j \leq \fp(h) \leq k$

Illustration of the construction for case 2. To simplify the drawing, the distinction between the path positions and word positions are ommitted.

हम कहते हैं कि स्टैक आकार की पूर्ण स्थिति त्रिभुज द्वारा बनाई गई है: $h$

स्थिति में ऑटोमेटन राज्य $\lp(h)$
स्थिति में सबसे ऊपरी स्टैक प्रतीक $\lp(h)$
स्थिति में ऑटोमेटन राज्य $\fp(h)$

कर रहे हैं संभव पूर्ण राज्यों, और के बीच ढेर आकार और , इसलिए, pidgeonhole सिद्धांत से, वहाँ दो ढेर आकार मौजूद के साथ ऐसा है कि और पर पूर्ण राज्य समान हैं। जैसे केस 1 में, हम , , द्वारा परिभाषित करते हैं $p'$ $p' + 1$ $s_i$ $s_j$ $g, h$ $s_i \leq g < h \leq s_j$ $g$ $h$ $\lpp(g)$ $\lpp(h)$ $\fpp(h)$ और के अंतिम पत्र के पदों में इसी स्थान पर पढ़ । हम कारक जहां , , $\fpp(g)$ $w$ $\pi$ $w = u v x y z$ $u = w_{0 \cdots \lpp(g)}$ $v = w_{\lpp(g) \cdots \lpp(h)}$ $x = w_{\lpp(h) \cdots \fpp(h)}$ , , और । $y = w_{\fpp(h) \cdots \fpp(g)}$ $z = w_{\fpp(g) \cdots |w|}$

यह कारकीकरण सुनिश्चित करता है कि (क्योंकि स्तरों की हमारी परिभाषा के द्वारा)। $|vxy| \leq p$ $k \leq p$

हम यह भी है कि दिखाने के लिए । ऐसा करने के लिए, निरीक्षण करें कि प्रत्येक बार जब हम दोहराते हैं , हम उसी अवस्था और उसी स्टैक टॉप से शुरू करते हैं और हम स्टैक में अपनी वर्तमान स्थिति से नीचे पॉप नहीं करते हैं (अन्यथा हमें वर्तमान स्थिति में फिर से धक्का देना होगा, उल्लंघन करते हुए की , इसलिए हम में उसी पथ का अनुसरण कर सकते हैं और स्टैक पर समान प्रतीक अनुक्रम को धक्का दे सकते हैं। की maximality तक और के minimality $\forall n \geq 0, u v^n x y^n z \in L$ $v$ $\lp(g)$ $A$ $\lp(h)$ , पढ़ते समय, हम स्टैक में हमारी वर्तमान स्थिति से नीचे पॉप नहीं करते हैं, इसलिए ऑटोमेटन में अनुसरण किया जाने वाला पथ समान है, भले ही हमने कितनी बार दोहराया हो। अब, अगर हम दोहराने कई बार के रूप में हम दोहराने के रूप में , क्योंकि हम एक ही राज्य से शुरू करते हैं, क्योंकि हम के बारे में हमारी दोहराता साथ ढेर पर एक ही प्रतीक अनुक्रम धकेल दिया , और तब से हम क्या की तुलना में अधिक पॉप नहीं है है की , हम में उसी पथ का अनुसरण कर सकते हैंऔर स्टैक से समान प्रतीक अनुक्रम पॉप कर सकते हैं। इसलिए, से एक स्वीकार पथ $\fp(h)$ $x$ $v$ $w$ $v$ $v$ $v$ $\fp(g)$ $A$ $u v^n x y^n z$ can be constructed from the accepting path for $w$ .

Finally, we also have $|vy| > 1$ , because like in case 1, if $v = \epsilon$ and $y = \epsilon$ , we can build a shorter accepting path for $w$ by removing $\pi_{\lp(g)\cdots\lp(h)}$ and $\pi_{\fp(h)\cdots\fp(g)}$ .

Hence, we have an adequate factorization in both cases, and the result is proved.

(Credit goes to Marc Jeanmougin for helping me with this proof.)

— a3nm
स्रोत

7

Yes it is possible. We could use the notion of surface configurations; they were introduced by Cook a long time back. With this it should be quite easy to get a version of pumping lemma out.

As to surface configurations, almost any paper on LogCFL should carry its definition. Here is a recent paper and here is a thesis

Maybe someone more energetic can spell out the details!

— V Vinay
स्रोत

Thanks for answering! Yes, it is pretty natural to look at the combination of automaton state and topmost stack symbol. I am still thinking about this problem, though, and I can't manage to figure out the details... Help is appreciated. :-)

— a3nm

3

For completeness a reference to a proof in this direction.

A.Ehrenfeucht, H.J.Hoogeboom, G.Rozenberg: Coordinated pair systems. I: Dyck words and classical pumping RAIRO, Inf. Théor. Appl. 20, 405-424 (1986)

Abstract. The notion of a coordinated pair system [...] corresponds very closely to (is another formulation of) the notion of a push-down automaton. In this paper we [...] investigate the possibility of obtaining pumping properties of context-free languages via the analysis of computations in cp systems. In order to do this we analyze the combinatorial structure of Dyck words. The properties of Dyck words we investigate stem from the combinatorial analysis of computations in cp systems. We demonstrate how this correspondence can be used for proving the classical pumping lemma.

— Hendrik Jan
स्रोत

1

When discussing this problem with Géraud Sénizergues, he pointed me this paper by Sakarovitch that already proves this result. The proof seems to date back to this paper by Ogden.

References:

Sakarovitch, Jacques. Sur une propriété d’itération des langages algébriques déterministes. (French. English summary). Math. Systems Theory 14 (1981), no. 3, 247–288.
William F. Ogden. 1969. Intercalation theorems for stack languages. In Proceedings of the first annual ACM symposium on Theory of computing (STOC '69).

— Lamine
स्रोत