क्या चोमस्की-पदानुक्रम पुराना है?


45

चॉम्स्की (-Schützenberger) पदानुक्रम का उपयोग सैद्धांतिक कंप्यूटर विज्ञान की पाठ्यपुस्तकों में किया जाता है, लेकिन यह स्पष्ट रूप से पूर्ण औपचारिकता चिड़ियाघर आरेख की तुलना में केवल औपचारिक भाषाओं (REG, CFL, CSL, RE) के बहुत छोटे अंश को कवर करता है । क्या वर्तमान शोध में पदानुक्रम अब कोई भूमिका निभाता है? मुझे cstheory.stackexchange पर चॉम्स्की के यहाँ केवल कुछ ही संदर्भ मिले, और जटिलता चिड़ियाघर में चॉम्स्की और शूज़ेनबर्गर के नामों का उल्लेख नहीं है।

क्या वर्तमान शोध वर्णन के अन्य साधनों पर अधिक ध्यान केंद्रित करता है लेकिन औपचारिक व्याकरण? मैं विभिन्न अभिव्यक्तियों के साथ औपचारिक भाषाओं का वर्णन करने के लिए व्यावहारिक तरीकों की तलाश कर रहा था, और बढ़ते संदर्भ संवेदनशील भाषा (जीसीएसएल) और दृष्टिहीन पुशडाउन भाषाओं (वीपीएल) पर ठोकर खाई, जो दोनों क्लासिक चॉम्स्की भाषाओं के बीच स्थित हैं। क्या उन्हें शामिल करने के लिए चॉम्स्की पदानुक्रम को अद्यतन नहीं किया जाना चाहिए? या जटिलता वर्गों के पूर्ण सेट से एक विशिष्ट पदानुक्रम का चयन करने का कोई फायदा नहीं है? मैंने केवल उन भाषाओं का चयन करने की कोशिश की जो चॉम्स्की पदानुक्रम के अंतराल में फिट हो सकती हैं, जहां तक ​​मैं समझता हूं:

REG (= चॉम्स्की 3) = VPL ⊊ DCFL (सीएफएल (= चॉम्स्की 2) ⊊ GCSL CS CSL (= चॉम्स्की 1) ⊊ R ky RE

मुझे अभी भी नहीं मिलता है, जहां "सौम्य संदर्भ-संवेदनशील भाषाएं" और "अनुक्रमित भाषाएं" (कहीं न कहीं सीएफएल और सीएसएल के बीच) फिट होती हैं, हालांकि प्राकृतिक भाषा प्रसंस्करण के लिए व्यावहारिक प्रासंगिकता प्रतीत होती है (लेकिन शायद व्यावहारिक प्रासंगिकता में से कुछ भी कम दिलचस्प नहीं है सैद्धांतिक अनुसंधान में ;-)। इसके अलावा आप GCSL ⊂ P ⊂ NP and PSPACE और CSL ⊂ PSPACE ⊂ R का उल्लेख प्रसिद्ध वर्गों P और NP से संबंध दिखाने के लिए कर सकते हैं।

मैंने GCSL और VPL पर पाया:

  • रॉबर्ट McNaughton: चोमस्की पदानुक्रम में एक प्रविष्टि ?. में: ज्वेल्स फॉरएवर हैं, आर्टो सलोमा के सम्मान में सैद्धांतिक कंप्यूटर विज्ञान में योगदान। एस। 204-212, 1999
  • http://en.wikipedia.org/wiki/Nested_word#References (VPL)

मुझे खुशी होगी अगर आप औपचारिक व्याकरणों के बारे में कोई और पाठ्यपुस्तक जानते हैं जो VPL, DCLF, GCSL और अनुक्रमित व्याकरण से संबंधित हो, जो व्यावहारिक अनुप्रयोगों के संकेत के साथ बेहतर हो।


7
एक मामूली बात: मुझे कॉम्प्लेक्सिटी ज़ू में चॉम्स्की और शूज़ज़ेनबर्गर नाम की अनुपस्थिति नहीं दिखती है, यह इस बात के प्रमाण के रूप में है कि "चोम्स्की पदानुक्रम पुराना है।" चॉम्स्की पदानुक्रम औपचारिक भाषा सिद्धांत में एक धारणा है। कॉम्प्लेक्सिटी चिड़ियाघर मुख्य रूप से जटिलता सिद्धांत के बारे में एक वेबसाइट है, हालांकि इसमें औपचारिक भाषा सिद्धांत जैसे संदर्भ-मुक्त भाषाओं में कुछ धारणाएं शामिल हैं। वे संबंधित हैं, लेकिन अलग-अलग क्षेत्र हैं। औपचारिक भाषा सिद्धांत में एक पाठ्यपुस्तक में इसका उल्लेख नहीं किया गया है, तो यह पुराना होगा, लेकिन मुझे नहीं पता कि क्या ऐसा है।
त्सुयोशी इतो

7
अच्छी बात है, त्सुओशी। सच कहूँ तो, मैं अच्छी सैद्धांतिक ग्राउंडिंग (शोध पत्रों के संदर्भ!) लेकिन व्यावहारिक संसाधनों के साथ एक "औपचारिक भाषा चिड़ियाघर" देखना चाहता हूं। उदाहरण के लिए बैकस-नाउर-फॉर्म के दर्जनों सिंटैक्स वेरिएंट हैं, और रेगुलर एक्सप्रेशंस के वेरिएंट (उनमें से कुछ भी नियमित नहीं हैं)। साधारण चॉम्स्की-पदानुक्रम के अलावा मुझे औपचारिक भाषाओं में अनुसंधान की वर्तमान स्थिति की स्पष्ट तस्वीर प्राप्त करना मुश्किल था।
जैकब

आप नियमित भाषाओं के नीचे भी स्टार-फ्री भाषाओं को सख्ती से जोड़ सकते हैं। वे नियमित रूप से पसंद करते हैं, लेकिन क्लेन स्टार के बिना। अच्छी तरह से जाना जाता है। अच्छा व्यवहार किया।
रोमानो रेन

जैसा कि कई उत्तर मुझे दिखाते हैं, औपचारिक व्याकरण आ ला चोम्स्की औपचारिक भाषाओं का वर्णन करने की एक ऐतिहासिक पद्धति है, जो अपनी सीमा तक पहुंच गई है। मैं अभी भी औपचारिक व्याकरण के एक अच्छे साक्षात्कार की तलाश कर रहा हूं, जो कि जटिलता सिद्धांत पर केंद्रित नहीं है, लेकिन आगे के सभी संदर्भों के लिए धन्यवाद! मैं mgalle के उत्तर को स्वीकार करूंगा क्योंकि उसकी अब तक कम से कम प्रतिष्ठा है।
याकूब

2
कंप्यूटर विज्ञान में, कंप्यूटर भाषा डिजाइन, सॉफ्टवेयर डिजाइन और प्रोग्रामिंग, संदर्भ-मुक्त व्याकरण और भाषा और नियमित अभिव्यक्ति और भाषाएं बुनियादी काम करने वाले उपकरण हैं और हमेशा की तरह महत्वपूर्ण हैं। लेकिन दूसरी ओर, मनमाने ढंग से व्याकरण, एलबीए और संदर्भ-संवेदनशील भाषाओं के लिए, मैंने कुछ एप्लिकेशन या कोई भी नहीं देखा है।
रीयरियरपोस्ट

जवाबों:


20

मैंने नैचुरल लैंग्वेज प्रोसेसिंग कम्युनिटी में जो देखा है, उससे औपचारिक व्याकरणों में ला चोम्स्की का इतना अधिक उपयोग नहीं किया जाता है। वे (भी) सोचते हैं कि चोमस्की पदानुक्रम मॉडल भाषा के लिए पुराना है।

इसकी जगह पर लिया गया सामान री-राइटिंग रूल (लार्स अल्गोरिद्म), डिपेंडेंसी मॉडल (डैन क्लेन), ट्री सब्स्टीट्यूशन ग्रामर (डीओपी मॉडल), बाइनरी फीचर ग्रामर (एलेक्स क्लार्क) जैसे सामान हैं।


मेरे उत्तर को फिर से पढ़ना, यह मुझे जितना ध्वनि चाहिए था उससे अधिक नकारात्मक लगता है। आरएल और सीएफएल को कभी भी प्राकृतिक भाषा के वास्तविक मॉडल नहीं माना जाता था, और अधिकांश "नए" मॉडल वास्तव में उनमें प्रेरित होते हैं।
16

मैंने सोचा था कि आरएल को प्राकृतिक भाषाओं के मॉडल के रूप में भी नहीं बनाया गया था, लेकिन कुछ सिस्टम व्यवहार के मॉडल के रूप में। [क्लेन का मूल पाठ औपचारिक भाषा शब्दावली का उपयोग नहीं करता है।]
DG_

26

संक्षेप में: हाँ।

अधिक विशेष रूप से: चॉम्स्की पहले एक पदानुक्रम से संबंधित भाषाओं, व्याकरण और ऑटोमेटा को औपचारिक रूप देने के लिए था। यह अंतर्दृष्टि अभी भी बहुत प्रासंगिक है और ऑटोमेटा सिद्धांत पर सभी इंट्रो पाठ्यक्रमों में पढ़ाया जाता है। हालाँकि, विशिष्ट पदानुक्रम चॉम्स्की के साथ आया था और पदानुक्रम के तत्वों के नाम अब वास्तव में महत्वपूर्ण नहीं हैं। हमने चोम्स्की के पदानुक्रम के स्तर, उसके ऊपर या उसके नीचे गिरने के बाद से कई औपचारिकताओं का आविष्कार किया है। और चॉम्स्की नाम का उपयोग विशेष रूप से दिलचस्प नहीं है, अर्थात वे जटिलता या किसी भी चीज़ के एक दिलचस्प उपाय पर आधारित नहीं हैं, वे सिर्फ नंबर हैं। क्या संवेदनशील संदर्भों में संवेदनशील भाषाओं को टाइप -1.5 या टाइप -1.1 या टाइप -1.5 होना चाहिए? किसे पड़ी है। "सौम्य संदर्भ संवेदनशील" बहुत अधिक जानकारीपूर्ण नाम है।

कॉम्प्लेक्सिटी ज़ू थोड़ा अलग है क्योंकि यह सभी प्रकार के सशर्त समकक्षों और इस तरह से भरा हुआ है। ऑटोमेटा सिद्धांत के लिए एक अधिक आधुनिक पदानुक्रम रैखिक नहीं होगा (जैसे, सीएफजी बनाम पीईजी की तुलना करें) लेकिन यह अभी भी एक प्रसिद्ध टोपोलॉजी होगा। आधुनिक ऑटोमेटा सिद्धांत पर एक परिप्रेक्ष्य प्राप्त करने के लिए आपको पार्सर कॉम्बीनेटर पुस्तकालयों और एकीकरण और प्रकार सिद्धांत पर कुछ सामान पर काम करना चाहिए (हालांकि उन दोनों शाखाएं बहुत दूर हैं)।


4
हमें बेहतर नाम मिले, हां। इसका मतलब यह नहीं है कि परिणाम पुराने हैं।
राफेल

4
@ राफेल: नामों की वजह से पुरानापन नहीं है, प्रति से, यह इसलिए है क्योंकि चॉम्स्की द्वारा शुरू की गई विशिष्ट पदानुक्रम का कोई और उपयोग नहीं किया जाता है। चॉम्स्की पदानुक्रम द्वारा वर्णित निष्कर्ष (ए) अभी भी सही हैं, और (बी) किसी भी आधुनिक पदानुक्रम में समावेशन के बीच; लेकिन चॉम्स्की पदानुक्रम इस तरह से बहुत प्रासंगिक नहीं है, सिवाय इसके कि यह कुछ प्रसिद्ध बिंदुओं को हिट करने के लिए होता है। लोग चॉम्स्की पदानुक्रम पर शोध नहीं करते हैं, वे कहीं और शोध करते हैं। यह बहुपद टॉवर की तरह नहीं है जिसके कारण इसके नाम / संरचनाएं हैं।
wren romano 8

26

यदि TCS में कुछ भी पुराना है, तो यह 1956 में ज्ञात / दिलचस्प मानी जाने वाली जटिलता वर्गों के छोटे उपसमुच्चय का समावेश है।

शांति में आराम करें, चॉम्स्की हायरार्की, और आप अंडरग्राउंड थ्योरी पाठ्यक्रम को नहीं छोड़ सकते।


12
जैसा कि ज्यूरिस हार्टमैनिस ने एक बार चिल्लाया था: "चॉम्स्की वर्गों के बारे में क्या? चॉम्स्की वर्ग एक घृणा है!"
रयान विलियम्स

1
रयान: मुझे भी याद है कि ज्यूरिस ने CH को "घृणा" कहा था! जैसा कि मैंने अपना उत्तर लिखा था, मैं बहस कर रहा था कि क्या वह अपनी टिप्पणी को सार्वजनिक करना चाहेगा। लेकिन आप उसे मुझसे बेहतर जानते हैं ...:
स्कॉट आरोनसन

यह टिप्पणी कुछ सैद्धांतिक कंप्यूटर विज्ञान और गणितज्ञों की भाषाविज्ञान और अन्य "कमजोर" विज्ञानों के pejorative दृष्टिकोण से कम से कम एक छोटे से प्रेरित हो सकती है: xkcd.com/435 । लेकिन यकीन है कि चॉम्स्की पदानुक्रम आज आधुनिक जटिलता सिद्धांत के दृष्टिकोण को अस्पष्ट करता है, इसलिए यह मेरे प्रश्न का उत्तर देता है। फिर भी अंडरग्राउंड थ्योरी पाठ्यक्रम में शुरू करने के लिए कुछ अद्यतन प्रतिस्थापन करना अच्छा होगा, खासकर यदि आप व्यावहारिक अनुप्रयोगों के लिए औपचारिक भाषाओं और व्याकरण में अधिक रुचि रखते हैं।
जैकब

1
चॉम्स्की पदानुक्रम विवरण की जटिलता द्वारा आदेशित भाषाओं की कक्षाओं को सूचीबद्ध करता है, संगणना की जटिलता नहीं है जो आमतौर पर निहित होती है जब आप "जटिलता सिद्धांत" शब्द का उपयोग करते हैं। वे संबंधित हैं, जाहिर है। वैसे भी, मैं अभी भी यह देखने में नाकाम हूं कि कैसे एक (खुरदरा) पनाह अधिक परिष्कृत कक्षाओं को अस्पष्ट कर सकता है जो कि चॉम्स्की पदानुक्रम से आने के बिना शायद ही समझा जा सकता है। वे प्रवेश द्वार हैं!
राफेल

20

यदि आप चोमस्की की पदानुक्रम को "आधुनिक" नामों (यानी REG, LIN, CFL, CSL, RE resp। DFA / NFA, PDA, LBA, TM) के साथ मानते हैं, तो मैं कहता हूं: नहीं, यह पुराना नहीं है!

कारण 0 : यह अभी भी इस अर्थ में सही है कि इसकी परिभाषाएं और परिणाम नए ज्ञान के विरोधाभासी नहीं हैं।

कारण 1 : ये कक्षाएं / संगणना मॉडल अभी भी आपके द्वारा सिखाए गए पहले हैं - क्योंकि वे सरल और अच्छी तरह से अध्ययन किए गए हैं। पहले डीएफए / डीपीडीए को कवर किए बिना एक अंडरग्रेड में एलआर ऑटोमेटन को पढ़ाने की कोशिश करें।

कारण 2 : कक्षाएं अभी भी नए आविष्कारों के लिए पहली / प्रमुख बेंचमार्क हैं (मैंने मल्टी-सीएफजी के बारे में एक पेपर स्किम किया, जो निश्चित रूप से कहा गया: सीएफजी से अधिक, सीएसजी से कम)। यही कारण है कि आंशिक रूप से किया जा सकता है क्योंकि वे पहली सिखाया जाता है, बल्कि इसलिए भी कि वे कर रहे हैं सरल और अच्छी तरह से अध्ययन किया।

विरोधी कारण 3 : परिणाम सिर्फ इसलिए नहीं निकलते क्योंकि नई कक्षाएं / मॉडल मिल गए हैं। वे सक्रिय मूल्य सीमा पर सक्रिय रूप से उपयोग नहीं किए जाने के बावजूद क्षेत्र के मूल के रूप में अपना मूल्य रखते हैं।


10
"गणित पुराना नहीं होता है , यह क्लासिक हो जाता है ।" (मुझे नहीं पता कि यह उद्धरण किसके लिए जिम्मेदार है, दुर्भाग्य से।)
हेनरिक एपफेल्मस

क्या आपका मतलब "DPDA" के बजाय "NPDA" नहीं है? कुछ संदर्भ-मुक्त भाषाएं केवल nondeterministic पुश-डाउन ऑटोमेटा द्वारा मान्यता प्राप्त हैं।
Zsbán Ambrus

@ ZsbánAmbrus काफी सही; मुझे सिर्फ "पीडीए" लिखना चाहिए था। धन्यवाद!
राफेल

आखिरी कारण बिल्कुल भी आश्वस्त नहीं है (मुझे लगता है कि यह एक विरोधी कारण है?)। बहुत सारे परिणाम पुराने हो जाते हैं क्योंकि वे सब्जेक्ट के अलग-अलग दृष्टिकोण से कम या कभी-कभी मामूली भी हो जाते हैं। मैं यहाँ यह मामला नहीं कह रहा हूँ, बस यही कारण बताया गया है कि बहुत कुछ नहीं कहा गया है। इसके अलावा, एक व्याकरणिक निपिक: "बहिष्कृत" एक क्रिया नहीं है।
साशो निकोलेव

11

मुझे लगता है कि यह गणना के मॉडल पर निर्भर करता है। यदि आप परिमित / पुशडाउन / आदि पर विचार करते हैं। कम्प्यूटेशन के एक मॉडल के रूप में ऑटोमेटा, फिर चॉम्स्की पदानुक्रम महत्वपूर्ण हो जाता है (उदाहरण के लिए Sipser की पुस्तक देखें)। दूसरी ओर, यह कम्प्यूटिंग के ट्यूरिंग मॉडल में बहुत कम भूमिका निभाता है।

निम्नलिखित दृष्टांत सहायक हो सकते हैं:

संपादित करें: औपचारिक भाषाएं कंप्यूटर भाषाओं (जैसे जावा) और संकलक, साथ ही साथ प्राकृतिक-भाषा प्रसंस्करण (एनएलपी) को डिजाइन करने में महत्वपूर्ण भूमिका निभाती हैं।


क्षमा करें, मैं आपकी टिप्पणी को नहीं समझ सकता। ओपी ने पूछा कि क्या चोमस्की पदानुक्रम पुराना है। उनका तर्क यह था कि उन्होंने इसे जटिलता चिड़ियाघर आदि में नहीं देखा था, मैंने उत्तर दिया कि अगर वह ऑटोमेटा को कंप्यूटिंग के मॉडल के रूप में मानते हैं, तो चॉम्स्की पदानुक्रम प्रासंगिक हो जाता है। इसके अलावा, मैंने उल्लेख किया कि इस पदानुक्रम की कक्षाएं संकलक डिजाइन और एनएलपी एल्गोरिदम के लिए महत्वपूर्ण हैं। IMHO, यह पूरी तरह से सवाल से संबंधित है।
एमएस डौस्ती

2
यकीन है कि चॉम्स्की पदानुक्रम वास्तव में पुराना नहीं है, यह सैद्धांतिक कंप्यूटर विज्ञान, औपचारिक भाषाओं, संकलक डिजाइन आदि के अधिकांश परिचय में पाया जाता है, लेकिन इसके अलावा, यह बताने के लिए कुछ भी नया नहीं लगता है। मुझे लगता है कि आरईजीएल और सीएफएल के बीच और सीएफएल के बीच की भाषाएं भी महत्वपूर्ण हो सकती हैं। क्या इन भाषाओं के साथ पदानुक्रम का विस्तार करना केवल एक बुरा विचार है क्योंकि चॉम्स्की पदानुक्रम में "आउटडेटेड" की गंध है क्योंकि वर्तमान शोध के लिए महत्वपूर्ण नहीं है?
जैकब

मुझे नहीं लगता कि यह एक बुरा विचार है, हालांकि किसी को कुछ एप्लिकेशन ढूंढना होगा जिसके लिए नया एक्सटेंशन फिट हो।
एमएस डौस्ती
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.