क्या व्याकरण के नियमों के एक सेट का उपयोग करके कभी भी अंग्रेजी भाषा को सामान्यीकृत किया जा सकता है?


10

प्रोग्रामिंग भाषाओं में, व्याकरण के नियमों का एक समूह होता है जो मान्य बयानों और अभिव्यक्तियों के निर्माण को नियंत्रित करता है। ये नियम उपयोगकर्ता द्वारा लिखे गए कार्यक्रमों को पार्स करने में मदद करते हैं।

क्या कभी व्याकरण के नियमों का एक कार्यात्मक रूप से पूरा सेट हो सकता है जो अंग्रेजी में किसी भी कथन (स्थान-विशिष्ट) को सही ढंग से पार्स कर सकता है और जिसे संभवतः एआई-आधारित परियोजनाओं में उपयोग के लिए लागू किया जा सकता है।

मुझे पता है कि बहुत सारे एनएलपी टूलकिट ऑनलाइन उपलब्ध हैं, लेकिन वे इतने प्रभावी नहीं हैं। उनमें से अधिकांश को विशिष्ट कॉर्पस का उपयोग करके प्रशिक्षित किया जाता है जो कभी-कभी किसी अभिव्यक्ति के विभिन्न हिस्सों के बीच कुछ जटिल सहसंबंधों का अनुमान लगाने में विफल होते हैं।

दूसरे शब्दों में, मैं जो पूछ रहा हूं वह यह है कि क्या कंप्यूटर के लिए अंग्रेजी में लिखी गई एक अच्छी तरह से वाक्पटु वाक्य को पार्स करना संभव है जैसे कि यह एक वयस्क अंग्रेजी बोलने वाले मानव द्वारा पार्स किया गया था?

संपादित करें: यदि इसे सरल व्याकरण नियमों का उपयोग करके नहीं दिखाया जा सकता है, तो इसे सामान्य बनाने के लिए किस तरह की शब्दार्थ संरचना का उपयोग किया जा सकता है?

EDIT2: यह पत्र प्राकृतिक भाषाओं में संदर्भ-निर्भयता की अनुपस्थिति साबित करता है। मैं एक समाधान की तलाश कर रहा हूं, भले ही यह बहुत जटिल हो।


2
मेरे पास इसे वापस करने के लिए संदर्भ नहीं हैं, लेकिन मुझे लगता है कि यह गणितीय रूप से सिद्ध हो चुका है कि आप ऐसा नहीं कर सकते- अंग्रेजी को पूरी तरह से समझने के लिए संदर्भ के संकेतों की आवश्यकता होती है जो उच्च-स्तरीय अर्थ-तर्क की मांग करते हैं जो इसमें निहित नहीं हो सकते। व्याकरण के नियम।
एंटीलेरॉफ्ट

विकिपीडिया के अनुसार प्राकृतिक भाषाओं के अधिकांश भाग संदर्भ मुक्त हैं: en.wikipedia.org/wiki/…
inf3rno

जवाबों:


8

क्या कभी भी व्याकरण के नियमों का एक कार्यात्मक रूप से पूरा सेट हो सकता है जो अंग्रेजी में किसी भी कथन (स्थान-विशिष्ट) को सटीक रूप से पार्स कर सकता है और जिसे संभवतः एआई-आधारित परियोजनाओं में उपयोग के लिए लागू किया जा सकता है।

इसे हाँ, सटीक रूप से सबसे अधिक संभावना नहीं।

क्यों ?

हम ध्वनियों से अर्थ कैसे प्राप्त करते हैं, इस पर मेरी समझ के अनुसार, 2 पूरक रणनीतियाँ हैं:

व्याकरण के नियम: संचार की सुविधा के लिए शब्दों को क्रमबद्ध करने के लिए एक नियम आधारित प्रणाली, यहाँ अर्थ असत्य ध्वनियों की बातचीत और उनके स्वतंत्र अर्थ से लिया गया है, इसलिए आप एक नियम पुस्तिका के आधार पर एक वाक्य को पार्स कर सकते हैं।

ईजी "यह एक जीत थी" : पार्सर एक सर्वनाम ( यह ) संबंधित अर्थ (एक विशिष्ट व्यक्ति या चीज) के साथ निकालेगा; एक क्रिया ( था ) इसी अर्थ (हुई) के साथ; ( ) और यहाँ हम कुछ पार्सिंग समस्याओं के साथ शुरू करते हैं, जो पार्सर निकालता है, एक संज्ञा या अनिश्चित लेख? इसलिए हम व्याकरण की नियम पुस्तिका से परामर्श करते हैं, और अर्थ के लिए समझौता करते हैं (अनिश्चित लेख किसी एक के लिए), आपको अगले शब्द को पार्स करना होगा और हालांकि इसका उल्लेख करना होगा, लेकिन आइए अब इसके लिए चमकते हैं, और अंत में ( जीत ) एक संज्ञा (यह एक क्रिया भी हो सकती है, लेकिन व्याकरण नियम की पुस्तक के लिए धन्यवाद, जिसका अर्थ हमने संज्ञा के साथ किया है: (विजय, विजय), इसलिए अंत में हमारे पास (अर्थ जुड़ते हुए) है:

एक खास बात जीत की हुई। पर्याप्त बंद करें और मैं कुछ अन्य नियमों पर चमक रहा हूं, लेकिन यह बात नहीं है, अन्य रणनीति है:

एक शब्दकोष शब्दकोश (या शब्दकोष) जहाँ शब्द या ध्वनियाँ विशिष्ट अर्थ से जुड़ी होती हैं। यहाँ अर्थ एक इकाई के रूप में एक या अधिक शब्दों या ध्वनियों से लिया गया है। यह एक तोते के लिए समस्या का परिचय देता है, अच्छी तरह से, यह कुछ भी पार्स नहीं करना चाहिए।

ईजी "नॉन प्लस अल्ट्रा" और इसलिए एआई पार्सर पहचानता है कि इस वाक्यांश को पार्स नहीं किया जाना चाहिए और इसके बजाय अर्थ के साथ मिलान किया जाना चाहिए:

उच्चतम बिंदु या परिणति

लेक्सिकल इकाइयाँ एक और मुद्दा पेश करती हैं जिसमें वे स्वयं पहले उदाहरण का हिस्सा हो सकते हैं, और इसलिए आप पुनरावृत्ति के साथ समाप्त होते हैं।

अगर कंप्यूटर पर अंग्रेजी में लिखे गए किसी वाक्य का अच्छी तरह से उच्चारण करना संभव है, जैसे कि यह एक वयस्क अंग्रेजी बोलने वाले मानव द्वारा पार्स किया गया है?

मेरा मानना ​​है कि यह संभव हो सकता है, ज्यादातर उदाहरण मैंने व्याकरण नियम पुस्तिका या लेक्सिकॉन भाग के साथ प्रभावी रूप से व्यवहार किए हैं, लेकिन मुझे दोनों के संयोजन के बारे में पता नहीं है, लेकिन प्रोग्रामिंग के संदर्भ में, यह हो सकता है।

दुर्भाग्य से, भले ही आप इस समस्या को हल करते हों, आपका एआई वास्तव में चीजों को कड़े अर्थों में नहीं समझेगा, बल्कि आपको बहुत विस्तृत पर्यायवाची शब्दों के साथ प्रस्तुत करता है, इसके अतिरिक्त संदर्भ (जैसा कि टिप्पणियों में उल्लेख किया गया है) व्याकरण और लेक्सिकॉन रणनीतियों में भूमिका निभाता है।

यदि इसे सरल व्याकरण के नियमों का उपयोग करके नहीं दिखाया जा सकता है, तो इसे सामान्य बनाने के लिए किस प्रकार की शब्दार्थ संरचना का उपयोग किया जा सकता है?

एक मिश्रित एक जहां व्याकरण के नियम और एक लेक्सिकॉन दोनों हैं और दोनों एआई विशिष्ट संदर्भ और अनुभव के आधार पर बदल सकते हैं और प्रभावित हो सकते हैं और साथ ही इन वस्तुओं से निपटने के लिए एक प्रणाली एक तरह से हो सकती है।


अंग्रेजी का मेरा दायरा औपचारिक उपयोग तक ही सीमित है। यदि एक बार हम रूपकों या मुहावरों की तरह बहुत जटिल संस्थाओं को छोड़ देते हैं, तो क्या एक संदर्भ-संवेदनशील व्याकरण को परिभाषित करना उद्देश्य को प्राप्त करेगा?
skrtbhtngr

@skrtbhtngr: सिद्धांत रूप में अच्छी तरह से हाँ, यह एक सबसेट होगा क्योंकि औपचारिक भाषा है, संदर्भ अभी भी कठिन समस्या होगी।
केनो

साइड केस: "यह एक ट्रायम्फ था" जो विभिन्न कारणों (पहले बाइक, जली हुई बाइक) के लिए एक मोटर बाइक के बारे में बात कर रहा था, हो सकता है कि हम तर्क दे सकते हैं कि यह एक संज्ञा से ब्रांड को अलग करने के लिए एक अपरकेस लेता है।
तेनसीबाई

मैं मानता हूं कि पाठ का अर्थ समझना कठिन हिस्सा है। बस एक साधारण वाक्य: "पीटर सिनेमा गया।" इसमें बहुत सी छिपी हुई जानकारी है: पीटर पुरुष है, वह संभवतः अपनी प्रेमिका के साथ फिल्म देखने गया था, उसका स्थान बदल गया, आदि ... उदाहरण के लिए एक मॉडल का निर्माण करना पाठ पर आधारित एक ग्राफ पर्याप्त नहीं है, क्योंकि यह कुछ स्थिर नहीं है, यह कई समयसीमा, घटनाओं और संदर्भों का वर्णन कर सकता है, साथ ही प्रत्येक वाक्य में छिपी हुई जानकारी है जिसे आप अनुमान लगा सकते हैं और पिछले या बाद के वाक्यों को समझने के लिए उपयोग कर सकते हैं।
inf3rno

2

मुझे पूरा यकीन है कि इसका उत्तर "नहीं" है, जो सबसे कठिन अर्थ है, क्योंकि अंग्रेजी में केवल औपचारिक परिभाषा नहीं है। यही है, कोई भी अंग्रेजी को नियंत्रित नहीं करता है और एक औपचारिक व्याकरण प्रकाशित करता है जिसे हर किसी को पालन करना आवश्यक है। अंग्रेजी को एक अनुभवात्मक प्रक्रिया के माध्यम से बनाया गया है और इसमें विरोधाभास और दोष हैं, लेकिन मानव मन की संभाव्य प्रकृति हमें उन लोगों के आसपास काम करने की अनुमति देती है।

उदाहरण के लिए, यह "वाक्य":

यह वाक्य कोई क्रिया नहीं है

तकनीकी तौर पर यह एक वाक्य नहीं है, क्योंकि इसमें कोई क्रिया नहीं है। लेकिन क्या किसी को यह समझने में कोई दिक्कत हुई कि इसका क्या मतलब है? संदिग्ध। यद्यपि उसके लिए एक औपचारिक नियम के साथ आने का प्रयास करें। और यह सिर्फ एक उदाहरण है।

अब, क्या आप एक औपचारिक व्याकरण के साथ आ सकते हैं जो 90% मामलों को कवर करता है, और अधिकांश व्यावहारिक उपयोगों के लिए "काफी अच्छा" है? संभवतः, शायद यह भी। लेकिन मुझे पूरा यकीन है कि यह 100% तक पहुंचना संभव नहीं है।


1
आपका उदाहरण व्याकरणिक नहीं है, इसलिए व्याकरण में इसका वर्णन करने के लिए एक औपचारिक नियम क्यों होना चाहिए?
ब्लाइंडकुंगफूमास्टर

1
बिलकुल मेरी बात। यह स्पष्ट रूप से अंग्रेजी है और यह स्पष्ट रूप से समझने योग्य है, लेकिन अगर अंग्रेजी व्याकरण की आमतौर पर इस्तेमाल की जाने वाली परिभाषा को पूरा करने में विफल रहता है। इसलिए यह एक उदाहरण है कि कैसे वास्तविक दुनिया बोली जाने वाली अंग्रेजी कठोर व्याकरण की सीमा के बाहर काम करती है।
माइंडक्राइम

2

हमने निष्कर्ष निकाला है कि यह एक दो-मुखी, परिपत्र समस्या है: संरचना को संदर्भ के बिना अनुमान नहीं लगाया जा सकता है, लेकिन संरचना को जानने से संदर्भ को समझने में भी मदद मिलती है। तो, यहां आपका जटिल समाधान है: संदर्भ से शुरू करें, जो वाक्य में शब्दों के संयोजन (संयोजन और खोज की समस्या) से निर्धारित होता है, वहां से आपकी संरचना, या "पार्स" निर्धारित करते हैं (इस कदम पर आप कुछ भी फ़िल्टर कर सकते हैं) तुच्छ शब्द या कम से कम उन्हें कम वजन प्रदान करें), संदर्भ पर वापस जाएं, पार्सिंग पर वापस जाएं, और जब तक आप अर्थ पर न पहुंचें। इस प्रकार पुनरावृत्ति द्वारा, पुनरावर्ती कमी से पूरी समस्या हल हो सकती है।


2

मैं सभी पूर्व टिप्पणियों से बहुत असहमत हूं। इसलिए नहीं कि वे गलत हैं, लेकिन वे नहीं हैं - लेकिन क्योंकि वे भ्रामक हैं - हालांकि अनजाने में।

उदाहरण के लिए: यदि कोई अकादमिक स्थिति से इन समस्याओं को देखता है, तो समस्याएं हमेशा ही असंभव लगेंगी। ऐसा इसलिए है क्योंकि हर चीज का ठंडे तरीके से मूल्यांकन किया जाता है और हर चीज में अलगाव की गणना की जाती है।

उत्तर मुख्य रूप से शब्द संघ में निहित है । आपको एक प्रोग्राम लिखना होगा जो डिजिटल पुस्तकों के एक विशाल डेटाबेस को संसाधित कर सकता है, हर शब्द और उस भाषा के सभी शब्दों को पंजीकृत करने के लिए जो इसके साथ जुड़े हुए हैं। साथ ही प्रत्येक संबद्ध शब्द और उससे जुड़े विराम चिह्न के साथ सभी सांख्यिकीय जानकारी।

यह तब आपको आधार देगा, जिस पर AI कई चीजें तय कर सकता है:

  1. क्या किसी दिए गए वाक्य की संरचना सही है।
  2. यदि संरचना खराब है, तो जो कहा जा रहा है उसके संदर्भ और इरादे का निर्धारण करने के लिए क्या संभावना है।
  3. एक बहुविध शब्द (ट्रायम्फ) का सही अर्थ और अनुप्रयोग, संभाव्यता के अनुसार है - आँकड़ों के अनुसार।
  4. यह निर्धारित करने के लिए कि बातचीत कहाँ होने की संभावना है।
  5. सही व्याकरण, और विराम चिह्न क्या होना चाहिए।

इसलिए, निष्कर्ष में, आपके पास देखने के लिए दो चीजें हैं: एसोसिएशन और संभावना।

जब किसी भाषा के मॉडल को डिजिटल रूप से डीटैबासिंग किया जाता है, तो शब्द और वाक्य "स्ट्रिंग्स" की संभावना होती है, ताकि किसी दिए गए वाक्य में भाषा संरचना की हर भिन्नता को पाठ नमूना के पहले, दौरान और बाद में निर्धारित किया जा सके। भाषा मॉडल पैटर्न पर इस अंतरंग नियंत्रण का अर्थ है कि "विषय" और "वस्तु" जैसे संवेदनशील घटकों को कोड द्वारा आसानी से निर्धारित किया जा सकता है।


मुझे लगता है कि यह अत्यधिक आशावादी है। इसके लिए भाषा बहुत गन्दा है।
ओलिवर मेसन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.