किसी अनुच्छेद में दिनांक से संबंधित घटनाओं की पहचान करना


13

वहाँ एक है एल्गोरिथम पैराग्राफ में विशेष घटनाओं (वाक्यांश) के लिए एक पैराग्राफ़ सहसंबंधी में दी गई है कि दिनांक पहचान करने के लिए दृष्टिकोण?

उदाहरण, निम्नलिखित पैराग्राफ पर विचार करें:

जून 1970 में, महान नेता ने शपथ ली। लेकिन मई 1972 के बाद से, राज्य मंत्री की मृत्यु के बाद ही उन्होंने देश की बागडोर संभाली। जबकि उन्हें 1980 के मध्य तक लोकप्रिय समर्थन प्राप्त था, उसके बाद उनका प्रभाव कम होने लगा।

क्या कोई एल्गोरिथ्म (निर्धारक या स्टोकेस्टिक) # है जो 2-ट्यूपल (दिनांक, घटना) उत्पन्न कर सकता है, जहां घटना को निहित किया गया है, जिस तिथि को पैराग्राफ किया गया है ? उपरोक्त मामले में:

  • (जून 1970, महान नेता ने ली शपथ)
  • (मई 1972, बागडोर संभाली)

    या अभी तक बेहतर है

  • (मई 1972, महान नेता ने बागडोर संभाली)
  • (1980, प्रभाव में)

# इसके अलावा


2
इस समस्या में तीन चरण होते हैं: 1) निकालने की तारीखें, 2) निकालने की घटनाएं और 3) दोनों डेटा सेट को सहसंबंधित करें। 1) निश्चित रूप से उल्लेखनीय है और मैं 3 के लिए सभ्य अनुमान लगा सकता हूं), लेकिन आप 2 को हल करने की उम्मीद कैसे करते हैं)?
राफेल

1
@ राफेल मेरे सवाल का अच्छा रीफ़्रेशिंग!
चेक

ठीक है, ऐसा आप) 2 के बारे में कुछ जानकारी, दिलचस्प घटनाओं (यानी शब्द) के उदाहरण के एक सीमित सेट है? क्या आप सभी संज्ञा / क्रिया जोड़े को तब तक निकालना चाहते हैं, जब तक उनके पास तारीख है?
राफेल

क्या आप समय सीमा निकालना चाहते हैं? अपने उदाहरण में, विचार करें (<= May 1972, death of the Minister of State)या (<= Mid-1980, [the great leader] enjoyed popular support)
राफेल

@Raphael (बहुत) देर से उत्तर के लिए क्षमा करें। के बारे में 2) नहीं। मैं एक सामान्यीकृत दृष्टिकोण के लिए कोशिश कर रहा हूं।
चेक १२

जवाबों:


4

सामान्य तौर पर, पाठ में तारीखों और अन्य लौकिक मार्करों की पहचान करने की समस्या को लौकिक संदर्भ निकालने की समस्या कहा जाता है । लिंक की गई खोज आपको इससे संबंधित कागजात पर ले जाएगी।


पता नहीं था कि समस्या का नाम था। उस पर और गौर करेंगे और देखेंगे कि क्या मुझे कुछ सार्थक मिल सकता है। :)
चेक १२

2

चूंकि आप एक एल्गोरिथम दृष्टिकोण के लिए पूछते हैं, मैं एक एल्गोरिथ्म के रूप में जिद्दी हो जाऊंगा। मुझे इस तरह के प्रश्न का इलाज करने के लिए खेद है, लेकिन चूंकि यह एक जटिल सैद्धांतिक समस्या की तरह प्रतीत नहीं होता है, मैं संभावित दृष्टिकोणों को संश्लेषित करूंगा।

प्रश्न: क्या आप मुझे किसी तिथि और विशेष घटना की एक एल्गोरिथम परिभाषा दे सकते हैं?

यदि आप कर सकते हैं: चूंकि आपकी परिभाषा एल्गोरिदम है, तो यह संभवतः किसी प्रकार का औपचारिक व्याकरण है , और आपकी समस्या उस व्याकरण को ट्यून करने की होगी, जिस पर आपको विचार करने की आवश्यकता है। (मुझे दिलचस्पी है अगर आप मुझे एक सटीक परिभाषा दे सकते हैं जो औपचारिक व्याकरण नहीं है)

यदि आप नहीं कर सकते हैं: तो कम से कम आप उदाहरणों के साथ आ सकते हैं। तो ठीक है। सबसे अच्छा - और केवल मैं सोच सकता हूं - दृष्टिकोण मशीन लर्निंग एल्गोरिदम है, जिसे आपको अपनी तिथियों और फिर इन घटनाओं को पहचानने के लिए प्रशिक्षित करना होगा। (हाथ से एनोटेट किए गए वाक्यों के एक कोष का उपयोग करना) हालांकि यह कुछ बड़े हाथ से बनाए गए rexxp की तुलना में काफी अधिक है जो शायद काम करेंगे। यदि आप वास्तव में, वास्तव में ऐसा करना चाहते हैं, तो मुझे लगता है कि सबसे अधिक कुशल इस प्रकार का रीजेक्सप होगा जो कि लर्निंग एल्गोरिदम के लिए एक पैरामीटर के रूप में दिया गया है, लेकिन आप मशीन लर्निंग विशेषज्ञों से बेहतर पूछते हैं।

इसके साथ सौभाग्य, यह बहुत आसान है इसके बारे में बात करना (दोनों मामलों में)।


1
मैंने कहा, मुझे लगता है कि तारीखों और घटनाओं के संयोजन से निश्चित रूप से कुछ स्टोकेस्टिक मॉडल की आवश्यकता होगी ।
राफेल

अधिकांश प्रारूपों में मैं regexp का उपयोग करके कब्जा कर सकता हूं। कुछ प्रोग्रामिंग लॉजिक के साथ, मैं तारीखों के आसपास के वाक्यों को निकाल सकता हूँ। तब समस्या यह है कि मुझे एक मॉडल या संभावना वितरण की आवश्यकता है कि जब एक विशेष वाक्य पैटर्न, Ex .: बिल्ली 25 अगस्त को चूहे को खा गई। [<लेख> <संज्ञा> <क्रिया> <लेख> <संज्ञा> <ढ्डह्म> <दिनांक>], तब पैटर्न का एक (उप) सेट प्रकट होता है, बिल्ली चूहे को खा जाती है (हमारे मामले में), तिथि से संबंधित है y (25 अगस्त) संभावना के साथ z।
check123

अगर आप बुरा नहीं मानते तो क्या आप अपनी पोस्ट के प्रारूपण को समायोजित कर सकते हैं? गैर-उद्धरण के लिए उद्धरण शैली (या एक आत्म उद्धरण?) का उपयोग करना बल्कि भ्रमित करना है।
औली
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.