मैं एक अधिकतम एन्ट्रॉपी मार्कोव मॉडल (एमईएमएम) की अवधारणा से प्रेरित हूं, और मैं इसे पार्ट ऑफ स्पीच (पीओएस) टैगर के लिए उपयोग करने के बारे में सोच रहा हूं। फिलहाल, मैं प्रत्येक व्यक्ति को टैग करने के लिए एक पारंपरिक अधिकतम एन्ट्रॉपी (ME) क्लासिफायरियर का उपयोग कर रहा हूं। यह पूर्ववर्ती दो टैग सहित कई विशेषताओं का उपयोग करता है।
MEMMs मार्कोव चैन के माध्यम से इष्टतम पथ खोजने के लिए Viterbi एल्गोरिथ्म का उपयोग करते हैं (यानी प्रत्येक शब्द के लिए व्यक्तिगत ऑप्टिमस के बजाय वाक्य के लिए टैग का एक पूर्ण इष्टतम सेट खोजने के लिए)। इसके बारे में पढ़ना, यह एक अद्भुत लालित्य और सरलता प्रतीत होता है। हालांकि, प्रत्येक चरण केवल पिछले चरण के "परिणाम" (यानी एक मार्कोव श्रृंखला के अनुसार) पर निर्भर करता है।
हालाँकि, मेरा ME मॉडल पिछले दो चरणों का उपयोग करता है (यानी पूर्ववर्ती दो शब्दों के लिए टैग)। ऐसा लगता है कि मेरे पास दो संभावित दृष्टिकोण हैं:
एक पारंपरिक विटर्बी कार्यान्वयन के साथ, एक (पिछले) चरण के अनुसार संग्रहीत रास्तों का एक सेट का उपयोग करें। मेरा एमई क्लासिफायर यह और ट्रांसफर फ़ंक्शन का उत्पादन करने के लिए इससे पहले एक 'फ्रोजन' चरण का उपयोग करेगा (विचार के तहत पथ में जमे हुए)।
या मैं दो चरणों का ट्रैक रखने के लिए एल्गोरिथ्म लिखता हूं। यह अधिक जटिल है और अब एक सही मार्कोव मॉडल नहीं होगा क्योंकि प्रत्येक हस्तांतरण फ़ंक्शन (यानी एमई मॉडल से) पूर्ववर्ती दो चरणों पर निर्भर करेगा और एक चरण नहीं।
यह मुझे बताता है कि दूसरा अधिक सटीक होगा, हालांकि यह अधिक जटिल होगा।
मुझे अपने साहित्य खोज के दौरान इसका कोई उदाहरण नहीं मिला है। क्या इसे आजमाया गया है? क्या दो चरणों के दृष्टिकोण ने समग्र सटीकता में सुधार किया है?