NER के लिए Vowpal Wabbit का उपयोग करना


9

Vowpal Wabbit (VW) स्पष्ट रूप से SEARN के माध्यम से अनुक्रम टैगिंग कार्यक्षमता का समर्थन करता है । समस्या यह है कि मैं स्पष्टीकरण के साथ और कुछ उदाहरणों के साथ कहीं भी विस्तृत पैरामीटर सूची नहीं पा सकता हूं। सबसे अच्छा मुझे मिल सकता है Zinkov के ब्लॉग प्रविष्टि एक बहुत ही कम उदाहरण के साथ। मुख्य विकि पृष्ठ मुश्किल से SEARN का उल्लेख है।

चेक आउट सोर्स कोड में मुझे कुछ एनईआर नमूना डेटा के साथ डेमो फ़ोल्डर मिला। दुर्भाग्य से, सभी परीक्षणों को चलाने वाली स्क्रिप्ट यह नहीं दिखाती है कि इस डेटा पर कैसे चलना है। कम से कम यह देखने के लिए पर्याप्त जानकारीपूर्ण था कि अपेक्षित प्रारूप क्या है: मानक VW डेटा प्रारूप के लगभग समान, सिवाय इसके कि प्रविष्टियों को रिक्त लाइनों द्वारा अलग किया जाता है (यह महत्वपूर्ण है)।

मेरी वर्तमान समझ निम्नलिखित कमांड को चलाने की है:

cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw

कहाँ पे

--searn 25 - एनईआर लेबल की कुल संख्या (?)

--searn_task sequence - अनुक्रम टैगिंग कार्य (?)

--searn_passes_per_policy 2 - स्पष्ट नहीं है कि यह क्या करता है

अन्य पैरामीटर VW के लिए मानक हैं और अतिरिक्त स्पष्टीकरण की आवश्यकता नहीं है। शायद SEARN के लिए और अधिक पैरामीटर हैं? उनका महत्व और प्रभाव क्या है? उन्हें कैसे धुनें? अंगूठे का कोई नियम?

उदाहरण के लिए किसी भी संकेत की सराहना की जाएगी।

जवाबों:


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.