Vowpal Wabbit (VW) स्पष्ट रूप से SEARN के माध्यम से अनुक्रम टैगिंग कार्यक्षमता का समर्थन करता है । समस्या यह है कि मैं स्पष्टीकरण के साथ और कुछ उदाहरणों के साथ कहीं भी विस्तृत पैरामीटर सूची नहीं पा सकता हूं। सबसे अच्छा मुझे मिल सकता है Zinkov के ब्लॉग प्रविष्टि एक बहुत ही कम उदाहरण के साथ। मुख्य विकि पृष्ठ मुश्किल से SEARN का उल्लेख है।
चेक आउट सोर्स कोड में मुझे कुछ एनईआर नमूना डेटा के साथ डेमो फ़ोल्डर मिला। दुर्भाग्य से, सभी परीक्षणों को चलाने वाली स्क्रिप्ट यह नहीं दिखाती है कि इस डेटा पर कैसे चलना है। कम से कम यह देखने के लिए पर्याप्त जानकारीपूर्ण था कि अपेक्षित प्रारूप क्या है: मानक VW डेटा प्रारूप के लगभग समान, सिवाय इसके कि प्रविष्टियों को रिक्त लाइनों द्वारा अलग किया जाता है (यह महत्वपूर्ण है)।
मेरी वर्तमान समझ निम्नलिखित कमांड को चलाने की है:
cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw
कहाँ पे
--searn 25
- एनईआर लेबल की कुल संख्या (?)
--searn_task sequence
- अनुक्रम टैगिंग कार्य (?)
--searn_passes_per_policy 2
- स्पष्ट नहीं है कि यह क्या करता है
अन्य पैरामीटर VW के लिए मानक हैं और अतिरिक्त स्पष्टीकरण की आवश्यकता नहीं है। शायद SEARN के लिए और अधिक पैरामीटर हैं? उनका महत्व और प्रभाव क्या है? उन्हें कैसे धुनें? अंगूठे का कोई नियम?
उदाहरण के लिए किसी भी संकेत की सराहना की जाएगी।