प्रदर्शन मेट्रिक्स अप्रकाशित शिक्षा का मूल्यांकन करने के लिए


49

अप्रशिक्षित अधिगम (जैसे क्लस्टरिंग) के संबंध में, क्या प्रदर्शन का मूल्यांकन करने के लिए कोई मैट्रिक्स हैं?



4
मुझे लगता है कि यह सवाल अधिक सामान्य है कि एक, इसलिए मैं इस खुले को छोड़ने के लिए मतदान कर रहा हूं।
पीटर फ्लॉम - मोनिका

मेरे पास आपके पास एक ही प्रश्न है, और कुछ (जैसा कि अभी तक पूरी तरह से पढ़ा नहीं गया है) संदर्भ प्रासंगिक हैं: क्लस्टर सत्यापन के लिए आंतरिक वैधता उपाय पर एक सर्वेक्षण एल.जेगथा देबोराह, आर.बस्करन, ए.कन्नन और क्लस्टर वैधता मापन तकनीक फेरेंक कोव्स, सेसाबा लेगनी, अत्तिला बाबोस
कस्तर्मा

जवाबों:


44

कुछ अर्थों में मुझे लगता है कि यह प्रश्न अचूक है। मैं ऐसा इसलिए कहता हूं क्योंकि एक विशेष रूप से अनुपलब्ध विधि कितना अच्छा प्रदर्शन करती है, यह बहुत हद तक इस बात पर निर्भर करता है कि कोई पहली जगह में अप्रशिक्षित शिक्षा क्यों कर रहा है, अर्थात क्या विधि आपके अंतिम लक्ष्य के संदर्भ में अच्छा प्रदर्शन करती है? जाहिर है कि यह पूरी तरह सच नहीं है, लोग इन समस्याओं पर काम करते हैं और उन परिणामों को प्रकाशित करते हैं जिनमें किसी प्रकार का मूल्यांकन शामिल होता है। मैं उन कुछ दृष्टिकोणों की रूपरेखा तैयार करूँगा जिनसे मैं परिचित हूँ।

क्लस्टरिंग के लिए एक अच्छा संसाधन (संदर्भ के साथ) स्केलेरेंस का प्रलेखन पृष्ठ है, क्लस्टरिंग प्रदर्शन मूल्यांकन । यह कई विधि को कवर करता है, लेकिन सभी लेकिन एक, सिल्हूट गुणांक, मानता है कि जमीनी सच्चाई लेबल उपलब्ध हैं। इस विधि का उल्लेख क्लस्टरिंग के मूल्यांकन उपाय में भी किया गया है , इस प्रश्न के लिए टिप्पणियों में जुड़ा हुआ है।

यदि आपकी बिना पढ़ी हुई सीखने की विधि संभाव्य है, तो एक अन्य विकल्प डेटा बाहर आयोजित किए जाने पर कुछ संभाव्यता माप (लॉग-संभावना, गड़बड़ी, आदि) का मूल्यांकन करना है। यहां प्रेरणा यह है कि यदि आपकी अनप्लग्ड लर्निंग विधि समान डेटा के लिए उच्च संभावना प्रदान करती है जो मापदंडों को फिट करने के लिए उपयोग नहीं किया गया था, तो संभवत: इसने ब्याज के वितरण पर कब्जा करने का अच्छा काम किया है। एक डोमेन जहां इस प्रकार के मूल्यांकन का आमतौर पर उपयोग किया जाता है वह है भाषा मॉडलिंग।

अंतिम विकल्प जिसका मैं उल्लेख करूंगा, एक संबंधित सहायक कार्य पर एक पर्यवेक्षित शिक्षार्थी का उपयोग कर रहा है। यदि आप अनुपयोगी विधि अव्यक्त चर उत्पन्न करते हैं, तो आप इन अव्यक्त चर को इनपुट का निरूपण मान सकते हैं। इस प्रकार, इन अव्यक्त चरों का उपयोग करने के लिए समझदारी है क्योंकि डेटा जिस डोमेन से संबंधित है वह कुछ कार्य करने वाले पर्यवेक्षक के लिए इनपुट का उपयोग करता है। पर्यवेक्षित विधि का प्रदर्शन तब अप्रशिक्षित शिक्षार्थी के प्रदर्शन के लिए एक सरोगेट के रूप में काम कर सकता है। यह अनिवार्य रूप से सेटअप है जिसे आप प्रतिनिधित्व सीखने पर अधिकांश काम में देखते हैं।

यह विवरण शायद थोड़ा अस्पष्ट है, इसलिए मैं एक ठोस उदाहरण दूंगा। शब्द प्रतिनिधित्व सीखने पर लगभग सभी कार्य मूल्यांकन के लिए निम्नलिखित दृष्टिकोण का उपयोग करते हैं:

  1. एक अप्रशिक्षित शिक्षार्थी का उपयोग करके शब्दों का प्रतिनिधित्व जानें।
  2. वाक् टैगिंग या नामित इकाई पहचान के कुछ हिस्सों की तरह एनएलपी कार्य करने वाले पर्यवेक्षक के लिए इनपुट के रूप में सीखे गए अभ्यावेदन का उपयोग करें।
  3. इनपुट के रूप में द्विआधारी शब्द उपस्थिति सुविधाओं की तरह, एक मानक प्रतिनिधित्व का उपयोग कर आधार रेखा की तुलना में पर्यवेक्षित शिक्षार्थी के प्रदर्शन में सुधार करने की क्षमता से अप्रशिक्षित शिक्षार्थी के प्रदर्शन का आकलन करें।

एक्शन में इस दृष्टिकोण के एक उदाहरण के लिए डाह एट अल द्वारा वर्ड ऑब्जर्वेशन पर पेपर ट्रेनिंग प्रतिबंधित बोल्ट्जमैन मशीनें देखें


11
+1 " कितनी अच्छी तरह से एक विशेष रूप से अनसुनी विधि करता है, काफी हद तक इस बात पर निर्भर करेगा कि कोई पहली बार में अनचाहे सीखने को क्यों कर रहा है " यह बहुत अधिक है। कुछ जादू की संख्या की तलाश में मत जाओ जो आप किसी भी तरह से दिए गए परिणाम का औचित्य साबित करने के लिए वास्तव में परिणाम की व्याख्या किए बिना उपयोग कर सकते हैं ।
मार्क क्लेसेन

1
मैं यह भी जोड़ता हूं कि एक पर्यवेक्षित दृष्टिकोण का उपयोग प्रॉक्सी के रूप में करता है कि कैसे एक अच्छी तरह से अनपेक्षित दृष्टिकोण काम करता है नई सुविधाओं की खोज की आवश्यकता नहीं है। उदाहरण के लिए, क्लस्टरिंग नई सुविधाओं को नहीं सीखती है, फिर भी क्लस्टरिंग का उपयोग अक्सर पर्यवेक्षित शिक्षार्थी की भविष्यवाणी सटीकता में सुधार करने के लिए किया जाता है, यह समझाने के अतिरिक्त लाभ के साथ कि ऐसा क्यों हो सकता है। उदाहरण के लिए, k- साधन क्लस्टरिंग k भविष्यवाणियों का उत्पादन कर सकते हैं जो कि खोज की संरचना और क्लस्टरिंग से संपीड़न का फायदा उठाकर प्रत्येक में सुधार कर रहे हैं। Ttic.uchicago.edu/~shubhendu/Papers/clustering_bagging.pdf
साइबरनेट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.