वर्गीकरण समस्याओं में वर्ग पृथक्करण के उपाय


11

रेखीय विभेदक शिक्षार्थियों में वर्ग पृथक्करण का एक अच्छा उपाय का एक उदाहरण फिशर का रेखीय विभेदक अनुपात है। क्या यह निर्धारित करने के लिए अन्य उपयोगी मैट्रिक्स हैं कि क्या फीचर सेट लक्ष्य चर के बीच अच्छे वर्ग अलगाव प्रदान करते हैं? विशेष रूप से, मैं लक्ष्य वर्ग पृथक्करण को अधिकतम करने के लिए अच्छी बहुभिन्नरूपी इनपुट विशेषताओं को खोजने में दिलचस्पी रखता हूं और यह अच्छा होगा कि यदि वे अच्छी पृथक्करण क्षमता प्रदान करते हैं, तो एक गैर-रेखीय / गैर-पैरामीट्रिक उपाय जल्दी से निर्धारित करें।


मैंने करहुनेन लोवे विस्तार के बारे में पढ़ा कि सुविधा निष्कर्षण के लिए कक्षा की जानकारी का उपयोग करने की अनुमति देता है। इसके अलावा, पीसीए के लिए एक वैश्विक मैट्रिक्स के बजाय वर्ग सहसंयोजक मैट्रिक्स के भारित औसत का उपयोग करने के लिए एक्सटेंशन हैं। इस जानकारी के अलावा, मुझे आपके प्रश्न के संभावित उत्तरों में भी दिलचस्पी है।
ज़ोरान

जवाबों:


1

रैंडम वनों से परिवर्तनीय महत्व के उपाय (VIM) वही हो सकते हैं जो आप खोज रहे हैं। इनमें से दो पर एक संक्षिप्त अवलोकन बेलेस्टिक्स एट अल द्वारा रैंडम फॉरेस्ट मैथडोलॉजी और व्यावहारिक मार्गदर्शन पर जोर के साथ कम्प्यूटेशनल बायोलॉजी और बायोइनफॉरमैटिक्स पर जोर दिया गया है

गिन्नी वीआईएम के लिए विचार यह है कि आप कुछ आंकड़े प्राप्त करते हैं कि कितनी बार एक यादृच्छिक जंगल ने एक निश्चित विशेषता का उपयोग छींटे मानदंड के रूप में किया है। जानकारीपूर्ण सुविधाओं को यहां अधिक बार चुना जाता है।

क्रमचय विम विचार यह है कि बीच आरएफ-वर्गीकारक की त्रुटि अनुमान की तुलना की जाती है पर आधारित है

  • मूल डेटासेट और
  • एक कृत्रिम डेटासेट, जहाँ ONE विशेषता के मानों की अनुमति है।

परिणामी त्रुटि-अनुमान-अंतर महत्वपूर्ण विशेषताओं के लिए बड़ा होगा।

जहाँ तक मुझे याद है, VIM का उपयोग सुविधाओं के बीच निर्भरता की खोज के लिए भी किया जा सकता है।


0

एक इष्टतम सुविधाओं का पता लगाना काफी कम्प्यूटेशनल रूप से महंगा हो सकता है। उपलब्ध समाधानों की मुख्य श्रेणियों को दो सेटों में बांटा जा सकता है: या तो एक विशिष्ट क्लासिफायरियर (रैपर्स) से बांधें या कुछ कसौटी (फिल्टर विधियों) के आधार पर सुविधाओं की सरल रैंकिंग।

आपकी आवश्यकताओं के आधार पर (त्वरित / गैर-पैरामीट्रिक / गैर-रैखिक) शायद आपको फ़िल्टर विधियों से उम्मीदवारों की आवश्यकता होती है। साहित्य में वर्णित लोगों के कुछ उदाहरण हैं । उदाहरण के लिए सूचना लाभ - जो वर्ग के संबंध में सूचना लाभ को मापकर एक विशेषता के मूल्य का मूल्यांकन करता है; या सहसंबंध जो विशेषता और वर्ग के बीच सहसंबंध के आधार पर एक विशेषता के मूल्य का मूल्यांकन करता है।

आवरण विधियां एक क्लासिफायरियर से जुड़ी होती हैं और यह क्लासिफायर ऑफ इंटरेस्ट के लिए बेहतर सुविधाओं के साथ समाप्त हो सकती हैं। उनकी प्रकृति (प्रत्येक पुनरावृत्ति में पूर्ण प्रशिक्षण / परीक्षण) के कारण उन्हें त्वरित या गैर-पैरामीट्रिक नहीं माना जा सकता है, हालांकि वे सुविधाओं के गैर-रैखिक संबंधों (आपकी तीसरी आवश्यकता) से निपट सकते हैं। एक उदाहरण रिकर्सिव फ़ीचर एलिमिनेशन होगा जो एसवीएम पर आधारित है, इस प्रकार यह कक्षाओं के बीच के मार्जिन को अधिकतम करने पर लक्षित है और सुविधाओं के गैर-रैखिक संबंधों (गैर-रैखिक कर्नेल का उपयोग करके) से निपट सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.