मेरे पास तीन विशेषताएं हैं जो मैं वर्गीकरण समस्या को हल करने के लिए उपयोग करता हूं। मूल रूप से, इन विशेषताओं ने बूलियन मूल्यों का उत्पादन किया, इसलिए मैं सकारात्मक और नकारात्मक वर्गीकरणों के ओवरलैप को देखते हुए उनके अतिरेक का मूल्यांकन कर सकता था। अब मैंने इसके बजाय वास्तविक मूल्यों (स्कोर) का निर्माण करने के लिए सुविधाओं को बढ़ा दिया है, और मैं उनके अतिरेक का फिर से विश्लेषण करना चाहूंगा, लेकिन मैं यह पूरी तरह से नुकसान में हूं कि यह कैसे करना है। किसी ने मुझे एक संकेत या विचार के साथ प्रदान कर सकते हैं कि कैसे के बारे में जाने के लिए?
मुझे पता है कि यह सवाल बहुत अस्पष्ट है, ऐसा इसलिए है क्योंकि मेरे पास आंकड़ों की बहुत मजबूत पकड़ नहीं है। इसलिए, यदि आपके पास मेरे लिए कोई उत्तर नहीं है, तो शायद आपके पास कुछ प्रश्न हैं, जो मुझे खुद को बेहतर समझने में मदद कर सकते हैं।
संपादित करें: मैं वर्तमान में इस विषय पर विकिपीडिया ब्राउज़ कर रहा हूं, मुझे लगता है कि जो मैं चाहता हूं वह एक सहसंबंध गुणांक है, लेकिन मैं अभी भी अनिश्चित हूं कि यह सही दृष्टिकोण है, और कई उपलब्ध गुणांक में से कौन सा उपयुक्त है।
संपादित करें 2: बूलियन मामले में, मैंने पहली बार प्रत्येक सुविधा के लिए नमूनों का सेट बनाया था जिसके लिए यह सच था। फिर, दो सेटों के बीच संबंध इन सेटों के संघ के आकार पर इन सेटों के प्रतिच्छेदन का आकार था। यदि यह मान 1 है, तो वे पूरी तरह से बेमानी हैं, क्योंकि हमेशा समान। यदि यह 0 है, तो वे कभी समान नहीं होते हैं।