मतलाब में आपसी जानकारी का उपयोग करके सुविधा का चयन


10

मैं चयन करने की सुविधा के लिए पारस्परिक जानकारी के विचार को लागू करने की कोशिश कर रहा हूं, जैसा कि इन व्याख्यान नोट्स (पृष्ठ 5 पर) में वर्णित है ।

मेरा मंच मतलब है। अनुभवजन्य डेटा से पारस्परिक जानकारी की गणना करते समय मुझे एक समस्या यह है कि संख्या हमेशा पक्षपाती है। मुझे मतलाब सेंट्रल पर एमआई की गणना करने के लिए लगभग 3 ~ 4 अलग-अलग फाइलें मिलीं और जब मैं स्वतंत्र यादृच्छिक चर में फ़ीड करता हूं तो वे सभी बड़ी संख्या (जैसे 0.4) देते हैं।

मैं एक विशेषज्ञ नहीं हूं, लेकिन समस्या यह है कि यदि आप एमआई की गणना करने के लिए संयुक्त और सीमांत घनत्व का उपयोग करते हैं, तो बायस प्रक्रिया में पेश किया जाता है क्योंकि एमआई परिभाषा सकारात्मक है। क्या किसी के पास इस बात की व्यावहारिक सलाह है कि आपसी जानकारी का सही अनुमान कैसे लगाया जाए?

एक संबंधित प्रश्न व्यवहार में है, लोग वास्तव में सुविधाओं का चयन करने के लिए एमआई का उपयोग कैसे करते हैं? यह मेरे लिए स्पष्ट नहीं है कि एमआई थ्योरी के बिना थिअल्ड वैल्यू के साथ कैसे आना है। या क्या लोग केवल एमआई द्वारा सुविधाओं को रैंक करते हैं और शीर्ष कश्मीर सुविधाएँ लेते हैं?


इस विषय में कोई दिलचस्पी नहीं है?

क्या आपके पास अभी तक इसका जवाब है?
एन्ट्रापी

दुर्भाग्यवश नहीं। क्या आपके पास भी यही मुद्दा है?

जवाबों:


3

यह सीमित नमूनाकरण पूर्वाग्रह की समस्या है ।

घनत्व का छोटा नमूना अनुमान शोर है, और यह भिन्नता चरों के बीच के परस्पर संबंधों को प्रेरित करती है जो अनुमानित सूचना मूल्य को बढ़ाती है।

(आर-1)(एस-1)/2एनln22एनln(2)मैंχ2(आर-1)(एस-1)

मतलाब में इन तकनीकों को लागू करने वाले कुछ पैकेज में इन्फोटूलबॉक्स और स्पाइक ट्रेन विश्लेषण टूलकिट शामिल हैं

निरंतर मामले के लिए, निकटतम पड़ोसी दूरी के आधार पर अनुमानक समस्या को कम करते हैं।


1

मैंने केएल-डायवर्जेंस का उपयोग किया है और उचित नमूना आकार के साथ लोकी के लिए 0 के मान प्राप्त करते हैं जहां वितरण की समान संभावना है।

मेरा सुझाव है कि आप केएल-विचलन के संदर्भ में अपने एमआई को रीफ्रेज करें


1

आपको इनपुट चर (सुविधा) चयन के लिए एक आंशिक पारस्परिक सूचना एल्गोरिथ्म का उपयोग करना चाहिए। यह एमआई अवधारणाओं और संभाव्यता घनत्व के अनुमान पर आधारित है। उदाहरण के लिए:

  1. कर्नेल आधारित पीएमआई : (+) में एक स्टॉपिंग मानदंड (एकैके इंफॉर्मेशन क्राइटेरिया) (-) उच्च जटिलता है
  2. केएनएन आधारित पीएमआई : (-) में एक रोक मापदंड (+) कम जटिलता नहीं है

मैंने पीएमआई का उपयोग तंत्रिका नेटवर्क इनपुट की संख्या को कम करने के लिए किया क्योंकि वे जटिलता बढ़ाते हैं और अन्य समस्याओं को पेश करते हैं। आप आर्टिफिशियल नेवरेटिव नेटवर्क्स पेपर के लिए इनपुट वेरिएबल सिलेक्शन मेथड्स के रिव्यू में इनपुट वेरिएबल सेलेक्शन (आईवीएस) एल्गोरिदम का पूरा अवलोकन पा सकते हैं । आप एसवीएम और अन्य के लिए आईवीएस का उपयोग कर सकते हैं। चीजों को छोटा करने के लिए, PMI का उपयोग करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.