शीर्षक के रूप में, विचार एक निरंतर चर और एक श्रेणीगत चर के बीच "सहसंबंध" (परिभाषित के रूप में "मुझे पता है कि जब मैं बी के बारे में कितना जानता हूं") के रूप में अनुमान लगाने के लिए, यहां और एमआई के बाद आपसी जानकारी का उपयोग करना है। मैं आपको एक क्षण में मामले पर अपने विचार बताऊंगा, लेकिन इससे पहले कि मैं आपको CrossValidated इस अन्य प्रश्न / उत्तर को पढ़ने की सलाह दूं क्योंकि इसमें कुछ उपयोगी जानकारी है।
अब, क्योंकि हम एक श्रेणीगत चर पर एकीकृत नहीं कर सकते हैं जो हमें निरंतर एक को अलग करने की आवश्यकता है। यह आर में काफी आसानी से किया जा सकता है, जो कि मैंने अपने अधिकांश विश्लेषणों के साथ किया है। मैंने cut
फ़ंक्शन का उपयोग करना पसंद किया , क्योंकि यह मूल्यों को भी उपनाम देता है, लेकिन अन्य विकल्प भी उपलब्ध हैं। बिंदु, है एक तय करने के लिए है एक प्रायोरी "डिब्बे" (असतत राज्यों) किसी भी discretization से पहले की संख्या से किया जा सकता।
हालांकि, मुख्य समस्या एक और है: एमआई 0 से, तक है, क्योंकि यह एक असंरचित उपाय है जो इकाई बिट है। यह एक सहसंबंध गुणांक के रूप में उपयोग करने के लिए बहुत मुश्किल बनाता है। इसे वैश्विक सहसंबंध गुणांक का उपयोग करके आंशिक रूप से हल किया जा सकता है , यहां और जीसीसी के बाद, जो एमआई का मानकीकृत संस्करण है; GCC को निम्नानुसार परिभाषित किया गया है:
संदर्भ: सूत्र आंद्रेया डायोनियो, रुई मेनेजेस और डायना मेंडेस, 2010 द्वारा स्टॉक मार्केट ग्लोबलाइजेशन का विश्लेषण करने के लिए एक गैर-रेखीय उपकरण के रूप में म्युचुअल सूचना से है।
जीसीसी 0 से 1 तक होता है, और इसलिए दो चर के बीच संबंध का अनुमान लगाने के लिए आसानी से उपयोग किया जा सकता है। समस्या हल हुई, है ना? एक प्रकार का। क्योंकि यह सारी प्रक्रिया बहुत हद तक इस बात पर निर्भर करती है कि हमने कितने डिस्क्रिमिनेशन के दौरान इस्तेमाल करने का फैसला किया है। यहाँ मेरे प्रयोगों के परिणाम:
Y- अक्ष पर आपके पास GCC है और x- अक्ष पर आपके पास 'डिब्बे' की संख्या है जिसे मैंने विवेक के लिए उपयोग करने का निर्णय लिया है। दो लाइनें दो अलग-अलग विश्लेषणों को संदर्भित करती हैं जिन्हें मैंने दो अलग-अलग (हालांकि बहुत समान) डेटासेट पर आयोजित किया था।
यह मुझे लगता है कि विशेष रूप से एमआई और विशेष रूप से जीसीसी का उपयोग अभी भी विवादास्पद है। फिर भी, यह भ्रम मेरी तरफ से एक गलती का परिणाम हो सकता है। या तो मामला है, मैं इस मामले पर आपकी राय सुनना पसंद करूंगा (क्या आपके पास एक स्पष्ट चर और निरंतर एक के बीच सहसंबंध का अनुमान लगाने के लिए वैकल्पिक तरीके हैं?)।