मैं विभेदक विश्लेषण का अध्ययन कर रहा हूं, लेकिन मुझे कई अलग-अलग स्पष्टीकरणों को समेटने में मुश्किल समय आ रहा है। मेरा मानना है कि मुझे कुछ याद आ रहा है, क्योंकि मैंने पहले कभी भी विसंगति के इस (प्रतीत) स्तर का सामना नहीं किया है। यह कहा जा रहा है, इस वेबसाइट पर भेदभावपूर्ण विश्लेषण के बारे में प्रश्नों की संख्या इसकी जटिलता के लिए एक वसीयतनामा है।
कई वर्गों के लिए एलडीए और क्यूडीए
मेरी मुख्य पाठ्य पुस्तक जॉनसन एंड विचर्न एप्लाइड मल्टीवीरेट स्टेटिस्टिकल एनालिसिस (एएमएसए) है और इसके आधार पर मेरे शिक्षक के नोट्स। मैं दो समूह सेटिंग की उपेक्षा करूंगा, क्योंकि मेरा मानना है कि इस सेटिंग में सरलीकृत सूत्र कम से कम कुछ भ्रम पैदा कर रहे हैं। इस स्रोत के अनुसार, एलडीए और क्यूडीए को एक वर्गीकरण नियम के एक पैरामीट्रिक (बहुभिन्नरूपी सामान्यता मानकर) के रूप में परिभाषित किया गया है जो गर्भपात (ईसीएम) की अपेक्षित लागत पर आधारित है। ईसीएम सशर्त अपेक्षित लागत को किसी भी समूह के लिए एक नया अवलोकन एक्स वर्गीकृत करने के लिए खर्च करता है (गर्भपात लागत और पूर्व संभाव्यता को शामिल करते हुए) और हम इसे कम करने वाले वर्गीकरण क्षेत्रों को चुनते हैं। जहां
माना जाता है कि यह वर्गीकरण नियम "एक के बराबर है जो पश्च-संभाव्यता को अधिकतम करता है" (sic AMSA), जिसे मैं केवल मान सकता हूं कि बेयस का दृष्टिकोण मैंने उल्लेख किया है। क्या ये सही है? और ईसीएम एक पुरानी विधि है, क्योंकि मैंने कभी नहीं देखा कि यह कहीं और घटित हो।
सामान्य आबादी के लिए यह नियम द्विघात विभेदक स्कोर को सरल करता है: ।
यह पेज 110 पर द एलिमेंट ऑफ स्टैटिस्टिकल लर्निंग (ईएसएल) फॉर्मूला 4.12 के बराबर लगता है , हालांकि वे इसे एक स्कोर के बजाय एक द्विघात विभेदक कार्य के रूप में वर्णित करते हैं । इसके अलावा, वे बहुभिन्नरूपी घनत्व (4.9) के लॉग-अनुपात के माध्यम से यहां पहुंचते हैं। क्या यह अभी तक बेयस के दृष्टिकोण का दूसरा नाम है?
जब हम समान सहसंयोजक मान लेते हैं तो सूत्र रैखिक विभेदक स्कोर के लिए और भी सरल हो जाता है ।
यह सूत्र ईएसएल (4.10) से भिन्न होता है, जहां पहला शब्द उलटा होता है: । ESL संस्करण भी R में सांख्यिकीय लर्निंग में सूचीबद्ध है । इसके अलावा, में प्रस्तुत एसएएस आउटपुट में एक रेखीय विभेदक फ़ंक्शन का वर्णन किया जाता है जिसमें एक निरंतर और एक गुणांक शामिल है वेक्टर , ईएसएल संस्करण के अनुरूप प्रतीत होता है।
इस विसंगति के पीछे क्या कारण हो सकता है?
भेदभाव और फिशर की विधि
नोट: यदि यह प्रश्न बहुत बड़ा माना जाता है, तो मैं इस अनुभाग को हटा दूंगा और एक नया प्रश्न खोलूंगा, लेकिन यह पिछले खंड पर बनता है। पाठ की दीवार के लिए माफी की परवाह किए बिना, मैंने इसे कुछ हद तक संरचना करने की पूरी कोशिश की, लेकिन मुझे यकीन है कि इस पद्धति के बारे में मेरा भ्रम तर्क के कुछ अजीब विषमता को जन्म देता है।
AMSA पुस्तक फिशर विधि का वर्णन करने के लिए जाती है, कई समूहों के लिए भी। हालाँकि, ttnphns ने कई बार बताया है कि FDA केवल दो समूहों के साथ LDA है। यह मल्टीकल्चर एफडीए क्या है? शायद एफडीए के कई अर्थ हो सकते हैं?
AMSA फिशर के को रूप में वर्णित करता है, जो अनुपात अधिकतम करता है । लीनियर कॉम्बिनेशन तो सैंपल हैं (जिनमें से )। वर्गीकरण के लिए हम लिए सबसे छोटे मान वाले समूह k को चुनते हैं। जहां r विभेदकों की संख्या है जिसका हम उपयोग करना चाहते हैं। यदि हम सभी विभेदकों का उपयोग करते हैं तो यह नियम रैखिक विभेदक कार्य के बराबर होगा।
LDA के बारे में कई व्याख्याएं AMSA पुस्तक में FDA को कार्यप्रणाली का वर्णन करती प्रतीत होती हैं, अर्थात परिवर्तनशीलता पहलू के बीच / इसके बीच से शुरू होती हैं। अगर बीडब्ल्यू मैट्रिस के अपघटन नहीं तो एफडीए का क्या मतलब है?
यह पहली बार है कि पाठ्य पुस्तक में विभेदकारी विश्लेषण के आयाम में कमी के पहलू का उल्लेख किया गया है, जबकि इस साइट पर कई उत्तर इस तकनीक की दो-चरण प्रकृति पर जोर देते हैं, लेकिन यह दो समूह सेटिंग में स्पष्ट नहीं है क्योंकि केवल 1 है विभेदक। मल्टीकाड्स एलडीए और क्यूडीए के लिए उपरोक्त फॉर्मूले को देखते हुए यह अभी भी मेरे लिए स्पष्ट नहीं है जहां भेदभाव दिखाते हैं।
इस टिप्पणी ने मुझे विशेष रूप से भ्रमित कर दिया, यह देखते हुए कि बेयस वर्गीकरण को मूल चर पर अनिवार्य रूप से किया जा सकता है। लेकिन अगर एफडीए और एलडीए गणितीय रूप से समकक्ष हैं, जैसा कि पुस्तक द्वारा बताया गया है और यहां , क्या कमी नहीं होनी चाहिए ? मेरा मानना है कि यह वही है जो अंतिम लिंक को संबोधित कर रहा है, लेकिन मैं पूरी तरह से निश्चित नहीं हूं।
मेरे शिक्षक के पाठ्यक्रम के नोट्स बताते हैं कि एफडीए अनिवार्य रूप से विहित सहसंबंध विश्लेषण का एक रूप है। मुझे केवल 1 अन्य स्रोत मिले हैं जो इस पहलू के बारे में बात करते हैं, लेकिन यह एक बार फिर से परिवर्तनशीलता के बीच और भीतर विघटित होने के फिशर दृष्टिकोण के करीब बंधा हुआ लगता है। SAS अपनी LDA / QDA प्रक्रिया (DISCRIM) में एक परिणाम प्रस्तुत करता है जो जाहिरा तौर पर फिशर विधि ( https://stats.stackexchange.com/a/105116/62518 ) से संबंधित है । हालांकि, SAS 'FDA विकल्प (CANDISC) अनिवार्य रूप से एक विहित सहसंबंध करता है, इन तथाकथित फिशर के वर्गीकरण गुणांक को प्रस्तुत किए बिना। यह कच्चे विहित गुणांक प्रस्तुत करता है, जो मुझे लगता है कि आरडीए के W-1B eigenvectors के बराबर हैं जो lda (MASS) (https://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_candisc_sect019.htm )। वर्गीकरण गुणांक मेरे एलडीए और क्यूडीए अनुभाग में वर्णित भेदभावपूर्ण फ़ंक्शन से प्राप्त किए गए लगते हैं (क्योंकि प्रति जनसंख्या 1 फ़ंक्शन है और हम सबसे बड़ा एक चुनते हैं)।
मैं किसी भी और सभी स्पष्टीकरण या स्रोतों के संदर्भ में आभारी रहूंगा जो मुझे पेड़ों के माध्यम से जंगल को देखने में मदद कर सकते हैं। मेरी उलझन का मुख्य कारण यह प्रतीत होता है कि विभिन्न पाठ्य पुस्तकें अलग-अलग नामों से तरीकों को बुलाती हैं या गणित की थोड़ी भिन्नता को प्रस्तुत करती हैं, अन्य संभावनाओं को स्वीकार किए बिना, हालांकि मुझे लगता है कि यह एएमएसए पुस्तक की उम्र को देखते हुए आश्चर्य के रूप में नहीं आना चाहिए। ।
Extract the discriminants -> classify by them all (using Bayes approach, as usual)
तब के बराबर होती है, जैसा कि आमतौर पर डिफ़ॉल्ट रूप से, विभेदकों के वर्ग-वर्ग सहसंयोजक मैट्रिक्स के वर्गीकरण में उपयोग किया जाता है।
W^-1B
और फिर "बेयस" करने का एक तरीका है । यह समतुल्य है, लेकिन कम लचीला है (आप केवल कुछ ही भेदभावों का चयन नहीं कर सकते हैं, आप वर्गीकरण, आदि में सहसंयोजक मैट्रिक्स के भीतर अलग-अलग उपयोग नहीं कर सकते हैं)।
If we use all the discriminants this rule would be equivalent to the linear discriminant function
अस्पष्ट। "विवेचक" और "विभेदक कार्य" पर्यायवाची हैं। आप सभी विभेदकों या उनमें से केवल कुछ सबसे मजबूत / महत्वपूर्ण का उपयोग कर सकते हैं। मैं AMSA पुस्तक की ओर नहीं बढ़ा, लेकिन मुझे संदेह है कि लेखकों के लिए FDA = LDA। वास्तव में, मुझे व्यक्तिगत रूप से लगता है कि "फिशर एलडीए" एक अधिशेष, अनावश्यक शब्द होगा।