रैखिक विभेदक विश्लेषण और बेयस नियम: वर्गीकरण


12

रैखिक भेदभाव विश्लेषण और बेयस नियम के बीच क्या संबंध है? मैं समझता हूं कि एलडीए का उपयोग वर्गीकरण में समूह विचरण के बीच और समूह विचरण के अनुपात को कम करने की कोशिश में किया जाता है, लेकिन मुझे नहीं पता कि इसमें बेय्स नियम का उपयोग कैसे करते हैं।


भेदभावपूर्ण कार्य निकाले जाते हैं ताकि समूह-समूह भिन्नता को अधिकतम-समूह भिन्नता अनुपात में अधिकतम किया जा सके। इसका वर्गीकरण से कोई लेना-देना नहीं है, जो एलडीए का दूसरा और स्टैंड-अलोन चरण है।
ttnphns

जवाबों:


16

एलडीए में वर्गीकरण निम्नानुसार है (बेयस नियम दृष्टिकोण)। [विभेदकों के निष्कर्षण के बारे में यहां कोई देख सकता है ।]

Bayes प्रमेय के अनुसार, मांग के लिए संभावना है कि हम वर्ग के साथ हैं निपटने , जबकि वर्तमान में बिंदु को देख एक्स है पी ( कश्मीर | x ) = पी ( कश्मीर ) * पी ( एक्स | कश्मीर ) / पी ( एक्स ) , जहांkxP(k|x)=P(k)P(x|k)/P(x)

- बिना शर्त (पृष्ठभूमि) वर्ग k की संभावना; पी ( एक्स ) - बिना शर्त (पृष्ठभूमि) बिंदु एक्स की संभावना; P ( x | k ) -कक्षा k मेंबिंदु x की उपस्थिति की संभावना, यदि वर्ग k के साथ व्यवहार किया जा रहा है।P(k)kP(x)xP(x|k)xkk

"वर्तमान में बिंदु अवलोकन " आधार स्थिति होने के नाते, पी ( x ) = 1 , और इसलिए भाजक को छोड़ा जा सकता है। इस प्रकार, पी ( कश्मीर | x ) = पी ( कश्मीर ) * पी ( एक्स | कश्मीर )xP(x)=1P(k|x)=P(k)P(x|k)

एक पूर्व (पूर्व विश्लेषणात्मक) संभावना है कि के लिए देशी वर्ग एक्स है कश्मीर ; पी ( के ) उपयोगकर्ता द्वारा निर्दिष्ट किया गया है। आमतौर पर डिफ़ॉल्ट रूप से सभी वर्ग बराबर P ( k ) = 1 / number_of_classes प्राप्त करते हैं। गणना करने के लिए पी ( कश्मीर | एक्स ) , यानी पीछे (के बाद विश्लेषणात्मक) संभावना है कि के लिए देशी वर्ग एक्स है कश्मीर , एक पता होना चाहिए पी ( एक्स | कश्मीर )P(k)xkP(k)P(k)P(k|x)xkP(x|k)

-प्रति सेप्रायिकता - विभेदकों के लिएनहीं पाया जा सकता है, LDA का मुख्य मुद्दा निरंतर है, असतत नहीं, चर। इस मामले में पी ( x | k ) कोव्यक्त करने की मात्राऔर इसके समानुपातीसंभावना घनत्व(पीडीएफ फ़ंक्शन) है। इसके द्वारा हम के लिए बिंदु गणना पीडीएफ की जरूरत एक्स कक्षा में कश्मीर , पी डी एफ ( एक्स | कश्मीर ) , में पी के मूल्यों द्वारा गठित आयामी सामान्य वितरण पीP(x|k)P(x|k)xkPDF(x|k)ppdiscriminants। [विकिपीडिया बहुभिन्नरूपी सामान्य वितरण देखें]

PDF(x|k)=ed/2(2π)p/2|S|)

जहाँ - वर्गित महालनोबिस दूरी [विकिपीडिया महालनोबिस दूरी देखें] बिंदु x से एक वर्ग केन्द्रक तक के विभेदकों के अंतरिक्ष में ; एस - सह-विभेदकों के बीच सहसंयोजक मैट्रिक्स , उस वर्ग के भीतर मनाया गया।dxS

प्रत्येक वर्ग के लिए इस तरह से गणना करें । पी ( कश्मीर ) * पी डी एफ ( एक्स | कश्मीर ) के लिए बिंदु एक्स और वर्ग कश्मीर मांग के लिए व्यक्त पी ( कश्मीर ) * पी ( एक्स | कश्मीर ) हमारे लिए। लेकिन इसके बाद के संस्करण आरक्षित है कि पीडीएफ असल संभावना है, केवल यह के अनुपात में नहीं है के साथ, हम सामान्य चाहिए पी ( कश्मीर ) * पी डीPDF(x|k)P(k)PDF(x|k)xkP(k)P(x|k) , की राशि से विभाजित पी ( कश्मीर ) * पी डी एफ ( एक्स | कश्मीर ) सभी वर्गों से अधिक है। उदाहरण के लिए, यदि सभी में 3 वर्ग हैं, k , l , m , तोP(k)PDF(x|k)P(k)PDF(x|k)klm

P(k|x)=P(k)PDF(x|k)/[P(k)PDF(x|k)+P(l)PDF(x|l)+P(m)PDF(x|m)]

प्वाइंट को एलडीए द्वारा उस वर्ग को सौंपा जाता है जिसके लिए P ( k | x ) सबसे अधिक है।xP(k|x)

SS|S|=1dSSw

जोड़ । एलडीए, फिशर, एलडीए पायनियर को वर्गीकरण के लिए उपरोक्त बेय्स नियम दृष्टिकोण से पहले , एलडीए में अंकों को वर्गीकृत करने के लिए अब तथाकथित फिशर के रैखिक वर्गीकरण कार्यों को प्रस्तावित करने का प्रस्ताव दिया गया है । बिंदु के लिए वर्ग k से संबंधित फ़ंक्शन स्कोर रैखिक संयोजन b k v 1 V 1 x + b k v 2 V 2 x + है + C o n s t k , जहाँ V ,xkbkv1V1x+bkv2V2x+...+Constkविश्लेषण में V p भविष्यवक्ता चर हैं।V1,V2,...Vp

गुणांक , जी वर्गों की संख्या और किया जा रहा है रों वी डब्ल्यू की जमा भीतर स्तरीय बिखराव मैट्रिक्स के तत्व होने पी वी -variables।bkv=(ng)wpsvwV¯kwgsvwp V

Constk=log(P(k))(vpbkvV¯kv)/2

x


यह बायेसियन दृष्टिकोण सही है? इसके लिए फिशर का दृष्टिकोण क्या है?
zca0

1
आपके अनुरोध पर जवाब में जोड़ा गया
ttnphns

XKp(K|X)p(K|X)K

और मुझे लगता है कि बेयस का दृष्टिकोण अधिक समझ में आता है, और हमें फिशर के दृष्टिकोण का उपयोग करने की आवश्यकता क्यों है?
एवोकैडो

हमें जरूरत नहीं है। सिर्फ ऐतिहासिक बात के लिए।
tnnphns

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.