पीसीए और शास्त्रीय एमडीएस अलग कैसे हैं? बिना एमडीएम बनाम एमडीएस के बारे में कैसे? क्या कोई समय है जब आप एक दूसरे को पसंद करेंगे? व्याख्याएं कैसे भिन्न होती हैं?
पीसीए और शास्त्रीय एमडीएस अलग कैसे हैं? बिना एमडीएम बनाम एमडीएस के बारे में कैसे? क्या कोई समय है जब आप एक दूसरे को पसंद करेंगे? व्याख्याएं कैसे भिन्न होती हैं?
जवाबों:
क्लासिक टॉर्गरसन की मीट्रिक एमडीएस वास्तव में समानता को दूरियों में बदलकर और उन पर पीसीए (ईजन-अपघटन या एकवचन-मूल्य-अपघटन) करके किया जाता है। [ इस प्रक्रिया का दूसरा नाम ( distances between objects -> similarities between them -> PCA
, जिससे लोडिंग निर्देशांक के लिए मांगी गई है) प्रधान समन्वय विश्लेषण / पीसीओए है ।] इसलिए, पीसीए को सरलतम एमडीएस का एल्गोरिथ्म कहा जा सकता है।
गैर-मीट्रिक एमडीएस पुनरावृत्त ALSCAL या PROXSCAL एल्गोरिथ्म (या उनके समान एल्गोरिथ्म) पर आधारित है जो पीसीए की तुलना में अधिक बहुमुखी मैपिंग तकनीक है और इसे मीट्रिक एमडीएस पर भी लागू किया जा सकता है। जबकि PCA आपके लिए m महत्वपूर्ण आयामों को बरकरार रखता है , ALSCAL / PROXSCAL, m आयामों के लिए कॉन्फ़िगरेशन को फिट करता है (आप पूर्व-परिभाषित m ) और यह PCA की तुलना में मानचित्र पर असमानताओं को अधिक सीधे और सटीक रूप से पुन: पेश करता है (आमतौर पर नीचे चित्रण देखें)।
इस प्रकार, एमडीएस और पीसीए संभवतः एक ही स्तर पर एक दूसरे के अनुरूप या विपरीत नहीं हैं। पीसीए सिर्फ एक विधि है जबकि एमडीएस विश्लेषण का एक वर्ग है। मैपिंग के रूप में, पीसीए एमडीएस का एक विशेष मामला है। दूसरी ओर, पीसीए फैक्टर विश्लेषण का एक विशेष मामला है जो डेटा में कमी होने के कारण केवल एक मैपिंग से अधिक है, जबकि एमडीएस केवल एक मैपिंग है।
मीट्रिक एमडीएस बनाम गैर-मीट्रिक एमडीएस के बारे में आपके प्रश्न के लिए टिप्पणी करने के लिए बहुत कम है क्योंकि उत्तर सीधा है। अगर मुझे लगता है कि मेरे इनपुट असमानताएं यूक्लिडियन दूरियों के करीब हैं तो एक रैखिक परिवर्तन उन्हें एम-आयामी अंतरिक्ष में मैप करने के लिए पर्याप्त होगा, मैं मीट्रिक एमडीएस पसंद करूंगा। यदि मुझे विश्वास नहीं होता है, तो गैर-मीट्रिक एमडीएस के उपयोग को लागू करने के लिए मोनोटोनिक परिवर्तन आवश्यक है।
एक पाठक के लिए शब्दावली पर एक नोट । शब्द क्लासिक (अल) एमडीएस (सीएमडीएस) एमडीएस पर एक विशाल साहित्य में दो अलग-अलग अर्थ हो सकते हैं, इसलिए यह अस्पष्ट है और इसे टाला जाना चाहिए। एक परिभाषा यह है कि CMDS Torgerson के मीट्रिक एमडीएस का एक पर्याय है। एक और परिभाषा यह है कि सीएमडीएस एकल मैट्रिक्स इनपुट के साथ किसी भी एमडीएस (किसी भी एल्गोरिथ्म; मीट्रिक या गैर-मेट्रिक विश्लेषण द्वारा) है (एक बार में कई मैट्रिस का विश्लेषण करने वाले मॉडल मौजूद हैं - व्यक्तिगत "INDSCAL" मॉडल और प्रतिकृति मॉडल)।
उत्तर का चित्रण । अंकों के कुछ बादल (दीर्घवृत्त) को एक-आयामी mds- मानचित्र पर मैप किया जा रहा है। एक बिंदु को लाल बिंदुओं में दिखाया गया है।
‖ डी 2 ओ - डी 2 मीटर ‖ 1 ‖ डी ओ - डी मीटर ‖ 1
PCA- आधारित MDS (Torgerson's, या PCoA) सीधे नहीं है। यह मूल अंतरिक्ष में वस्तुओं और नक्शे पर उनकी छवियों के बीच वर्ग दूरी को कम करता है। यह काफी वास्तविक एमडीएस कार्य नहीं है; एमडीएस के रूप में यह बहुत ही सफल है, केवल इस हद तक कि कनिष्ठ कनिष्ठ कुल्हाड़ियां कमजोर हैं। यदि की तुलना में बहुत अधिक विचरण करता है, तो पूर्व केवल बादल में जोड़ीदार दूरी को काफी हद तक प्रतिबिंबित कर सकता है, विशेष रूप से दीर्घवृत्त के साथ दूर के बिंदुओं के लिए। Iterative एमडीएस हमेशा जीत जाएगा, और खासकर जब नक्शा बहुत कम आयामी चाहता है। Iterative MDS, तब भी अधिक सफल होगा जब एक क्लाउड दीर्घवृत्त पतला होता है, लेकिन PCoA की तुलना में mds-task को बेहतर बनाएगा। डबल-सेंट्रेशन मैट्रिक्स की संपत्ति द्वारा ( यहाँ वर्णित है) ऐसा प्रतीत होता है कि PCoA न्यूनतम करता है , जो उपरोक्त में से किसी भी न्यूनतम से भिन्न है।
एक बार फिर, पीसीए सबसे लाभप्रद ऑल कॉर्पोरल सेविंग सबस्पेस पर क्लाउड के अंकों को प्रोजेक्ट करता है । यह जोड़ीदार दूरी , एक उप-स्थान पर बिंदुओं के सापेक्ष स्थानों को उस संबंध में बचत नहीं करता है, जैसा कि पुनरावृत्त MDS करता है। हालांकि, ऐतिहासिक रूप से पीसीओए / पीसीए को मीट्रिक एमडीएस के तरीकों में माना जाता है।
उम्म ... एकदम अलग। पीसीए में, आपको मल्टीवेरिएट निरंतर डेटा (प्रत्येक विषय के लिए एक मल्टीवेरेट वेक्टर) दिया जाता है, और यदि आप उन्हें अवधारणा बनाने के लिए कई आयामों की आवश्यकता नहीं है, तो आप यह पता लगाने की कोशिश कर रहे हैं। (मीट्रिक) एमडीएस में, आपको वस्तुओं के बीच की दूरी का मैट्रिक्स दिया जाता है, और आप यह पता लगाने की कोशिश कर रहे हैं कि अंतरिक्ष में इन वस्तुओं के स्थान क्या हैं (और क्या आपको 1 डी, 2 डी, 3 डी, आदि स्थान की आवश्यकता है)। गैर-मीट्रिक एमडीएस में, आप केवल यह जानते हैं कि ऑब्जेक्ट 1 और 2 ऑब्जेक्ट 2 और 3 की तुलना में अधिक दूर हैं, इसलिए आप आयामों और स्थानों को खोजने के शीर्ष पर, इसे निर्धारित करने का प्रयास करते हैं।
कल्पना के एक उल्लेखनीय खिंचाव के साथ, आप कह सकते हैं कि पीसीए और एमडीएस का एक सामान्य लक्ष्य 2 डी या 3 डी में वस्तुओं की कल्पना करना है। लेकिन यह देखते हुए कि इनपुट्स कितने अलग हैं, इन तरीकों पर चर्चा नहीं की जाएगी, यहां तक कि किसी भी बहुभिन्नरूपी पाठ्यपुस्तक से संबंधित भी। मुझे लगता है कि आप एमडीएस के लिए प्रयोग करने योग्य डेटा में पीसीए के लिए उपयोग करने योग्य डेटा को परिवर्तित कर सकते हैं (जैसे, वस्तुओं के बीच महालनोबिस दूरी की गणना करके, नमूना सहसंयोजक मैट्रिक्स का उपयोग करके), लेकिन इससे तुरंत जानकारी का नुकसान होगा, एमडीएस को केवल परिभाषित किया गया है। स्थान और रोटेशन के लिए, और बाद के दो पीसीए के साथ अधिक जानकारीपूर्ण रूप से किए जा सकते हैं।
अगर मैं संक्षेप में किसी को गैर-मीट्रिक एमडीएस के परिणाम दिखाता था और उन्हें विस्तार से जाने बिना क्या करता है इसका एक मोटा विचार देना चाहता था, तो मैं कह सकता था:
हमारे पास मौजूद समानता या असमानता के उपायों को देखते हुए, हम अपनी वस्तुओं / विषयों को इस तरह से मैप करने की कोशिश कर रहे हैं कि उनके द्वारा बनाए गए up शहरों ’में उन दोनों के बीच दूरियां हों, जो इन समानता के उपायों के करीब हैं जितना हम उन्हें बना सकते हैं। हम उन्हें केवल डाइमेंशनल स्पेस में पूरी तरह से मैप कर सकते हैं, हालांकि, मैं यहां दो सबसे अधिक जानकारीपूर्ण आयामों का प्रतिनिधित्व कर रहा हूं - जैसे कि आप पीसीए में क्या करेंगे अगर आपने दो प्रमुख प्रिंसिपल घटकों के साथ एक चित्र दिखाया।
मीट्रिक बहुआयामी स्केलिंग (MDS) के कार्य को निम्न प्रकार से तैयार किया जा सकता है: n पॉइंट्स के बीच युग्मित दूरियों का एक मैट्रिक्स D दिया गया , R k में डेटा बिंदुओं का एक कम-आयामी एम्बेडिंग ढूँढें, जैसे कि उनके बीच न्यूक्लिडियन दूरियाँ। दिया दूरी: ‖ एक्स मैं - एक्स जे ‖ ≈ डी मैं जे ।
"लगभग" यहाँ एक में पुनर्निर्माण त्रुटि के सामान्य अर्थ समझ में आ जाता है, तो यानी लक्ष्य लागत समारोह "तनाव" कहा जाता है कम करने के लिए है अगर: तो समाधान है पीसीए के बराबर नहीं । समाधान किसी भी बंद सूत्र द्वारा नहीं दिया गया है, और एक समर्पित पुनरावृत्ति एल्गोरिथ्म द्वारा गणना की जानी चाहिए।
"शास्त्रीय एमडीएस", जिसे "Torgerson एमडीएस" जाना जाता है, एक संबंधित द्वारा इस लागत समारोह की जगह लेकिन बराबर नहीं : एक, बुलाया "तनाव" कम से कम करना चाहता है दूरी के बजाय केंद्रित स्केलर उत्पादों की पुनर्निर्माण त्रुटि। यह पता चला है कि K c की गणना D से की जा सकती है (यदि D यूक्लिडियन दूरियाँ हैं) और K c की पुनर्निर्माण त्रुटि कम से कम पीसीए करता है, जैसा कि अगले भाग में दिखाया गया है।
संदर्भ: सांख्यिकीय शिक्षा के तत्व , खंड 18.5.2।
PCA, शास्त्रीय MDS के समान ही परिणाम देता है यदि यूक्लिडियन दूरी का उपयोग किया जाता है।
मैं कॉक्स एंड कॉक्स (2001), पी 43-44 उद्धृत कर रहा हूं:
एक प्रिंसिपल कंपोनेंट्स एनालिसिस और PCO [प्रिंसिपल कोऑर्डिनेट एनालिसिस, उर्फ़ क्लासिकल MDS] के बीच एक द्वंद्व है, जहाँ यूक्लिडियन डिस्टेंस द्वारा असमानताएँ दी जाती हैं।
कॉक्स एंड कॉक्स में अनुभाग इसे बहुत स्पष्ट रूप से समझाता है:
same results as classical MDS
। "शास्त्रीय एमडीएस" के द्वारा आपको यहाँ Torgerson के MDS का अर्थ होना चाहिए। फिर बयान वास्तव में सच है के लिए Torgerson के एमडीएस है (केवल दूरी मैट्रिक्स से शुरू) वास्तव में पीसीए। यदि "शास्त्रीय एमडीएस" को अलग तरह से परिभाषित करें (मेरा उत्तर देखें) तो कथन सत्य नहीं है।
तुलना: "मीट्रिक एमडीएस पीसीए के रूप में एक ही परिणाम देता है" - प्रक्रियात्मक रूप से- जब हम एसवीडी को इष्टतम प्राप्त करने के लिए उपयोग किए जाने वाले तरीके को देखते हैं। लेकिन, संरक्षित उच्च-आयामी मानदंड अलग है। पीसीए एक केंद्रित कोवरियन मैट्रिक्स का उपयोग करता है जबकि एमडीएस डबल-सेंटरिंग दूरी मैट्रिस द्वारा प्राप्त एक ग्राम मैट्रिक्स का उपयोग करता है।
अंतर को गणितीय रूप से रखा जाएगा: पीसीए को अधिकतम रूप में देखा जा सकता है