@gung आपको दूरस्थ मैट्रिक्स से डेटा बनाने के लिए प्रारंभिक उपकरण के रूप में बहुआयामी स्केलिंग (MDS) का सुझाव देते हुए बिल्कुल सही है points X dimensions
। मुझे बस कुछ स्ट्रोक जोड़ने हैं। K- साधन क्लस्टरिंग का मतलब यूक्लिडियन दूरियां है । एमडीएस आपको पॉइंट-इन-डायमेंशन निर्देशांक देगा जिससे आपको यूक्लिडियन दूरी की गारंटी मिलेगी। आपको मीट्रिक एमडीएस का उपयोग करना चाहिए और यथासंभव आयामों की संख्या का अनुरोध करना चाहिए, क्योंकि आपका उद्देश्य डेटा को पुन: संयोजित करने की त्रुटि को कम करना है, न कि इसे 2 डी या 3 डी में मैप करना।
क्या होगा यदि आपके पास एमडीएस सॉफ़्टवेयर नहीं है, लेकिन कुछ मैट्रिक्स फ़ंक्शन हैं जैसे कि eigenvalue अपघटन या एकवचन-मूल्य अपघटन? फिर आप स्वयं साधारण मीट्रिक एमडीएस कर सकते हैं - टॉर्गरसन एमडीएस, जिसे प्रिंसिपल कोऑर्डिनेट्स एनालिसिस (पीसीओए) के रूप में भी जाना जाता है। यह प्रिंसिपल कंपोनेंट्स एनालिसिस के लिए थोड़ा "ट्विस्टेड" होता है। मैं यहाँ इसका वर्णन नहीं करूँगा, हालाँकि यह काफी सरल है। आप इसके बारे में कई जगहों पर पढ़ सकते हैं, जैसे यहाँ ।
अंत में, सीधे पीसीओए या किसी अन्य मेट्रिक एमडीएस को करने वाले कार्यों को कॉल करने या लिखने के बिना - "दूरी मैट्रिक्स इनपुट के लिए के-साधन" प्रोग्राम करना संभव है । हम जानते हैं, कि (ए) केन्द्रक से वर्ग विचलन का योग, अंकों की संख्या से विभाजित जोड़ीदार वर्ग यूक्लिडियन की राशि के बराबर है ; और (b) पता है कि दूरी मैट्रिक्स से बाहर क्लस्टर सेंट्रोइड्स के बीच की दूरी की गणना कैसे करें ; (c) और हम आगे जानते हैं कि S-of-squares K- साधनों में किस प्रकार परस्पर जुड़े हैं। यह सब एक साथ एल्गोरिथ्म के लेखन को बनाता है जिसे आप एक सीधा और एक जटिल उपक्रम चाहते हैं। हालांकि यह याद रखना चाहिए कि K- साधन केवल यूक्लिडियन दूरी / यूक्लिडियन स्थान के लिए है। गैर-यूक्लिडियन दूरियों के लिए के-मेडोइड या अन्य तरीकों का उपयोग करें।
एक ऐसा ही सवाल ।