मुझे क्लस्टर विश्लेषण करने के लिए चर की संख्या कम करनी होगी। मेरे चर दृढ़ता से सहसंबद्ध हैं, इसलिए मैंने एक कारक विश्लेषण पीसीए (प्रमुख घटक विश्लेषण) करने के लिए सोचा । हालांकि, यदि मैं परिणामी अंकों का उपयोग करता हूं, तो मेरे क्लस्टर सही नहीं हैं (साहित्य में पिछले वर्गीकरणों की तुलना में)।
सवाल:
क्या मैं प्रत्येक घटक / कारक के लिए सबसे बड़े भार के साथ चर का चयन करने के लिए रोटेशन मैट्रिक्स का उपयोग कर सकता हूं और मेरी क्लस्टरिंग के लिए केवल इन चर का उपयोग कर सकता हूं?
कोई ग्रंथ सूची संदर्भ भी सहायक होगा।
अपडेट करें:
कुछ स्पष्टीकरण:
मेरा लक्ष्य: मुझे SPSS द्वारा द्वि-चरणीय एल्गोरिथ्म के साथ क्लस्टर विश्लेषण चलाना है, लेकिन मेरे चर स्वतंत्र नहीं हैं, इसलिए मैंने उनमें से कुछ को त्यागने के बारे में सोचा।
मेरा डेटासेट: मैं 100,000 मामलों के 15 स्केलर मापदंडों (मेरे चर) पर काम कर रहा हूं। कुछ चर दृढ़ता से सहसंबद्ध होते हैं ( पियर्सन)
मेरा संदेह: चूंकि मुझे केवल स्वतंत्र चर की आवश्यकता है, इसलिए मैंने एक प्रिंसिपल कंपोनेंट एनालिसिस चलाने के बारे में सोचा (क्षमा करें: मैंने अपने मूल प्रश्न, मेरी गलती के फैक्टर एनालिसिस के बारे में गलत तरीके से बात की) और प्रत्येक घटक के लिए सबसे बड़े लोडिंग वाले केवल चर का चयन करें। मुझे पता है कि पीसीए प्रक्रिया कुछ मनमाने कदमों को प्रस्तुत करती है, लेकिन मुझे पता चला कि यह चयन वास्तव में " विधि बी 4 " के समान है, जिसे आईटी जोलीफे (1972 और 2002) द्वारा प्रस्तावित किया गया था, चर का चयन करने के लिए और 1999 में जेआर किंग और डीए जैक्सन द्वारा भी सुझाव दिया गया था। ।
इसलिए मैं इस तरह से स्वतंत्र चर के कुछ उप-समूहों का चयन करने के लिए सोच रहा था। मैं तब समूहों का उपयोग विभिन्न क्लस्टर विश्लेषण चलाने के लिए करूंगा और मैं परिणामों की तुलना करूंगा।