पीसीए या कारक विश्लेषण में तिरछा चर


9

मैं 22 चर पर आधारित SPSS पर प्रमुख घटक विश्लेषण (कारक विश्लेषण) करना चाहता हूं। हालाँकि, मेरे कुछ चर बहुत तिरछे हैं (एसपीएसएस से गणना की गई तिरछी दूरी 2-80 तक है!)।

तो यहाँ मेरे सवाल हैं:

  1. क्या मुझे तिरछे चरों को वैसा ही रखना चाहिए या क्या मैं मुख्य घटक विश्लेषण पर चर को बदल सकता हूं? यदि हाँ, तो मैं कारक स्कोर की व्याख्या कैसे करूँगा?

  2. मुझे किस प्रकार का परिवर्तन करना चाहिए? log10 या ln?

  3. मूल रूप से, मेरा KMO (कैसर-मेयर-ओल्किन) 0.413 है। बहुत से साहित्य न्यूनतम 0.5 की सिफारिश करते हैं। क्या मैं अभी भी कारक विश्लेषण कर सकता हूं, या क्या मुझे अपने KMO को 0.5 तक बढ़ाने के लिए चर निकालने की आवश्यकता है?


5
एक नोट: पीसीए कारक विश्लेषण के समान नहीं है। पीसीए एक डेटा कमी विधि है, एफए अव्यक्त चर खोजने का एक प्रयास है। वे अक्सर (लेकिन हमेशा नहीं) समान परिणाम दे
पीटर Flom

जवाबों:


9
  1. पीसीए में तिरछापन का मुद्दा प्रतिगमन में समान है: लंबी पूंछ, यदि यह वितरण की पूरी श्रृंखला के सापेक्ष वास्तव में लंबे समय तक है, तो वास्तव में एक बड़ी रूपरेखा की तरह व्यवहार करती है - यह फिट लाइन (आपके मामले में प्रमुख घटक) को जोर से खींचती है स्वयं क्योंकि इसका प्रभाव बढ़ाया जाता है; इसके प्रभाव को बढ़ाया जाता है क्योंकि यह अभी तक माध्य से दूर है। पीसीए के संदर्भ में बहुत तिरछी चर की अनुमति देना डेटा को केंद्रित किए बिना पीसीए करने के समान है (यानी, सहसंबंध मैट्रिक्स के बजाय कोसाइन मैट्रिक्स के आधार पर पीसीए करना)। यह वह है जो यह तय करता है कि परिणामों को प्रभावित करने के लिए लंबी पूंछ को अनुमति दें या नहीं (और डेटा रहने दें) या नहीं (और डेटा को रूपांतरित करें)। मुद्दा यह नहीं है कि आप लोडिंग की व्याख्या कैसे करते हैं।

  2. जैसा आपको पसंद।

  3. केएमओ एक सूचकांक है जो आपको बताता है कि कारक विश्लेषण के लिए डेटा जमा करने के लिए आंशिक सहसंबंध बहुत कम हैं या नहीं। क्योंकि कारक विश्लेषण में हम आमतौर पर एक कारक को केवल दो चर से अधिक लोड करने की अपेक्षा करते हैं । आपका KMO काफी कम है। आप इसे बेहतर बना सकते हैं यदि आप कम व्यक्तिगत KMO मानों के विश्लेषण चर से गिरते हैं (ये एंटी-इमेज मैट्रिक्स के विकर्ण बनाते हैं , तो आप इस मैट्रिक्स को SPSS फैक्टर प्रक्रिया में दिखाने का अनुरोध कर सकते हैं)। कम तिरछे में चर ट्रांसफॉर्मिंग KMO पुनर्प्राप्त कर सकते हैं? कौन जाने। शायद। ध्यान दें कि KMO ज्यादातर फैक्टर एनालिसिस मॉडल में महत्वपूर्ण है, प्रिंसिपल कंपोनेंट्स एनालिसिस मॉडल में नहीं: FA में आप जोड़ी वाइज कॉर्डिनेशन फिट करते हैं, जबकि PCA में आप नहीं।


2

+1 से @ttnphns, मैं बस बिंदु # 2 पर थोड़ा विस्तार करना चाहता हूं। रूपांतरण को अक्सर तिरछा स्थिर करने के लिए उपयोग किया जाता है। जैसा कि @ttnphns बताते हैं, अपने विश्लेषण चलाने से पहले आप इनका उपयोग करेंगे । लॉग ट्रांसफॉर्मेशन पावर ट्रांसफॉर्मेशन के बॉक्स-कॉक्स परिवार का हिस्सा हैं। आप केवल लॉग (जैसे, वर्गमूल, पारस्परिक, आदि) की तुलना में संभावित परिवर्तनों की एक विस्तृत श्रृंखला पर विचार करना चाहेंगे। विभिन्न लॉगरिदमिक ठिकानों के बीच विकल्प परिवर्तन की ताकत पर कोई प्रभाव नहीं पड़ता है। जब लोग परिवर्तनशील चर के साथ गणितीय रूप से काम करने जा रहे हैं, तो प्राकृतिक लॉग को कभी-कभी पसंद किया जाता है, क्योंकि प्राकृतिक लॉग कुछ मामलों में क्लीनर गणित के लिए बना सकता है। यदि आप इस बारे में परवाह नहीं करते हैं, तो आप एक आधार चुनना चाहते हैं जो व्याख्या की सुविधा प्रदान करेगा। यही है, नए पैमाने में प्रत्येक इकाई वृद्धि एक आधार का प्रतिनिधित्व करेगीमूल पैमाने में कई गुना वृद्धि (उदाहरण के लिए, यदि आप लॉग बेस 2 का उपयोग करते हैं, तो प्रत्येक इकाई में 2 गुना वृद्धि होगी, आधार 10 का अर्थ है प्रत्येक इकाई में 10 गुना वृद्धि होगी, आदि), इसलिए यह अच्छा हो सकता है एक आधार चुनने के लिए कि आपका डेटा रूपांतरित पैमाने में कई इकाइयों को फैलाएगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.