कारक विश्लेषण में सर्वोत्तम कारक निष्कर्षण विधियाँ

SPSS कारक निष्कर्षण के कई तरीके प्रदान करता है:

प्रमुख घटक (जो कारक विश्लेषण बिल्कुल नहीं है)
कम से कम वर्ग
सामान्यीकृत कम से कम वर्ग
अधिकतम संभाव्यता
मुख्य धुरी
अल्फा फैक्टरिंग
छवि फैक्टरिंग

पहला तरीका अनदेखा करना, जो कि कारक विश्लेषण नहीं है (लेकिन प्रमुख घटक विश्लेषण, पीसीए), इनमें से कौन सा तरीका "सबसे अच्छा" है? विभिन्न तरीकों के सापेक्ष लाभ क्या हैं? और मूल रूप से, मैं कैसे चुनूंगा कि किसका उपयोग करना है?

अतिरिक्त प्रश्न: क्या सभी 6 विधियों से समान परिणाम प्राप्त करना चाहिए?

spss pca factor-analysis

— Placidia
स्रोत

हम्म, मेरा पहला आवेग: इस पर एक विकिपीडिया प्रविष्टि नहीं है? यदि नहीं - निश्चित रूप से वहाँ मौजूद होना चाहिए ...

— Gottfried Helms

हाँ, एक विकिपीडिया लेख है। यह MLE का उपयोग करने के लिए कहता है यदि डेटा सामान्य है और पीएएफ अन्यथा। यह गुण या अन्य विकल्पों के बारे में बहुत कुछ नहीं कहता है। किसी भी मामले में, मुझे यह जानकर खुशी होगी कि इस साइट के सदस्य अपने व्यावहारिक अनुभव के आधार पर इस मुद्दे पर क्या सोचते हैं।

— प्लेसीडिया

इसे छोटा करना। दो अंतिम विधियाँ 2-5 संख्याओं से प्रत्येक बहुत विशेष और भिन्न हैं। वे सभी सामान्य कारक विश्लेषण कहलाते हैं और वास्तव में विकल्प के रूप में देखे जाते हैं। ज्यादातर समय, वे समान परिणाम देते हैं। वे "सामान्य" हैं क्योंकि वे शास्त्रीय कारक मॉडल का प्रतिनिधित्व करते हैं , सामान्य कारक + अद्वितीय कारक मॉडल। यह वह मॉडल है जो आम तौर पर प्रश्नावली विश्लेषण / सत्यापन में उपयोग किया जाता है।

प्रिंसिपल एक्सिस (पीएएफ) , उर्फ प्रिंसिपल फैक्टर पुनरावृत्तियों के साथ सबसे पुराना और शायद अभी तक काफी लोकप्रिय तरीका है। यह मैट्रिक्स के लिए पुनरावृत्त PCA अनुप्रयोग है जहां सांप्रदायिकता 1s या भिन्न के स्थान पर विकर्ण पर खड़ी होती है। प्रत्येक अगली पुनरावृत्ति इस प्रकार सांप्रदायिकता को और अधिक परिष्कृत करती है जब तक वे अभिसरण नहीं करती हैं। ऐसा करने में, विधि जो विचरण को स्पष्ट करने की कोशिश करती है, जोड़ीदार सहसंबंध नहीं। प्रिंसिपल एक्सिस विधि में यह फायदा है कि यह पीसीए की तरह, न केवल सहसंबंधों का विश्लेषण कर सकता है, बल्कि सहसंबंधों और अन्य $^1$ एसएससीपी उपाय (कच्चे एससीपीपी, कोजाइन) है। बाकी तीन तरीके केवल सहसंबंधों [एसपीएसएस] में प्रक्रिया करते हैं; covariances का कुछ अन्य कार्यान्वयनों में विश्लेषण किया जा सकता है]। यह विधि सांप्रदायिकता के अनुमानों की शुरुआत की गुणवत्ता पर निर्भर है (और यह इसका नुकसान है)। आमतौर पर चुकता बहु सहसंबंध / सहसंयोजक का उपयोग प्रारंभिक मूल्य के रूप में किया जाता है, लेकिन आप अन्य अनुमानों (पिछले शोध से लिया गया सहित) को पसंद कर सकते हैं। कृपया इसे और अधिक पढ़ें । यदि आप प्रिंसिपल अक्ष फैक्टरिंग संगणना, पीसीए अभिकलन के साथ तुलना और टिप्पणी के उदाहरण देखना चाहते हैं, तो कृपया यहां देखें ।

साधारण या बिना कम से कम वर्ग (ULS) वह एल्गोरिथ्म है जो सीधे इनपुट सहसंबंध मैट्रिक्स के बीच अवशिष्टों को कम से कम करने और कारकों (प्रजनन द्वारा) सहसंबंध मैट्रिक्स (जबकि विकर्ण तत्वों को सांप्रदायिकता और विशिष्टता के योग के रूप में 1s बहाल करने के उद्देश्य से है) । यह एफए का सीधा काम है $^2$ । ULS पद्धति एकवचन के साथ काम कर सकती है और यहां तक कि सहसंबंधों के सकारात्मक अर्धचालक मैट्रिक्स भी नहीं प्रदान की जाती है, क्योंकि कारकों की संख्या इसकी रैंक से कम है, - हालांकि यह संदेहास्पद है यदि सैद्धांतिक रूप से एफए उपयुक्त है।

सामान्यीकृत या भारित कम से कम वर्ग (जीएलएस) पिछले एक का एक संशोधन है। अवशिष्टों को कम करते समय, यह सहसंबंध गुणांक को वज़न से अलग करता है: उच्च असमानता (वर्तमान पुनरावृत्ति पर) के साथ चर के बीच संबंध कम वजन दिए जाते हैं । इस विधि का उपयोग करें यदि आप चाहते हैं कि आपके कारक अत्यधिक विशिष्ट चर (यानी जो कारकों द्वारा कमजोर रूप से संचालित होते हैं) को अत्यधिक सामान्य चर (यानी कारकों द्वारा दृढ़ता से संचालित ) से बदतर हों । यह इच्छा असामान्य नहीं है, विशेष रूप से प्रश्नावली निर्माण प्रक्रिया में (कम से कम मुझे ऐसा लगता है), इसलिए यह संपत्ति लाभप्रद । $^3$ $^4$

अधिकतम संभावना (एमएल)डेटा मानता है (सहसंबंध) बहुभिन्नरूपी सामान्य वितरण वाली जनसंख्या से आया है (अन्य विधियां ऐसी कोई धारणा नहीं बनाते हैं) और इसलिए सहसंबंध गुणांक के अवशेषों को सामान्य रूप से लगभग 0 वितरित किया जाना चाहिए। लोडिंग उपरोक्त अनुमान के तहत एमएल दृष्टिकोण द्वारा पुनरावृत्तियों का अनुमान है। सहसंबंधों का उपचार सामान्य रूप से कम से कम वर्गों की विधि में उसी तरह से असमानता से भारित होता है। जबकि अन्य विधियां केवल नमूने का विश्लेषण करती हैं जैसा कि है, एमएल विधि जनसंख्या के बारे में कुछ अनुमानों की अनुमति देती है, आमतौर पर फिट सूचकांकों और आत्मविश्वास अंतराल की एक संख्या इसके साथ गणना की जाती है [दुर्भाग्य से, ज्यादातर एसपीएसएस में नहीं, हालांकि लोग एसपीएसएस के लिए मैक्रोज़ लिखते हैं] यह]।

मेरे द्वारा बताए गए सभी तरीके रैखिक, निरंतर अव्यक्त मॉडल हैं। "रैखिक" का अर्थ है कि सहसंबंधों को रैंक करना, उदाहरण के लिए, विश्लेषण नहीं किया जाना चाहिए। "निरंतर" का तात्पर्य है कि द्विआधारी डेटा, उदाहरण के लिए, विश्लेषण नहीं किया जाना चाहिए (आईआरटी या एफए टेट्राकोरिक सहसंबंधों के आधार पर अधिक उपयुक्त होगा)।

$^1$ क्योंकि सहसंबंध (या सहसंयोजक) मैट्रिक्स $\bf R$ , - इसके विकर्ण पर प्रारंभिक सांप्रदायिकताएं रखे जाने के बाद, आमतौर पर कुछ नकारात्मक स्वदेशी होंगे, इन्हें साफ रखा जाना चाहिए; इसलिए पीसीए ईजन-अपघटन द्वारा किया जाना चाहिए, एसवीडी नहीं।

$^2$ $\bf u^2$

$^3$ $\bf uR^{-1}u$ $\bf u^{-1}Ru^{-1}$

$^4$

— ttnphns
स्रोत

मुझे लगता है, एक और पहलू को जोड़ना चाहिए: क्या हम कारकों के एक निर्धारित समाधान के लिए एक कारक समाधान को फिट करने के लिए तरीकों का उपयोग करते हैं, या क्या कारकों की संख्या डेटा से उभरनी चाहिए, कुछ मानदंड (eigenvalue, screetest, ...) । जैसा कि मैं समझता हूं, एमएल केवल कामुक है यदि आप कई कारकों को निर्धारित करते हैं, और फिर एक कारक समाधान की मांग की जाएगी, और यहां तक कि ची-स्क्वायर-टेस्ट भी संभव है। पीसीए डेटा-गुणों द्वारा कारकों की संख्या को गतिशील रूप से प्रकट करने देता है, कुछ मानदंड, कोई ची-स्क्वायर परीक्षण नहीं। पीएएफ का उपयोग दोनों तरीकों से किया जा सकता है।

— गॉटफ्रीड हेल्स

@Gottfried, मैं आपके द्वारा डाले गए तरीके से असहमत हूँ। सभी एफए तरीकों की आवश्यकता होती है कारकों की संख्या मीटर में जाना जाता है: आप के लिए मॉडल फिट मीटर अधिक हो जाए। आप विभिन्न मानदंडों का उपयोग कर सकते हैं जो मी पर निर्णय लेने में मदद कर सकते हैं , लेकिन ये सभी स्वयं कारक निष्कर्षण विधियों का हिस्सा नहीं हैं। उस ची-स्क्वायर के अपवाद के साथ, जीएलएस और एमएल तरीकों के साथ गणना की गई। इसके अलावा, पीए विधि के साथ, यदि आप पहले से ही सच्ची सांप्रदायिकता जानते हैं (जो बहुत ही कम है), तो आप उन्हें सर्वश्रेष्ठ मी की ओर मार्गदर्शन करने के लिए बना सकते हैं । लेकिन किसी भी मामले में, इसके आप, एक निष्कर्षण एल्गोरिथ्म नहीं, मीटर पर निर्णय लेते हैं ।

— tnnphns

अब हमें क्या उपयोग करना चाहिए? कौन सा सबसे अच्छा है?

— श्रीमानमनाथ

सबसे अच्छा वही है जो आपको सबसे अच्छा लगता है। आप चुनते हैं, तो यदि आपको यह समझाने की आवश्यकता है कि यह आपके अनुरूप क्यों है। जैसा हर जगह है।

— ttnphns

@ ttnphns, का एक सिद्धांत है when to use which?

— किटीगर्ल