कारक विश्लेषण से पहले कारक अधिकतम क्या हैं?


12

प्रमुख घटक विश्लेषण में, पहले प्रमुख घटक अधिकतम विचरण के साथ orthogonal निर्देश हैं। दूसरे शब्दों में, पहले मुख्य घटक को अधिकतम विचरण की दिशा के लिए चुना जाता है, दूसरे प्रमुख घटक को अधिकतम विचरण के साथ पहली दिशा में रूढ़िवादी चुना जाता है, और इसी तरह।कश्मीरkk

क्या कारक विश्लेषण के लिए एक समान व्याख्या है? उदाहरण के लिए, मैं सोच रहा हूं कि पहले कारक मूल सहसंबंध मैट्रिक्स के ऑफ-विकर्ण घटकों को स्पष्ट करने वाले कारक हैं ( मूल सहसंबंध मैट्रिक्स के बीच चुकता त्रुटि और कहे जाने वाले सहसंबंध मैट्रिक्स के बीच ऑनलाइन परिभाषित) घटक)। क्या यह सच है (या ऐसा ही कुछ है जो हम कह सकते हैं)?k


जबकि मैं उनके उत्तर (+1) में लिखे गए लगभग सब कुछ से सहमत हूं (+1), आपके अंतिम प्रश्न का संक्षिप्त उत्तर यह है कि हां, यह बिल्कुल सच है । ध्यान दें कि एफए कारकों में भी ऑर्थोगोनल होने के लिए चुना जा सकता है, जैसा कि पीसीए में। अंतर केवल पूरे सहसंबंध मैट्रिक्स (पीसीए) बनाम केवल अपने ऑफ-विकर्ण भाग (एफए) को पुन: पेश करने में है। अधिक चर्चा के लिए पीसीए और फैक्टर एनालिसिस की समानता के लिए शर्तों में मेरे जवाब देखें और क्या ईएफए के बजाय पीसीए का उपयोग करने का कोई अच्छा कारण है?
अमीबा का कहना है कि

मुझे यकीन नहीं है कि क्या एफए वास्तव में "न्यूनतम राशि का () -समय आंशिक आंशिक सहवास" करता है, क्योंकि "मिनो" नामक एक रोटेशन / निष्कर्षण-मानदंड है जिसका औचित्य बिल्कुल यही है। फिर इसे एक विशिष्ट नाम क्यों दिया जाए? शायद एफए-समाधान खोजने के लिए मानक-रूट गणितीय रूप से समान परिणाम प्राप्त करते हैं यदि कश्मीर कारकों की संख्या पूरी तरह से कोवियर्स को पुन: उत्पन्न करती है, लेकिन कश्मीर एक अनुमान है, तो यह हो सकता है कि अपूर्णता के मामले में / एफए-समाधान कम नहीं है। मिनस-सॉल्यूशन के समान। खैर, मैं कहता हूं: हो सकता है - मैं एक विस्फोटक बयान देखना चाहता हूं।
हेल्स

जवाबों:


7

पीसीए मुख्य रूप से एक डेटा कमी तकनीक है जहां उद्देश्य कम आयामी स्थान पर डेटा का प्रक्षेपण प्राप्त करना है। दो समतुल्य उद्देश्य या तो पुनरावृत्ति को अधिकतम करना या पुनर्निर्माण त्रुटि को कम करना है। इस पिछले प्रश्न के उत्तर में कुछ विवरणों में वास्तव में काम किया गया है ।

इसके विपरीत, कारक विश्लेषण मुख्य रूप से एक के एक उत्पादक मॉडल है आयामी डेटा वेक्टर कह रही है कि जहां है अव्यक्त कारकों में से आयामी वेक्टर, है के साथ और असंबद्ध त्रुटियों का एक वेक्टर है। मैट्रिक्स के मैट्रिक्स है कारक लोडिंग । यह सहसंयोजक मैट्रिक्स के एक विशेष पैरामीरिजेशन को के रूप में प्राप्त करता है इस मॉडल के साथ समस्या यह है कि यह ओवरप्रेमेट्रिज है। यदि द्वारा प्रतिस्थापित किया जाता है तो वही मॉडल प्राप्त किया जाता हैएक्स एक्स = एक एस + ε एस क्यू पी × कश्मीर कश्मीर < p ε एक Σ = एक एक टी + डी आर कश्मीर × कश्मीर आर ΣpX

X=AS+ϵ
SqAp×kk<pϵA
Σ=AAT+D
AAR किसी भी orthogonal मैट्रिक्स , जिसका अर्थ है कि कारक स्वयं अद्वितीय नहीं हैं। विभिन्न सुझाव इस समस्या को हल करने के लिए मौजूद हैं, लेकिन वहाँ नहीं एकमात्र समाधान है कि आप व्याख्या की तरह आप के लिए पूछने के साथ कारकों देता है। एक लोकप्रिय विकल्प varimax रोटेशन है। हालांकि, उपयोग की जाने वाली कसौटी केवल रोटेशन को निर्धारित करती है। द्वारा फैलाया गया स्तंभ स्थान नहीं बदलता है, और चूंकि यह पैरामीरीज़ेशन का हिस्सा है, यह गेसियन मॉडल में अधिकतम संभावना द्वारा का अनुमान लगाने के लिए जो भी विधि का उपयोग किया जाता है, द्वारा निर्धारित किया जाता है ।k×kRAΣ

इसलिए, प्रश्न का उत्तर देने के लिए, चुने गए कारकों को एक कारक विश्लेषण मॉडल का उपयोग करने से स्वचालित रूप से नहीं दिया जाता है, इसलिए पहले कारकों की एक भी व्याख्या नहीं है। आपको अनुमान लगाने के लिए उपयोग की जाने वाली विधि (कॉलम का स्थान) और रोटेशन को चुनने के लिए उपयोग की जाने वाली विधि को निर्दिष्ट करना होगा । यदि (सभी त्रुटियों में एक ही भिन्नता है) के स्तंभ स्थान के लिए MLE समाधान प्रमुख प्रमुख घटक वैक्टर द्वारा फैलाया गया स्थान है, जो एक विलक्षण मूल्य अपघटन द्वारा पाया जा सकता है। बेशक, इन प्रमुख घटक वैक्टर को घूमने और रिपोर्ट करने के लिए कारकों के रूप में नहीं चुनना संभव है। A D = σ 2 I A qkAD=σ2IAq

संपादित करें: मैं इसे कैसे देखता हूं, इस पर जोर देने के लिए, कारक विश्लेषण मॉडल कोविएर मैट्रिक्स का एक मॉडल है जो रैंक मैट्रिक्स के साथ-साथ एक विकर्ण मैट्रिक्स है। इस प्रकार मॉडल के साथ उद्देश्य कोवरियन मैट्रिक्स पर इस तरह की संरचना के साथ सहसंयोजक को स्पष्ट करना है । व्याख्या यह है कि सहसंयोजक मैट्रिक्स पर इस तरह की संरचना एक अनबॉस्स्ड आयामी कारक के साथ संगत है। दुर्भाग्य से, कारकों को विशिष्ट रूप से पुनर्प्राप्त नहीं किया जा सकता है, और उन्हें संभावित कारकों के सेट के भीतर कैसे चुना जा सकता है, डेटा के स्पष्टीकरण के लिए किसी भी तरह से संबंधित नहीं है। जैसा कि पीसीए के साथ होता है, कोई डेटा अपफ्रंट को मानकीकृत कर सकता है और इस तरह एक मॉडल फिट होता है जो सहसंबंध मैट्रिक्स को रैंक प्लस एक विकर्ण मैट्रिक्स के रूप में समझाने का प्रयास करता है । k kkkk


1
हां, मैं समझता हूं कि k कारकों का एक अनूठा विकल्प नहीं है (क्योंकि हम उन्हें घुमा सकते हैं और समान मॉडल प्राप्त कर सकते हैं)। लेकिन क्या कारक विश्लेषण द्वारा चुने गए k कारकों में से कोई भी विकल्प "सहसंबंध की अधिकतम व्याख्या" करता है?
राएगटिन

1
@raegtin, मैंने अपनी बात समझाने के लिए उत्तर को संपादित किया है, कि यह सहसंयोजक मैट्रिक्स का एक मॉडल है। घूर्णन द्वारा प्राप्त कारकों में से कोई भी विकल्प, जैसा कि मैं इसे देखता हूं, डेटा में सहसंयोजकों को समझाने के लिए उतना ही अच्छा या बुरा है जितना वे एक ही सहसंयोजक मैट्रिक्स का उत्पादन करते हैं।
एनआरएच

1
अद्यतन के लिए धन्यवाद, यह एफए की एक महान व्याख्या है! इसलिए जब आप कहते हैं कि "मॉडल के साथ उद्देश्य कोविरेंस को स्पष्ट करना है", तो क्या आपको लगता है कि कश्मीर कारक वास्तव में व्याख्या किए गए सह-प्रसार की मात्रा को अधिकतम करते हैं?
राएगेटिन

1
@raegtin, हां, मैं मॉडल को कोवरियन मैट्रिक्स के मॉडल के रूप में देखता हूं, और जब आप मॉडल का अनुमान लगाते हैं, तो यह कहना उचित है कि आप व्याख्या किए गए कोवरियन की मात्रा को अधिकतम कर रहे हैं।
NRH

@raegtin और NRH (+1 btw): बस स्पष्ट करने के लिए। दो टिप्पणियों से ऊपर सही है अगर "सहसंयोजक" द्वारा हम "सहसंयोजक मैट्रिक्स के ऑफ-विकर्ण भाग" को समझते हैं।
अमीबा का कहना है कि मोनिका

3

@RAEGTIN, मेरा मानना ​​है कि आप सही सोचते हैं। निष्कर्षण और पूर्व रोटेशन के बाद, प्रत्येक उत्तरोत्तर कारक कम और covariation / सहसंबंध के कम के लिए खाते करता है, जैसे प्रत्येक उत्तरोत्तर घटक कम और विचरण के कम के लिए खातों: दोनों ही मामलों में, एक लोड हो रहा है मैट्रिक्स के कॉलम एक के पतन के क्रम में जाने उन में वर्ग तत्वों (भार) का योग। लोड हो रहा है सहसंबंध बीडब्ल्यू कारक और चर; इसलिए एक कह सकता है कि 1 कारक आर मैट्रिक्स में "समग्र" वर्ग r का सबसे बड़ा हिस्सा बताता है , दूसरा कारक यहाँ दूसरा है, आदि। एफए और पीसीए के बीच अंतर, हालांकि, लोडिंग द्वारा सहसंबंधों की भविष्यवाणी में निम्नानुसार है: एफए आर को पुनर्स्थापित करने के लिए "कैलिब्रेटेड" हैकेवल एम निकाले गए कारकों (एम कारकों <पी चर) के साथ काफी बारीक, जबकि पीसीए इसे एम घटकों द्वारा बहाल करने में असभ्य है, - इसे आर के बिना त्रुटि को बहाल करने के लिए सभी पी घटकों की आवश्यकता है ।

पुनश्च बस जोड़ने के लिए। एफए में, एक लोडिंग वैल्यू में स्वच्छ सांप्रदायिकता (सहसंबंध के लिए जिम्मेदार विचरण का एक हिस्सा) शामिल है, जबकि पीसीए में एक लोडिंग कम्युनिटी और चर की असमानता का मिश्रण है और इसलिए परिवर्तनशीलता को पकड़ता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.