प्रिंसिपल कंपोनेंट एनालिसिस और फैक्टर एनालिसिस के बीच के अंतर को मल्टीवेरेट तकनीकों पर कई पाठ्यपुस्तकों और लेखों में चर्चा की जाती है। आपको इस साइट पर पूर्ण थ्रेड , और एक नया और विषम उत्तर मिल सकते हैं ।
मैं इसे विस्तृत करने नहीं जा रहा हूं। मैंने पहले ही एक संक्षिप्त जवाब और एक लंबा एक दिया है और अब इसे चित्रों की एक जोड़ी के साथ स्पष्ट करना चाहेंगे।
सचित्र प्रदर्शन
नीचे दी गई तस्वीर पीसीए की व्याख्या करती है । (यह यहाँ से उधार लिया गया था जहाँ PCA की तुलना रैखिक प्रतिगमन और Canonical सहसंबंधों के साथ की जाती है। चित्र विषय स्थान में चरों के सदिश निरूपण है ; यह समझने के लिए कि आप वहां दूसरा पैराग्राफ पढ़ना चाहते हैं।)
इस तस्वीर पर पीसीए विन्यास वर्णित किया गया था वहाँ । मैं ज्यादातर प्रमुख बातें दोहराऊंगा। मुख्य घटक और उसी स्थान पर स्थित हैं जो चर और , "विमान X" द्वारा फैलाया जाता है । चार वैक्टरों में से प्रत्येक की चौकोर लंबाई इसकी भिन्नता है। के बीच सहप्रसरण और है , जहां उनके वैक्टर बीच कोण की कोज्या के बराबर होती है।P1P2 X1X2X1X2cov12=|X1||X2|rr
घटकों पर अनुमानों (निर्देशांक) चर का, 'है, चर पर घटकों के लोडिंग कर रहे हैं: लोडिंग मॉडलिंग के रैखिक संयोजन में प्रतिगमन गुणांक हैं मानकीकृत घटकों द्वारा चर । "मानकीकृत" - क्योंकि घटकों के परिवर्तन के बारे में जानकारी पहले से ही लोडिंग में अवशोषित हो जाती है (याद रखें, लोडिंग eigenvectors संबंधित eigenvalues के लिए सामान्यीकृत हैं)। और उसके कारण, और इस तथ्य से कि घटक असंबंधित हैं, लोडिंग चर और घटकों के बीच सहसंयोजक हैं।a
पीसीए का उपयोग / डेटा में कमी के उद्देश्य से हमें केवल को बनाए रखने और को शेष या त्रुटि के रूप में लिए मजबूर करता है । विचरण पर कब्जा कर लिया है (समझाया गया है) द्वारा ।P1P2a211+a221=|P1|2P1
नीचे दी गई तस्वीर फैक्टर विश्लेषण को उसी चर और करती है जिसके साथ हमने ऊपर पीसीए किया था। (मैं सामान्य कारक मॉडल की बात करूंगा , क्योंकि वहां अन्य मौजूद हैं: अल्फा फैक्टर मॉडल, छवि कारक मॉडल।) स्माइली सूरज प्रकाश व्यवस्था के साथ मदद करता है।X1X2
सामान्य कारक । यह वही है जो ऊपर मुख्य घटक का एनालॉग है । क्या आप इन दोनों में अंतर देख सकते हैं? हां, स्पष्ट रूप से: कारक चर अंतरिक्ष "विमान एक्स" में झूठ नहीं है ।FP1
एक कारक के साथ उस कारक को कैसे प्राप्त करें, अर्थात कारक विश्लेषण करने के लिए? कोशिश करते हैं। पिछली तस्वीर पर, अपने नाखून टिप द्वारा तीर के अंत को हुक करें और "प्लेन X" से दूर खींचें, जबकि दो नए प्लेन दिखाई देते हैं, "प्लेन U1" और "प्लेन U2"; ये जोड़ने वाले वेक्टर और दो वैरिएबल वैक्टर को जोड़ते हैं। "प्लेन X" के ऊपर दो प्लेन एक हुड, X1 - F - X2 बनाते हैं।P1
हुड पर विचार करते समय खींचना जारी रखें और जब "विमान U1" और "विमान U2" 90 डिग्री के बीच रुकें। तैयार, कारक विश्लेषण किया जाता है। खैर, हाँ, लेकिन अभी तक आशावादी नहीं है। इसे सही करने के लिए, जैसे कि पैकेज करते हैं, तीर को खींचने के पूरे अभ्यास को दोहराते हैं, अब खींचते समय अपनी उंगली के छोटे बाएं-दाएं जोड़ते हैं। ऐसा करने पर, तीर की स्थिति का पता लगाएं, जब उस पर दोनों चर के वर्ग अनुमानों का योग अधिकतम हो जाता है , जबकि आप उस 90 डिग्री के कोण को प्राप्त करते हैं। रूक जा। आपने कारक विश्लेषण किया, सामान्य कारक की स्थिति पाई ।F
फिर से टिप्पणी करने के लिए, प्रमुख घटक विपरीत , कारक संबंध चर के स्थान "विमान X" से नहीं है। इसलिए यह चर का एक कार्य नहीं है (प्रमुख घटक है, और आप दो शीर्ष चित्रों से यह सुनिश्चित कर सकते हैं कि पीसीए मूल रूप से दो-दिशात्मक है: घटकों द्वारा चर की भविष्यवाणी करता है और इसके विपरीत)। फैक्टर विश्लेषण इस प्रकार एक विवरण / सरलीकरण विधि नहीं है, पीसीए की तरह, यह मॉडलिंग विधि है जिसके तहत अव्यक्त कारक स्टीयर चर, एक-दिशात्मक रूप से मनाया जाता है।P1F
लोडिंग चर पर कारक के के पीसीए में लोडिंग की तरह कर रहे हैं; वे सहसंयोजक हैं और वे (मानकीकृत) कारक द्वारा मॉडलिंग चर के गुणांक हैं। द्वारा लिया गया विचरण (समझाया गया) है । कारक को इस मात्रा को अधिकतम करने के लिए पाया गया था - जैसे कि एक प्रमुख घटक। हालाँकि, यह समझाया गया कि विचरण कोई अधिक चरों का स्थूल विचरण नहीं है, - इसके बजाय, यह उनका विचरण है जिसके द्वारा वे सह-भिन्न होते हैं (सहसंबंधित)। ऐसा क्यों?aa21+a22=|F|2F
तस्वीर पर वापस जाएं। हमने दो आवश्यकताओं के तहत निकाला । एक स्क्वायर्ड लोडिंग का सिर्फ उल्लेखित अधिकतम योग था। अन्य दो लंबवत विमानों का निर्माण था, "विमान U1" जिसमें और , और "विमान U2" जिसमें और । इस तरह से एक्स चर में से प्रत्येक विघटित दिखाई दिया। को चर और , पारस्परिक रूप से ऑर्थोगोनल में विघटित किया गया था ; इसी तरह चर और में भी विघटित हो गया , वह भी ऑर्थोगोनल। और के लिए ओर्थोगोनल है । हम जानते हैं कि क्या हैFFX1FX2X1FU1X2FU2U1U2F- सामान्य कारक । के अद्वितीय कारक कहलाते हैं । प्रत्येक चर का अपना विशिष्ट कारक होता है। अर्थ इस प्रकार है। पीछे और पीछे वे बल हैं जो और को सहसंबंधित करने में बाधा उत्पन्न । लेकिन - सामान्य कारक - दोनों और पीछे बल है जो उन्हें सहसंबंधित बनाता है। और जिस विचरण को समझाया जा रहा है, वह सामान्य कारक है। तो, यह शुद्ध संपार्श्विकता विचरण है। यह वह विचरण है जो बनाता है ; का वास्तविक मानUU1X1U2X2X1X2FX1X2cov12>0cov12कारक की ओर चरों के झुकाव द्वारा निर्धारित किया जा रहा है, 's द्वारा ।a
एक परिवर्तनशील विचरण (वेक्टर की लंबाई चुकता) इस प्रकार दो योजक भिन्न होते हैं: विशिष्टता और साम्यता । दो चर के साथ, हमारे उदाहरण की तरह, हम सबसे आम कारक में से एक निकाल सकते हैं, इसलिए सांप्रदायिकता = एकल लोडिंग वर्ग। कई चर के साथ हम कई सामान्य कारकों को निकाल सकते हैं, और एक चर की सांप्रदायिकता इसके वर्ग भार का योग होगा। हमारी तस्वीर पर, सामान्य कारकों का स्थान एक-आयामी है (बस ही); जब m सामान्य कारक मौजूद होते हैं, तो वह स्थान m होता हैu2 a2F-डिमैनेटिक, सांप्रदायिकता अंतरिक्ष पर चर के अनुमानों और लोडिंग चर होने के साथ-साथ उन अनुमानों के अनुमानों पर जो अंतरिक्ष को फैलाते हैं। कारक विश्लेषण में स्पष्ट रूप से बताया गया विचरण उस सामान्य कारक के भीतर का भिन्नता है, जो चर के स्थान से भिन्न होता है, जिसमें घटक विचरण की व्याख्या करते हैं। चर का स्थान संयुक्त स्थान के पेट में है: एम आम + पी अद्वितीय कारक।
कृपया वर्तमान तस्वीर को देखें। कई (जैसे, , , ) चर थे जिनके साथ कारक विश्लेषण किया गया था, जिसमें दो सामान्य कारक निकाले गए थे। कारकों और आम कारक अंतरिक्ष "कारक विमान" फैली होती हैं। विश्लेषण किए गए चर के गुच्छा में से केवल एक ( ) आकृति पर दिखाया गया है। विश्लेषण ने इसे दो ऑर्थोगोनल भागों में विभाजित किया, सांप्रदायिकता और अद्वितीय कारक । साम्यवाद "कारक विमान" में निहित है और कारकों पर इसके निर्देशांक वे लोडिंग हैं जिनके द्वारा सामान्य कारक लोड (= निर्देशांकX1X2X3F1F2X1C1U1X1X1खुद कारकों पर)। चित्र पर, अन्य दो चरों के communalities - के अनुमानों और की - भी प्रदर्शित होते हैं। यह कहना दिलचस्प होगा कि दो सामान्य कारक, एक तरह से, उन सभी सांप्रदायिकता "चर" के प्रमुख घटकों के रूप में देखे जा सकते हैं । जबकि सामान्य प्रिंसिपल घटक वरिष्ठता को चर के बहुभिन्नरूपी रूप से संक्षिप्त करते हैं, वहीं कारक उनके बहुभिन्नरूपी सामान्य विचरण को संक्षेप में प्रस्तुत करते हैं। X2X31
उस सभी क्रिया की आवश्यकता क्यों है? मैं सिर्फ इस दावे को साक्ष्य देना चाहता था कि जब आप सहसंबद्ध चर में से प्रत्येक को दो ऑर्थोगोनल अव्यक्त भागों में विघटित करते हैं, तो एक (ए) चर और अन्य भाग (बी) के बीच असंबद्धता (ऑर्थोगोनलिटी) का प्रतिनिधित्व करते हैं (बी) उनके सहसंबंध (संपुष्टि) का प्रतिनिधित्व करते हैं। और आप संयुक्त बी से कारकों को निकालते हैं, आप अपने आप को उन कारकों के लोडिंग द्वारा युग्मक सहसंयोजकों की व्याख्या करते हुए पाएंगे। हमारे कारक मॉडल में, - कारक पुनर्स्थापित करते हैंcov12≈a1a2लोडिंग के माध्यम से अलग-अलग सहवास। पीसीए मॉडल में, ऐसा नहीं है क्योंकि पीसीए अघोषित, मिश्रित कोलीनियर + ऑर्थोगोनल देशी विचरण को स्पष्ट करता है। दोनों मजबूत घटक जिन्हें आप बरकरार रखते हैं और बाद में जिन्हें आप छोड़ते हैं वे (ए) और (बी) भागों के फ्यूजन हैं; इसलिए पीसीए अपने लोडिंग के द्वारा, केवल अंधों और स्थूल रूप से सहवास कर सकता है।
कंट्रास्ट सूची पीसीए बनाम एफए
- पीसीए: चर के स्थान पर चल रही है। एफए: चर के स्थान को बदल देता है।
- पीसीए: परिवर्तनशीलता लेता है जैसा कि है। एफए: खंड परिवर्तनशीलता को सामान्य और अद्वितीय भागों में।
- पीसीए: गैर-विचाराधीन विचरण, अर्थात कोवरियन मैट्रिक्स का पता लगाता है। एफए: केवल आम विचरण की व्याख्या करता है, इसलिए मैट्रिक्स के ऑफ-विकर्ण तत्वों के संबंध (लोडिंग द्वारा पुनर्स्थापना) सहसंबंध / सहसंबंध, बताता है । (पीसीए ऑफ-डायग्नॉजिकल एलिमेंट्स को भी समझाता है - लेकिन गुजरने में, ऑफहैंड तरीके से - सिर्फ इसलिए कि वेरिएंस कोविरियंस के रूप में साझा किए जाते हैं।)
- पीसीए: घटक सैद्धांतिक रूप से रैखिक कार्य हैं चर, चर घटक के सैद्धांतिक रूप से रैखिक कार्य हैं। एफए: चर केवल कारकों के सैद्धांतिक रूप से रैखिक कार्य हैं।
- पीसीए: अनुभवजन्य संक्षेप विधि; यह एम घटकों को बरकरार रखता है । एफए: सैद्धांतिक मॉडलिंग विधि; यह डेटा के लिए निश्चित संख्या मीटर कारक फिट बैठता है ; एफए का परीक्षण किया जा सकता है (पुष्टि एफए)।
- पीसीए: सरलतम मीट्रिक एमडीएस है , इसका उद्देश्य आयामीता को कम करना है, जबकि अप्रत्यक्ष रूप से यथासंभव डेटा बिंदुओं के बीच की दूरी को संरक्षित करना है। एफए: कारक चर के पीछे आवश्यक अव्यक्त लक्षण हैं जो उन्हें सहसंबंधित बनाते हैं; विश्लेषण का उद्देश्य केवल उन निबंधों के लिए डेटा को कम करना है।
- पीसीए: घटकों की रोटेशन / व्याख्या - कभी - कभी (अव्यक्त-लक्षण मॉडल के रूप में पीसीए पर्याप्त यथार्थवादी नहीं है)। एफए: कारकों की रोटेशन / व्याख्या - नियमित रूप से।
- पीसीए: डेटा घटाने की विधि। एफए: सुसंगत चर के समूहों को खोजने के लिए एक विधि भी है (यह इसलिए है क्योंकि चर एक कारक से परे सहसंबंधित नहीं हो सकते हैं)।
- पीसीए: लोडिंग और स्कोर "निकाले गए" घटकों की संख्या मीटर से स्वतंत्र हैं । एफए: लोडिंग और स्कोर "निकाले गए" कारकों की संख्या मीटर पर निर्भर करते हैं ।
- पीसीए: घटक स्कोर सटीक घटक मूल्य हैं। एफए: कारक स्कोर वास्तविक कारक मानों से जुड़े होते हैं, और कई कम्प्यूटेशनल तरीके मौजूद होते हैं। फैक्टर स्कोर चर की जगह में झूठ बोलते हैं (जैसे घटक करते हैं) जबकि सच्चे कारक (कारक लोडिंग द्वारा सन्निहित) नहीं करते हैं।
- पीसीए: आमतौर पर कोई धारणा नहीं है। एफए: कमजोर आंशिक सहसंबंधों की धारणा ; कभी-कभी बहुभिन्नरूपी सामान्यता धारणा; कुछ डेटासेट तब तक विश्लेषण के लिए "खराब" हो सकते हैं जब तक कि रूपांतरित न हो।
- पीसीए: नॉनटेरेटिव अल्गोरिथम; हमेशा सफल। एफए: पुनरावृत्ति एल्गोरिथ्म (आमतौर पर); कभी-कभी असंबद्धता की समस्या; विलक्षणता एक समस्या हो सकती है।
1 लिए सावधानीपूर्वक । कोई यह पूछ सकता है कि चित्र पर और चर कहां हैं , उन्हें क्यों नहीं खींचा गया? इसका उत्तर यह है कि हम उन्हें, यहां तक कि सैद्धांतिक रूप से भी नहीं खींच सकते। चित्र पर स्थान 3 डी है ("कारक विमान" और अद्वितीय वेक्टर द्वारा परिभाषित ; उनके पारस्परिक पूरक, विमान छायांकित ग्रे पर झूठ बोल रहा है, यही वह है जो चित्र संख्या 2 पर "हुड" के एक ढलान से मेल खाता है), और इसलिए हमारे ग्राफिक संसाधन समाप्त हो गए हैं। तीन चर , , द्वारा तीन आयामी अंतरिक्ष एक साथ एक और स्थान है। न तो "कारक विमान" और न हीX2X3U1X1X1X2X3U1इसके उप-स्थान हैं। यह वही है जो पीसीए से अलग है: कारक चर के स्थान से संबंधित नहीं हैं। प्रत्येक चर अलग से "कारक विमान" के लिए अपने अलग ग्रे प्लेन ऑर्थोगोनल में निहित है - ठीक उसी तरह जैसे कि हमारी तस्वीर पर दिखाया गया है, और वह सब है: अगर हमें जोड़ने के लिए, कहना है, तो को प्लॉट में हमें 4 वें आयाम का आविष्कार करना चाहिए था। (बस याद रखें कि सभी को पारस्परिक रूप से रूढ़िवादी होना चाहिए; इसलिए, एक और को जोड़ने के लिए , आपको आयामीता का विस्तार करना होगा।)X1X2UU
इसी तरह प्रतिगमन में गुणांक निर्देशांक, भविष्यवाणियों पर, आश्रित चर (ओं) और भविष्यवाणी (ओं) के दोनों पर हैं ( "कई प्रतिगमन के तहत तस्वीर देखें ", और यहां , भी, एफए में)लोडिंग निर्देशांक हैं, कारकों पर, देखे गए चर और उनके अव्यक्त भागों के दोनों - सांप्रदायिकता। और वास्तव में प्रतिगमन में है कि तथ्य निर्भर (एस) और भविष्यवक्ता एक-दूसरे के उप-स्थान नहीं बनते हैं, - एफए में समान तथ्य मनाया चर नहीं बनाते हैं और अव्यक्त कारक एक-दूसरे के उप-स्थान होते हैं। एक कारक चर के लिए "एलियन" एक काफी समान अर्थ में है, जैसा कि एक आश्रित प्रतिक्रिया के लिए एक भविष्यवक्ता "एलियन" है। लेकिन पीसीए में, यह दूसरा तरीका है: प्रमुख घटक मनाया चर से प्राप्त होते हैं और उनके स्थान तक सीमित होते हैं।
इसलिए, एक बार फिर से दोहराने के लिए: एफए के एम आम कारक पी इनपुट चर के एक उप-समूह नहीं हैं । इसके विपरीत: चर m + p ( m सामान्य कारक + p अद्वितीय कारक) संघ हाइपरस्पेस में एक उप-स्थान बनाते हैं। जब इस दृष्टिकोण से देखा जाता है (यानी अद्वितीय कारकों के साथ भी आकर्षित किया जाता है) तो यह स्पष्ट हो जाता है कि क्लासिक एफए क्लासिक पीसीए की तरह एक आयामी सिकुड़न तकनीक नहीं है , बल्कि एक आयामी विस्तार तकनीक है। फिर भी, हम हमारे ध्यान में केवल एक छोटा सा (को देने मीटर आयामी सामान्य) कि ब्लोट का हिस्सा है, के बाद से इस भाग में केवल सहसंबंध बताते हैं।