कारक विश्लेषण की धारणाएं क्या हैं?


11

मैं जांचना चाहता हूं कि क्या मैं वास्तव में [क्लासिक, रैखिक] कारक विश्लेषण (एफए) को समझ गया हूं , विशेष रूप से ऐसी धारणाएं जो एफए (और संभवतः बाद में) एफए से पहले बनी हैं।

कुछ डेटा को शुरू में सहसंबद्ध किया जाना चाहिए और उनके बीच एक संभावित रैखिक संबंध है। कारक विश्लेषण करने के बाद, डेटा को सामान्य रूप से वितरित किया जाता है (प्रत्येक जोड़े के लिए द्विभाजित वितरण) और कारकों (सामान्य और बारीकियों) के बीच कोई संबंध नहीं है, और एक कारक से चर और अन्य कारकों से चर के बीच कोई संबंध नहीं है।

क्या यह सही है?

जवाबों:


12

रैखिक एफए की इनपुट डेटा मान्यताओं (मैं एफए मॉडल की आंतरिक मान्यताओं / गुणों के बारे में या परिणामों की फिटिंग गुणवत्ता की जांच के बारे में यहां नहीं बोल रहा हूं )।

  1. स्केल (अंतराल या अनुपात) इनपुट चर । इसका मतलब है कि आइटम या तो निरंतर उपाय हैं या असतत मात्रात्मक पैमाने पर मापा जाता है, जबकि निरंतर रूप से अवधारणा की जाती है। रैखिक एफए में कोई क्रमिक डेटा ( पढ़ें )। बाइनरी डेटा भी बचा जाना चाहिए (देखें यह , इस )। रैखिक एफए मानता है कि अव्यक्त सामान्य और अद्वितीय कारक निरंतर हैं । इसलिए देखा गया चर जो वे लोड करते हैं, वह निरंतर होना चाहिए।
  2. सहसंबंध रैखिक हैं । रैखिक एफए को किसी भी एसएससीपी-प्रकार संघ मैट्रिक्स के आधार पर किया जा सकता है : पियर्सन सहसंबंध, सहसंयोजक, कोसाइन, आदि (हालांकि कुछ तरीके / कार्यान्वयन केवल पियर्सन सहसंबंधों तक सीमित हो सकते हैं)। ध्यान दें कि ये सभी रैखिक-बीजगणित उत्पाद हैं। इसके बावजूद कि एक सहसंयोजक गुणांक का परिमाण संबंध में केवल रैखिकता से अधिक को दर्शाता है , रैखिक एफए में मॉडलिंग प्रकृति में रैखिक होती है, यहां तक ​​कि जब सहसंयोजक का उपयोग किया जाता है: चर कारकों के रैखिक संयोजन होते हैंऔर इस प्रकार रैखिकता परिणामी संघों में निहित है। यदि आप देखते हैं / सोचते हैं कि नॉनलाइनियर एसोसिएशन प्रचलित हैं - तो डेटा के कुछ परिवर्तनों के द्वारा पहले रैखिक एफए या उन्हें रैखिक बनाने की कोशिश न करें। और स्पीयरमैन या केंडल परस्पर संबंधों पर एफए रैखिक आधार (पं। 4 नहीं है वहाँ )।
  3. कोई भी आउटलेयर नहीं - यह किसी भी गैर-विधि के साथ है। पियर्सन सहसंबंध और इसी तरह के एसएससीपी-प्रकार के संगठन आउटलेर्स के प्रति संवेदनशील हैं, इसलिए बाहर देखें।
  4. यथोचित उच्च सहसंबंध मौजूद हैं । एफए सहसंबंध का विश्लेषण है, - इसका क्या उपयोग है जब सभी या लगभग सभी सहसंबंध कमजोर हैं? - किसी काम का नहीं। हालांकि, "यथोचित उच्च सहसंबंध" क्या अध्ययन के क्षेत्र पर निर्भर करता है। एक दिलचस्प और विविध प्रश्न यह भी है कि क्या बहुत उच्च सहसंबंधों को स्वीकार किया जाना चाहिए (पीसीए पर उनके प्रभाव, उदाहरण के लिए, चर्चा की गई है )। सांख्यिकीय रूप से परीक्षण करने के लिए यदि डेटा असंबद्ध नहीं हैं तो बारलेट के गोलाकार के परीक्षण का उपयोग किया जा सकता है।
  5. आंशिक सहसंबंध कमजोर हैं, और कारक को पर्याप्त रूप से परिभाषित किया जा सकता है । एफए मानता है कि सहसंबद्ध वस्तुओं के जोड़े को लोड करने की तुलना में कारक अधिक सामान्य हैं। वास्तव में, यहां तक ​​कि एक सलाह है कि अन्वेषणात्मक एफए में 3 से कम आइटम लोड करने वाले कारकों को न निकालें; और पुष्टिकर एफए में केवल 3+ की गारंटी वाली संरचना है। हेयवुड केस नामक निष्कर्षण की एक तकनीकी समस्या के पीछे के कारणों में से एक के रूप में, कुछ-कुछ-आइटम-कारक स्थिति भी है। कैसर-मेयर-ओल्किन ( केएमओ ) "नमूना पर्याप्तता माप" आपके लिए अनुमान लगाता है कि पूर्ण सहसंबंध के सापेक्ष डेटा में आंशिक सहसंबंध कितने कमजोर हैं; यह हर आइटम के लिए और पूरे सहसंबंध मैट्रिक्स के लिए गणना की जा सकती है।
  6. कोई बहुरूपता नहीं । एफए मॉडल मानता है कि सभी आइटम प्रत्येक कारक को अद्वितीय कारक बनाते हैं और वे कारक ऑर्थोगोनल हैं। इसलिए 2 आइटम को एक विमान, 3 आइटम - एक 3 डी स्थान, आदि को परिभाषित करना चाहिए: pसहसंबद्ध वैक्टर को उनके पी पारस्परिक रूप से अनूठे घटकों को समायोजित करने के लिए पी-मंद स्थान का विस्तार करना चाहिए। तो, सैद्धांतिक कारणों के लिए कोई विलक्षणता (और इसलिए स्वचालित रूप से , बिना कहे; और बेहतर )। ऐसा नहीं है कि पूर्ण बहुस्तरीयता की अनुमति है; अभी तक यह एफए एल्गोरिदम के अधिकांश में कम्प्यूटेशनल समस्याओं का कारण हो सकता है ( यह भी देखें )।1n observations > p variablesn>>p
  7. वितरण । सामान्य तौर पर, रैखिक एफए को इनपुट डेटा की सामान्यता की आवश्यकता नहीं होती है। मामूली तिरछे वितरण स्वीकार्य हैं। Bimodality एक गर्भ निरोधक नहीं है। सामान्यता वास्तव में मॉडल में अद्वितीय कारकों के लिए ग्रहण की जाती है (वे प्रतिगामी त्रुटियों के रूप में सेवा करते हैं) - लेकिन सामान्य कारकों और इनपुट डेटा के लिए नहीं ( यह भी देखें )। फिर भी, डेटा के बहुभिन्नरूपी सामान्यता को निष्कर्षण के कुछ तरीकों (अर्थात्, अधिकतम संभावना) और कुछ विषम परीक्षण करके अतिरिक्त धारणा के रूप में आवश्यक हो सकता है ।

1 एफए का ULS / मिनरेस तरीके एकवचन और यहां तक ​​कि गैर psd सहसंबंध मैट्रिक्स के साथ काम कर सकते हैं, लेकिन सख्ती से सैद्धांतिक रूप से ऐसा विश्लेषण मेरे लिए संदिग्ध है।


, क्या आप इस पोस्ट को पढ़ सकते हैं , यह थोड़ा अलग लग रहा था।
व्हाइटगर्ल

यदि Binary data should also be avoided, हम किस और कारक विश्लेषण विधि के लिए कर सकते हैं binary data?
किटीगर्ल

प्रिय ttnphns; मुझे लगता है कि आप उल्लेख नहीं करते हैं कि डेटा सामान्य माना जाता है और अन्य ऑनलाइन संकेत देते हैं कि सामान्यता की आवश्यकता नहीं है। मेरा प्रश्न यह है कि यदि अव्यक्त चरों को सामान्य मान लिया जाता है, और प्रेक्षणों को मॉडल के भारित योग के रूप में तैयार किया जाता है, तो यह प्रेक्षणों पर एक सामान्य वितरण नहीं है? (मैं माफी चाहता हूँ यकीन है कि यह एक गूंगा सवाल है)
user2957945

@ user2957945, पैरा 7 सामान्यता के बारे में कहता है। कारक निष्कर्षण के कुछ तरीकों के लिए और कुछ सांख्यिकीय परीक्षणों के साथ-साथ कारक विश्लेषण के लिए सामान्यता धारणा आवश्यक है। आपके प्रश्न के लिए: हाँ, अगर कारकों को सामान्य रूप से वितरित किया जाता है और सामान्य रूप से त्रुटियां भी होती हैं, तो इसका मतलब होगा कि प्रकट चर भी सामान्य हैं।
tnnphns

आह, धन्यवाद @ttnphns; आपको परेशान करने के लिए खेद है - मुझे नहीं पता कि मैं कैसे चूकने में कामयाब रहा। आपकी सहायता की सराहना।
user2957945

9

ज्यादातर समय, कारक विश्लेषण बिना किसी सांख्यिकीय परीक्षणों के प्रति आयोजित किया जाता है। यह प्रतिगमन, संरचनात्मक समीकरण मॉडलिंग, और इसी तरह की विधियों की तुलना में बहुत अधिक व्यक्तिपरक और व्याख्यात्मक है। और आम तौर पर यह अनुमानों के साथ आने वाले हीन परीक्षण हैं: पी मूल्यों और आत्मविश्वास अंतरालों को सही करने के लिए, उन मान्यताओं को पूरा किया जाना चाहिए।

अब, यदि कारकों की संख्या चुनने की विधि अधिकतम संभावना विधि निर्धारित की जाती है, तो एक धारणा है कि इस के साथ चला जाता है: कारक विश्लेषण में चर इनपुट का सामान्य वितरण होगा।

इनपुट वेरिएबल्स में गैर-अक्षीय सहसंबंध होंगे, यह धारणा का एक प्रकार है कि इसके सत्य होने के बिना, कारक विश्लेषण परिणाम (शायद) बेकार होंगे: इनपुट चर के कुछ सेट के पीछे कोई भी कारक अव्यक्त चर के रूप में नहीं उभरेगा।

जहाँ तक "कारकों (सामान्य और बारीकियों) के बीच कोई संबंध नहीं है, और एक कारक से चर के बीच कोई संबंध नहीं है और अन्य कारकों से चर," ये सार्वभौमिक धारणाएं नहीं हैं जो कारक विश्लेषक बनाते हैं, हालांकि कई बार स्थिति या (एक सन्निकटन) यह) वांछनीय हो सकता है। उत्तरार्द्ध, जब यह धारण करता है, तो इसे "सरल संरचना" के रूप में जाना जाता है।

एक और शर्त है जिसे कभी-कभी "धारणा" के रूप में माना जाता है: कि इनपुट-चर के बीच शून्य-क्रम (वेनिला) सहसंबंधों को बड़े आंशिक सहसंबंधों से नहीं स्वाहा किया जाता है। संक्षेप में इसका मतलब यह है कि रिश्ते कुछ जोड़ियों के लिए मजबूत और दूसरों के लिए कमजोर होने चाहिए; अन्यथा, परिणाम "मैला" होगा। यह सरल संरचना की वांछनीयता से संबंधित है और यह वास्तव में कैसर-मेयर-ओल्किन सांख्यिकी या केएमओ का उपयोग करके मूल्यांकन किया जा सकता है (हालांकि औपचारिक रूप से "परीक्षण" नहीं किया गया है)। KMO मान .8 या .9 के पास आम तौर पर सूचनात्मक कारक विश्लेषण परिणामों के लिए बहुत आशाजनक माना जाता है, जबकि KMO .5 या .6 के पास बहुत कम आशाजनक हैं, और नीचे दिए गए .5 उनकी रणनीति पर पुनर्विचार करने के लिए एक विश्लेषक का संकेत दे सकते हैं।


जैसा कि मैंने पढ़ा चर के साथ कुछ सह-संबंध के साथ, कि कारक विश्लेषण शुरू होता है और हम इस संबंध को अधिक से अधिक स्पष्ट बनाने की कोशिश
Sihem

1
फैक्टर विश्लेषण के आवेदन के बाद, अगर हमने ऑर्थोगोनल रोटेशन का उपयोग किया है, तो हम यह सुनिश्चित करेंगे कि कारकों के बीच कोई संबंध नहीं है
Sihem

2

अंतर्निहित खोजी कारक विश्लेषण की मान्यताएं हैं:
• अंतराल या माप का अनुपात स्तर
• यादृच्छिक नमूनाकरण
• अवलोकन किए गए चर के बीच संबंध रैखिक है
• एक सामान्य वितरण (प्रत्येक मनाया चर)
• एक द्विभाजित सामान्य वितरण (मनाया चर के प्रत्येक जोड़ी)
• बहुभिन्नरूपी सामान्यता
ऊपर से एसएएस फ़ाइल

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.