क्या ऑर्डिनल या बाइनरी डेटा के लिए फैक्टर विश्लेषण या पीसीए है?


28

मैंने मुख्य घटक विश्लेषण (पीसीए), खोजपूर्ण कारक विश्लेषण (ईएफए), और पुष्टिकरण कारक विश्लेषण (सीएफए) को पूरा किया है, डेटा को समान पैमाने (5-स्तरीय प्रतिक्रियाओं: कोई नहीं, थोड़ा, कुछ, ..) के साथ एक निरंतर के रूप में माना जाता है। चर। फिर, लावन का उपयोग करते हुए, मैंने सीएफए को चर के रूप में श्रेणीबद्ध रूप से परिभाषित किया।

मैं जानना चाहूंगा कि किस प्रकार के विश्लेषण उपयुक्त होंगे और पीसीए और ईएफए के बराबर होगा जब डेटा प्रकृति में व्यवस्थित होते हैं । और जब बाइनरी

मैं ऐसे विशिष्ट पैकेजों या सॉफ्टवेयर्स के सुझावों की भी सराहना करूंगा जिन्हें इस तरह के विश्लेषणों के लिए आसानी से लागू किया जा सकता है।

जवाबों:


38

पारंपरिक (रैखिक) पीसीए और फैक्टर विश्लेषण के लिए स्केल-स्तर (अंतराल या अनुपात) डेटा की आवश्यकता होती है । अक्सर तुलना-प्रकार रेटिंग डेटा को पैमाने-स्तर माना जाता है, क्योंकि ऐसे डेटा का विश्लेषण करना आसान होता है। और निर्णय कभी-कभी सांख्यिकीय रूप से वारंट किया जाता है, खासकर जब आदेशित श्रेणियों की संख्या 5 या 6 से अधिक होती है (यद्यपि विशुद्ध रूप से तार्किक रूप से डेटा प्रकार और स्केल स्तर की संख्या अलग-अलग होती है।)

क्या होगा यदि आप ऑर्थिनल पॉलीसोमेंट पैमाने को ऑर्डिनल के रूप में व्यवहार करना पसंद करते हैं, हालांकि? या आपके पास डायकोटोमस डेटा है? क्या उनके लिए खोजपूर्ण कारक विश्लेषण या पीसीए करना संभव है?

वर्तमान में एफएडी (पीसीए सहित इसके विशेष मामले के रूप में) श्रेणीबद्ध ऑर्डिनल या बाइनरी वैरिएबल्स को पढ़ने के लिए तीन मुख्य दृष्टिकोण हैं ( बाइनरी डेटा मामले के बारे में यह भी पढ़ें , और ऑर्डिनल स्केल के साथ क्या किया जा सकता है , इस बारे में यह विचार)।

  1. इष्टतम स्केलिंग दृष्टिकोण ( अनुप्रयोगों का एक परिवार )। जिसे श्रेणीबद्ध PCA (CatPCA) या nonlinear FA भी कहा जाता है। CatPCA में, ऑर्डिनल वैरिएबल को उन अंतराल डेटा से निकाले गए प्रिंसिपल कंपोनेंट्स की चुनी हुई संख्या से समझाए गए वेरिएशन को अधिकतम करने के उद्देश्य से उनके "अंतर्निहित" अंतराल संस्करणों में एकरूपता ("मात्रा") में बदल दिया जाता है। जो पहले से ही प्रमुख घटकों की संख्या पर निर्णय लेने के लिए विधि को सिद्धांत-आधारित (सिद्धांत-चालित के बजाय) खुले और महत्वपूर्ण बनाता है। यदि पीसीए के बजाय सच्चे एफए की आवश्यकता होती है, तो सामान्य रैखिक एफए को स्वाभाविक रूप से कैटापा से उन परिवर्तित चर आउटपुट पर किया जा सकता है। द्विआधारी चर के साथ, CatPCA (पछतावा?) सामान्य PCA के तरीके से व्यवहार करता है, जैसे कि वे निरंतर चर रहे हैं। CatPCA भी नाममात्र चर और चर प्रकार (अच्छा) के किसी भी मिश्रण को स्वीकार करता है।

  2. अंतर्निहित अंतर्निहित चर दृष्टिकोण। पीसीए / एफए के रूप में भी जाना जाता है टेट्राकोरिक (बाइनरी डेटा के लिए) या पॉलीकोरिक (क्रमिक डेटा के लिए) सहसंबंध। सामान्य वितरण हर प्रकट चर के लिए अंतर्निहित (तब द्विपाद) निरंतर चर के लिए माना जाता है। तब क्लासिक एफए को पूर्वोक्त सहसंबंधों का विश्लेषण करने के लिए लागू किया जाता है। दृष्टिकोण आसानी से अंतराल, क्रमिक, बाइनरी डेटा के मिश्रण की अनुमति देता है। दृष्टिकोण का एक नुकसान यह है कि - सहसंबंधों का संदर्भ देते हुए - इसमें अंतर्निहित चर के बहुभिन्नरूपी वितरण के लिए कोई सुराग नहीं है, - अधिकांश द्विभाजित वितरण में "गर्भ धारण" कर सकता है, इस प्रकार स्वयं पूरी जानकारी के आधार पर नहीं।

  3. आइटम प्रतिक्रिया सिद्धांत (आईआरटी) दृष्टिकोण। कभी-कभी लॉजिस्टिक एफए या अव्यक्त विशेषता विश्लेषण भी कहा जाता है । एक मॉडल जो बाइनरी लॉगिट (बाइनरी डेटा के लिए) या आनुपातिक लॉग ऑड्स (ऑर्डिनल डेटा के लिए) मॉडल के बहुत करीब है। एल्गोरिथ्म एक सहसंबंध मैट्रिक्स के डीकंपोज़िंग से बंधा नहीं है, इसलिए यह पारंपरिक एफए से थोड़ा दूर है, फिर भी यह एक बोना फाइड श्रेणीबद्ध एफए है। "भेदभाव मापदंडों" एफए के लोडिंग के साथ निकटता से मेल खाती है, लेकिन "कठिनाइयों" एफए की "विशिष्टता" की धारणा को प्रतिस्थापित करती है। आईआरटी फिटिंग निश्चितता जल्दी घट जाती है क्योंकि कारकों की संख्या बढ़ती है, जो इस दृष्टिकोण का एक समस्याग्रस्त पक्ष है। मिश्रित अंतराल + बाइनरी + ऑर्डिनल और संभवतः नाममात्र चर को शामिल करने के लिए आईआरटी अपने स्वयं के तरीके में मौजूद है।

क्लासिक एफए या दृष्टिकोण (1) में कारक स्कोर की तुलना में दृष्टिकोण में कारक स्कोर (2) और (3) अधिक कठिन हैं। हालाँकि, कई विधियाँ मौजूद होती हैं (अपेक्षित या अधिकतम अप्रतिरोजी विधियाँ, अधिकतम संभावना विधि, आदि)।

फैक्टर विश्लेषण मॉडल मान्यताओं मुख्य रूप से पारंपरिक एफए के रूप में तीन दृष्टिकोणों में समान है। दृष्टिकोण (1) आर, एसपीएसएस, एसएएस (मेरे दिमाग में) में उपलब्ध है। दृष्टिकोण (2) और (3) विशेष रूप से विशेष अव्यक्त-चर पैकेजों में लागू किए जाते हैं - Mplus, LISREL, EQS।

  1. बहुपद दृष्टिकोण। जिसे अभी तक पूर्ण रूप से विकसित नहीं किया गया है। प्रिंसिपल घटकों को चर के बहुपद संयोजनों के रूप में तैयार किया जा सकता है ( बहुपद का उपयोग करना क्रमिक रजिस्टरों के nonlinear प्रभावों को मॉडल करने का एक लोकप्रिय तरीका है।)। इसके अलावा, बदले में मनाया श्रेणियों को अव्यक्त कारकों के बहुपद संयोजनों के असतत अभिव्यक्तियों के रूप में मॉडलिंग की जा सकती है।

  2. वहाँ आयामीता में कमी के nonlinear तकनीकों का एक समृद्ध क्षेत्र मौजूद है ; उनमें से कुछ को श्रेणीबद्ध डेटा के साथ काम करने के लिए लागू किया जा सकता है या अपनाया जा सकता है (विशेष रूप से द्विआधारी या एक उच्च-आयामी विरल डेटासेट में binarizing के बाद)।

  3. श्रेणीगत सहसंबंध या श्रेणीबद्ध डेटा (स्पीयरमैन / केंडल / सोमर आदि) के लिए अनुकूल अन्य संघों पर क्लासिक (रैखिक) एफए / पीसीए प्रदर्शन करना। ऑर्डिनल डेटा के मामले में, विशुद्ध रूप से अनुमानवादी दृष्टिकोण, सैद्धांतिक आधारों की कमी और बिल्कुल भी अनुशंसित नहीं है । बाइनरी डेटा के साथ, स्पीयरमैन आरएच और केंडल ताउ-बी सहसंबंध और फी सभी समान पीयरसन आर सहसंबंध हैं, इसलिए उनका उपयोग द्विआधारी डेटा पर सामान्य रैखिक एफए / पीसीए करने के अलावा कुछ नहीं है । यह भी संभव है (यद्यपि निर्विवाद नहीं) rescaled wrt पर विश्लेषण करना इसकी वर्तमान परिमाण को बाध्य करता है।आर

में भी देखो यह , यह , यह , यह , यह , यह , यह , यह


3
घटना का उत्तर। केवल जोड़ने वाली बात यह है कि मुझे लगता है कि आप आर पैकेज में एप्रोच को लागू करने के लिए आर पैकेज में मनोवैज्ञानिक पैकेज का उपयोग कर सकते हैं (फंक्शन के लिए "cor" विकल्प देखें) और (3) (irt.fa और irt.poly फ़ंक्शन देखें) ) विभिन्न डिग्री के लिए, और ltm पैकेज का उपयोग कई IRT मॉडल फिट करने के लिए भी किया जा सकता है।
jsakaluk

1
वे अलग हो सकते हैं। मैंने "नॉनलाइनियर एफए" (कैटपका-तत्कालीन-ईएफए) द्वारा कई बार इन्वेंट्री निर्माण / सत्यापन किया और सामान्य (रैखिक) ईएफए से बेहतर परिणाम पाया है। मैंने जो प्रक्रिया अपनाई वह सामान्य एफए के समान थी, केवल यही अंतर कि हर विश्लेषण के लिए - मेरे द्वारा कोशिश की जाने वाली वस्तुओं का हर सेट और मेरे द्वारा निकाले जाने वाले कारकों की प्रत्येक संख्या - मैंने कैटपीसीए-तब (परिमाणित चर पर) -EFA पेस डे ड्यूक्स किया ।
ttnphns

@jsakaluk, आपको जानकारी के लिए बहुत बहुत धन्यवाद। (मैं आर उपयोगकर्ता नहीं हूं इसलिए केवल अपनी अभूतपूर्व क्षमता को खराब जानता हूं)।
ttnphns

इस तरह की प्रतिक्रिया के लिए धन्यवाद। @ttnphns मैंने आज सबसे अधिक खर्च किया है जो कि SPSS 23 में CATPCA को लागू करने की कोशिश कर रहा है। मैंने दो ट्यूटोरियल (Linting & Kooij (2012) और unt.edu/rss/class/Jon/SPSS-SC.Module9/M9_CATPCA/… ) अभी तक ढूंढने में कामयाबी हासिल की है। मेरे खुद के कुछ सवालों का जवाब देने में विफल रहा। क्या आप कुछ तकनीकी प्रश्नों को संबोधित करने के लिए एक अच्छा आउटलेट सुझा सकते हैं? फिर से धन्यवाद।
user116948

1
@ user116948, यदि आपको यह समझने में परेशानी है कि SPSS में इसके साथ कैसे काम किया जाए: सबसे पहले, हेल्प मेनू में SPSS केस स्टडीज सबमेनू में CATPCA केस स्टडी खोजें और पढ़ें। दूसरा, इस साइट पर पहले से पूछे गए CATPCA के बारे में सभी प्रश्न ब्राउज़ करें। तीसरा: यदि आपके पास अभी भी प्रश्न हैं - इसे साइट पर एक नए प्रश्न के रूप में पूछें। चिंता न करें: यदि यह "बहुत तकनीकी" है तो इसे StackOveflow में स्थानांतरित किया जा सकता है। फोर्थ: अपना प्रश्न पूछने के लिए एक SPSS समुदाय चुनें (SPSSXL सबसे अच्छा है)। तुम्हारी खुशी के लिए।
ttnphns 6
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.