आर के साथ द्विबीजपत्री डेटा पर कारक विश्लेषण के लिए अनुशंसित प्रक्रिया


10

मुझे डायकोटॉमस चर (0 = हाँ, 1 = नहीं) से बने डेटासेट पर एक कारक विश्लेषण चलाना है और मुझे पता नहीं है कि क्या मैं सही रास्ते पर हूँ।

उपयोग करके tetrachoric()मैं एक सहसंबंध मैट्रिक्स बनाता हूं, जिस पर मैं चलता हूं fa(data,factors=1)MixFactor का उपयोग करने पर मुझे प्राप्त होने वाले परिणामों के पास परिणाम काफी निकट है , लेकिन यह समान नहीं है।

  1. क्या यह ठीक है या आप किसी अन्य प्रक्रिया की सिफारिश करेंगे?
  2. क्यों fa()काम करता है और factanal()एक त्रुटि पैदा करता है? ( Fehler in solve.default(cv) : System ist für den Rechner singulär: reziproke Konditionszahl = 4.22612e-18)

1
मैं (जर्मन?) नहीं बोलता हूं, लेकिन त्रुटि ऐसी दिखती है कि यह टेट्राकोरिक मैट्रिक्स के विलक्षण (गैर-उल्टे) होने के कारण है। यहां तक ​​कि एक अच्छे आकार के नमूने के साथ पॉलीकोरिक सहसंबंध मैट्रीक के कुछ अनुमान उचित सहसंबंध वाले मैट्रिस हो सकते हैं। मेरा कूबड़ यह है कि fa () प्रिंसिपल कंपोनेंट्स और factanal () का उपयोग कर रहा है, अधिकतम संभावना एफए कर रहा है, लेकिन यह मुझे fa fa () के लिए प्रलेखन से स्पष्ट नहीं है।
जेएमएस

@cada आपके पास कितने आइटम / विषय हैं? और क्या विधि MixFactor में लागू की गई है?
chl

1
@cada आप कारक विश्लेषण क्यों चला रहे हैं? यदि आप प्रतिभागी क्षमता का अनुमान लगाने के लिए लक्ष्य कर रहे हैं, तो आईआरटी एक बेहतर दृष्टिकोण हो सकता है। तथ्य बनाम तथ्य के मामले में, डिफ़ॉल्ट रूप से पिता न्यूनतम अवशिष्ट का उपयोग करता है, जबकि तथ्यात्मक एक एमएल पद्धति का उपयोग करता है।
रिचमीमोर्रोस

@chl: बहुत कम! मैंने अभी सर्वे शुरू किया है और अब तक सिर्फ 45 विषय हैं। मैं खिचड़ी भाषा में नया डेटा इकट्ठा नहीं कर सकता और इसलिए मैं जितना संभव हो उतना आर कोड करने की कोशिश करता हूं ...
cada

1
45 विषयों के साथ @cada एक CFA surrealist होगा :-) मैं बाद में अपने विचार जोड़ने की कोशिश करूंगा।
chl

जवाबों:


12

योग करने के लिए, n = 45 विषयों के साथ आप सहसंबंध-आधारित और बहुभिन्नरूपी वर्णनात्मक दृष्टिकोण के साथ छोड़ दिए जाते हैं। हालाँकि, चूंकि इस प्रश्नावली को अकल्पनीय माना जाता है, यह हमेशा एक अच्छी शुरुआत है।

मुझे क्या करना होगा:

  • अपने 22 वस्तुओं के लिए युग्मक सहसंबंधों की गणना करें; रेंज और माध्यिका की रिपोर्ट करें - यह प्रेक्षित वस्तुओं की प्रतिक्रियाओं के सापेक्ष संगति का संकेत देगा (0.3 से ऊपर सहसंबंध आमतौर पर अच्छे अभिसरण वैधता के संकेत के रूप में सोचा जाता है, लेकिन निश्चित रूप से इस अनुमान की सटीकता नमूना आकार पर निर्भर करती है) ; प्रश्नावली की आंतरिक स्थिरता का अध्ययन करने का एक वैकल्पिक तरीका क्रोनबेक के अल्फा की गणना करना होगा , हालांकि n = 45 के साथ संबद्ध आत्मविश्वास अंतराल (उस के लिए बूटस्ट्रैप का उपयोग करें) अपेक्षाकृत बड़ा होगा।
  • कंप्यूट बिंदु biserial सहसंबंध वस्तुओं और summated पैमाने स्कोर के बीच; यह आपको प्रत्येक आइटम की विवेक शक्ति (एफए में लोडिंग की तरह) का एक विचार देगा, जहां 0.3 से अधिक मूल्य प्रत्येक आइटम और उनके संबंधित पैमाने के बीच एक संतोषजनक संबंध का संकेत देते हैं।
  • सहसंबंध मैट्रिक्स को संक्षेप में प्रस्तुत करने के लिए एक पीसीए का उपयोग करें (यह द्विभाजित रूप से रन किए गए आइटम के मामले में एक मल्टीपल पत्राचार विश्लेषण से प्राप्त की जाने वाली समकक्ष व्याख्या प्राप्त करता है )। यदि आपका उपकरण आपके नमूने के लिए एक आयामी आयाम के रूप में व्यवहार करता है, तो आपको भिन्नता के एक प्रमुख अक्ष का निरीक्षण करना चाहिए (जैसा कि पहले आइगेनवल्यू द्वारा परिलक्षित होता है)।

क्या आपको आर का उपयोग करना चाहिए, आपको एलटीएम और मनोवैज्ञानिक पैकेज में उपयोगी फ़ंक्शन मिलेगा ; अधिक पैकेज के लिए CRAN साइकोमेट्रिक्स टास्क व्यू ब्राउज़ करें । यदि आपको 100 विषय मिलते हैं, तो आप बूटस्ट्रैप विश्वास अंतराल के साथ कुछ सीएफए या एसईएम विश्लेषण की कोशिश कर सकते हैं। (ध्यान रखें कि किसी भी वस्तु और उसके कारक के बीच महत्वपूर्ण सहसंबंध होने के लिए लोडिंग बहुत बड़ी होनी चाहिए, क्योंकि यह विश्वसनीय सहसंबंध गुणांक, के मानक त्रुटि से कम से कम दो गुना होना चाहिए2(1-आर2)/(n)


आपका बहुत बहुत धन्यवाद! आपका उत्तर इतना विस्तृत और वास्तव में वास्तव में उपयोगी है! धन्यवाद!
काडा

3

इस थ्रेड में Google सिस्टम के लिए एक अच्छी स्थिति है "System ist für den Rechner singulär: reziproke Konditionszahl" factanal का उपयोग करके त्रुटि (अंग्रेजी में: "सिस्टम कम्प्यूटेशनल रूप से एकवचन है: पारस्परिक स्थिति संख्या") - इसलिए मैं एक टिप्पणी जोड़ूंगा:

जब सहसंबंध मैट्रिक्स को एक प्राथमिकता की गणना की जाती है (उदाहरण के लिए, लापता मानों को निकालने के लिए), तो सुनिश्चित करें कि फैक्टनल () यह नहीं सोचता है कि मैट्रिक्स एनाल्ज का डेटा है (https://stat.ethz.ch/pipermail-r- मदद / 2007-अक्टूबर / 142567.html)।

PREVIOUS: matrix = cor(data, use="pairwise.complete.obs")  # For example
WRONG: factanal(matrix, 3, rotation="varimax")
RIGHT: factanal(covmat=matrix, factors=3, rotation="varimax")

BurninLeo

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.