कारक विश्लेषण कैसे करें जब सहसंयोजक मैट्रिक्स सकारात्मक निश्चित नहीं है?


11

मेरे पास एक डेटा सेट है जिसमें 717 अवलोकन (पंक्तियाँ) हैं जो 33 चर (कॉलम) द्वारा वर्णित हैं। डेटा को सभी चर को z- स्कोर करके मानकीकृत किया गया है। कोई दो चर रैखिक रूप से निर्भर ( ) नहीं हैं। मैंने बहुत कम विचरण ( 0.1 से कम ) वाले सभी चर भी निकाल दिए हैं । नीचे दिया गया आंकड़ा संबंधित सहसंबंध मैट्रिक्स (पूर्ण मूल्यों में) को दर्शाता है।आर=10.1

जब मैं factoranMatlab में निम्नानुसार कारक विश्लेषण चलाने की कोशिश कर रहा हूँ :

[Loadings1,specVar1,T,stats] = factoran(Z2,1);

मुझे निम्न त्रुटि प्राप्त हुई:

The data X must have a covariance matrix that is positive definite.

क्या आप मुझे बता सकते हैं कि समस्या कहाँ है? क्या यह इस्तेमाल किए गए चर के बीच कम पारस्परिक निर्भरता के कारण है? इसके अलावा, मैं इसके बारे में क्या कर सकता हूं?


मेरा सहसंबंध मैट्रिक्स:

यहाँ छवि विवरण दर्ज करें


3
मुझे लगता है कि यह कम पारस्परिक निर्भरता के विपरीत है जो यहां एक समस्या है। आपके पास शायद कुछ चर हैं जो रैखिक रूप से आपस में निर्भर हैं और यह आपके सहसंयोजक मैट्रिक्स को अर्ध-निश्चित (यानी कुछ शून्य eigenvaues) होने का कारण बनता है।
us --r11852

3
मतदान करने वाले लोगों को प्रश्न को बंद करने के लिए: नमूना कोविरियस मैट्रिक्स की सकारात्मक-निश्चितता पर एक प्रश्न यहां ऑफ-टॉपिक क्यों होगा ? उपयोगकर्ता चिंतित है कि फैक्टर एनालिसिस का एक मानक अनुप्रयोग काम क्यों नहीं करता है। अगर आप चाहते हैं अधिक जानकारी के लिए पूछें!
us --r11852

2
क्या आप नमूना सहसंयोजक मैट्रिक्स के आइगेनवेल्यूज की गणना और प्रस्तुत कर सकते हैं? (जैसे। eig(cov(Z2)))। मुझे दृढ़ता से संदेह है कि उनमें से कुछ बहुत छोटे हैं।
us --r11852

3
मैं @ us agreer11852 से सहमत हूं: ऐसा लगता है कि इस प्रश्न को ऑफ-टॉपिक के रूप में गलत तरीके से बंद किया गया था (मैंने खुद को बंद करने के लिए मतदान किया था)। यह एक प्रोग्रामिंग प्रश्न की तरह लग रहा था, लेकिन यह वास्तव में एक पूर्ण विषय और उचित प्रश्न है। मैंने इसे संपादित किया और फिर से खोलने के लिए मतदान किया। अफ़सोस कि ओ.पी. हालांकि गायब हो गया लगता है।
अमीबा

3
मैं तर्क दूंगा कि इस प्रश्न के लिए सांख्यिकीय सामग्री हो सकती है कि मतलाब समुदाय मदद नहीं कर पाएगा। आप अपने Z2मैट्रिक्स की गणना कैसे करते हैं ? यदि आपके डेटा में मान गायब हैं, तो जोड़ी वाइज विलोपन मैट्रिक्स को गैर-परिवर्तनीय बनने के लिए प्रेरित कर सकती है, जब उस मैट्रिक्स के विभिन्न सहसंबंधों को डेटा के विभिन्न उपसमूह का उपयोग करके गणना की जाती है।
StasK

जवाबों:


1

सी

सी=क्यूडीक्यू-1,
क्यूसी
डी=(λ1000λ2λn00000)
क्यू0nसी

0

λn+1,λn+2,=10-15
सी~=क्यूडी~क्यू-1,
डी~=(λ1000λ2λn10-1500010-15)

क्यू,डी

[Q,D] = eig(C)

सी~

सीसी~ अच्छी तरह से नहीं हो सकता। इसलिए, प्रविष्टियों का एक और सामान्यीकरण आवश्यक हो सकता है।


0

यह संभव है कि आप अपने मैट्रिक्स के साथ संख्यात्मक समस्याओं का सामना कर रहे हों। यह संभवतः वास्तव में सकारात्मक निश्चित है, लेकिन संख्यात्मक अभिकलन अन्यथा कहता है।

एक बहुत ही सामान्य समाधान, उस मामले में, सभी विकर्ण तत्वों में बहुत कम मूल्य (उदाहरण के लिए 1.E-10) जोड़ना है। यदि यह समस्या को हल नहीं करता है, तो इस मान को उत्तरोत्तर बढ़ाने का प्रयास करें।


विकर्ण प्रविष्टियाँ पहले से ही बहुत प्रभावी हैं। क्या आपको लगता है कि इससे मदद मिलेगी?
जोनास

मैं 8 वीं और 10 वीं प्रविष्टियों के बारे में चिंतित हूं, अगर कुछ रैखिक रूप से निर्भर हैं, तो यह इन दोनों को होना चाहिए। मुझे वास्तविक ईजन अपघटन संगणना के बारे में पर्याप्त जानकारी नहीं है, लेकिन मुझे लगता है कि यह समाधान काम कर सकता है: विकर्ण के बारे में 1e-10 को जोड़ने से रैखिक निर्भरता के बारे में बहुत कुछ नहीं होता है, लेकिन यह सिर्फ वही जोड़ सकता है जो संख्यात्मक रूप से आवश्यक है जो कि eigen मानों की गणना निश्चित है (अर्थात कोई 0 eigen मान) नहीं। फिर भी, यदि मेरा समाधान काम नहीं करता है, तो मैं तुम्हारा बहुत ही सुंदर हूँ।
रोमेन रेबेल्यू

-2

जब आपका डेटा गाऊसी होता है, तो FA सबसे अच्छा काम करता है, इसलिए आप अधिक Gaussian जैसे डेटा के लिए कुछ पूर्व-प्रसंस्करण दृष्टिकोणों को आज़माना चाह सकते हैं।


मैं इस जवाब से हतप्रभ हूं। असंबंधित डेटा के एफए करने में क्या समझदारी है?
ttnphns

@ttnphns मुझे लगता है कि आप सही हैं! यह सजावटी डेटा पर एफए लागू करने के लिए कोई मतलब नहीं है! मेरा सुझाव एक विशिष्ट प्रकार के एफए से आता है, जहां पीसीए ने डेटा से वेक्टर प्रतिनिधित्व बनाने के पूर्व-प्रसंस्करण में आवेदन किया था, जिसमें आप एफए को लागू करेंगे। मूल डेटा को वेक्टर प्रतिनिधित्व में बदलने से पहले आमतौर पर पीसीए द्वारा अनुमानित किया जाता है। और एफए को वेक्टर प्रतिनिधित्व पर लागू किया जाता है, न कि पीसीए अनुमानित डेटा। मेरी गलती! मैं अपना जवाब अपडेट करूंगा। हालांकि कुछ मामलों में एक संभावित पीसीए एफए के रूप में अच्छा काम कर सकता है अगर एफए मॉडल अभिसरण करने में विफल रहा। क्या आप सहमत नहीं हैं?
अचार
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.