जब नमूना covariance मैट्रिक्स उल्टा नहीं है तो क्या करें?


12

मैं कुछ क्लस्टरिंग तकनीकों पर काम कर रहा हूं, जहां डी-डायमेंशन वैक्टर के दिए गए क्लस्टर के लिए मैं एक बहुभिन्नरूपी सामान्य वितरण का अनुमान लगाता हूं और नमूना d- आयामी माध्य वेक्टर और नमूना सहसंयोजक मैट्रिक्स की गणना करता हूं।

फिर जब एक नया, अनदेखी, घ आयामी वेक्टर इस क्लस्टर मैं इस उपाय के माध्यम से इसकी दूरी जाँच कर रहा हूँ के अंतर्गत आता है अगर तय करने की कोशिश:

(Xiμ^X)σ^X1(Xiμ^X)>B0.95(p2,p2)

जो मुझे सहप्रसरण मैट्रिक्स के व्युत्क्रम की गणना करने की आवश्यकता है σ एक्स । लेकिन कुछ नमूनों को देखते हुए मैं इस बात की गारंटी नहीं दे सकता कि सहसंयोजक मैट्रिक्स उल्टा होगा, मुझे उस मामले में क्या करना चाहिए जो यह नहीं है?σ^X

धन्यवाद


यह इस बात पर निर्भर करता है कि मैट्रिक्स किस कारण से उल्टा नहीं है। संभावित कारण (ए) हो सकता है जो नमूना आप कोविर्सियस मैट्रिक्स की गणना करने के लिए उपयोग करते हैं वह बहुत छोटा है (बी) आपका नमूना पर्याप्त आकार का है, लेकिन यह सदस्य एक निरंतर वितरण से तैयार नहीं है ताकि आपके नमूने के कुछ कॉलम / पंक्ति दोहराएं ।
user603

मुझे लगता है कि नमूना का आकार छोटा हो जाता है
Aly

@ Anony-Mousse मैंने सुनिश्चित किया है कि मैं अब कम से कम कई नमूनों का उपयोग आयामों के रूप में कर रहा हूं, अन्यथा मैट्रिक्स रैंक की कमी होगी। अब तक कोई समस्या नहीं है, लेकिन मुझे लगता है कि नमूना सहसंयोजक के साथ यह गैर-उल्टा हो सकता है?
अली

1
MMT

1
@कोरोन बनाता है कि एक सख्त>
user603

जवाबों:


14

d+1dk+1d

यही कारण है कि शाब्दिक पीसीए का उपयोग नहीं करना आम है , बल्कि एकवचन मूल्य अपघटन करते हैं , जिसका उपयोग मैट्रिक्स के छद्म बिंदु को गणना करने के लिए किया जा सकता है । यदि मैट्रिक्स उल्टा है, तो छद्म सूचक उलटा होगा।

हालाँकि, यदि आप गैर-इनवर्टेबल मैट्रिक्स देख रहे हैं, तो संभावना है कि यदि क्लस्टर हाइपरप्लेन क्लस्टर रिप्रेसेंट से बाहर है, तो क्लस्टर से आपकी दूरी निरर्थक होगी, क्योंकि आपको ऑर्थोगोनल स्पेस में विचरण का पता नहीं है (आप सोच सकते हैं) इस संस्करण को 0 के रूप में!) SVD छद्म बिंदु की गणना कर सकता है, लेकिन "variances" अभी भी आपके डेटा द्वारा निर्धारित नहीं किया जाएगा।

y=xxy

इसके अलावा, आप सहसंयोजक मैट्रिक्स की गणना कैसे करते हैं, इस पर निर्भर करते हुए, आप विनाशकारी रद्द होने के कारण संख्यात्मक मुद्दों में भाग ले सकते हैं। शून्य अर्थ प्राप्त करने के लिए सबसे सरल समाधान हमेशा पहले डेटा को केंद्र में रखना है।


यहाँ जवाब देने के लिए खेद है, लेकिन मैं एक ही मुद्दे पर काम कर रहा हूँ। मैं महालनोबिस दूरी के माध्यम से क्लस्टरिंग दूरियों की तुलना कर रहा हूं, जिसके लिए व्युत्क्रम सहसंयोजक मैट्रिक्स की आवश्यकता होती है। हालाँकि मेरे मामले में मुझे वही त्रुटि मिल रही है। इसलिए मैंने SingularValueDecomposition की कोशिश की, लेकिन इस बार सभी दूरी बराबर हैं 1.4: D मैं इसका पता नहीं लगा सकता
मॉन्स्टरमोरपीजी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.