पीसीए के साथ प्राप्त निम्न-रैंक सन्निकटन मैट्रिक्स द्वारा पुनर्निर्माण त्रुटि का क्या मानदंड न्यूनतम है?


26

मैट्रिक्स के पीसीए (या SVD) सन्निकटन को देखते हुए के साथ एक मैट्रिक्स , हम जानते हैं कि का सबसे अच्छा कम रैंक अनुमान होता है ।एक्स एक्स एक्सXX^X^X

क्या यह प्रेरित मानदंड2 (यानी सबसे बड़ा स्वदेशी मानदंड) के अनुसार या फ्रोबेनियस मानदंड के अनुसार है?F

जवाबों:


30

एकल शब्द उत्तर: दोनों।


आइए मानदंडों को परिभाषित करने के साथ शुरू करें। मैट्रिक्स , ऑपरेटर -norm को और फ्रोबेनियस मानदंड as \ | X \ | _F = \ sqrt {\ sum_ {ij} X_ {ij} ^ 2} = \ mathrm {tr} (X ^ \ top X) = \ sqrt ({sum s_i ^ 2}} , जहाँ s_i X के एकवचन मान हैं , अर्थात् एकवचन मान अपघटन X = USV ^ \ top में S के विकर्ण तत्व ।2 एक्स 2 = रों यू पी एक्स वी 2X2XF=

X2=supXv2v2=max(si)
एसमैंएक्सएसएक्स=यूएसवी
XF=ijXij2=tr(XX)=si2,
siXSX=USV

डेटा केंद्रित होने पर PCA उसी विलक्षण मान के अपघटन द्वारा दिया जाता है। US प्रिंसिपल घटक हैं, V प्रिंसिपल कुल्हाड़ियों, सहप्रसरण मैट्रिक्स की यानी eigenvectors, और के पुनर्निर्माण कर रहे हैं X के साथ ही k प्रमुख घटकों के लिए इसी k सबसे बड़ा विलक्षण मूल्यों द्वारा दिया जाता है Xk=UkSkVk

एस्कार्ट युवा प्रमेय का कहना है कि Xk मैट्रिक्स पुनर्निर्माण त्रुटि के आदर्श को न्यूनतम है XAसभी के बीच matrices A रैंक के k । यह फ्रोबेनियस मानदंड और ऑपरेटर 2 -नॉर्म दोनों के लिए सही है । जैसा कि @cardinal द्वारा टिप्पणियों में बताया गया है, यह पहली बार 1907 में फ्रोबेनियस मामले के लिए श्मिट (ग्राम-श्मिट प्रसिद्धि द्वारा) साबित हुआ था। बाद में इसे 1936 में एकार्ट और यंग द्वारा फिर से खोजा गया और अब यह ज्यादातर उनके नाम के साथ जुड़ा हुआ है। मिरस्की ने 1958 में प्रमेय को उन सभी मानदंडों के लिए सामान्य किया जो एकात्मक परिवर्तनों के तहत अपरिवर्तनीय हैं, और इसमें ऑपरेटर 2-मान शामिल है।

इस प्रमेय को कभी-कभी एकार्ट-यंग-मिरस्की प्रमेय कहा जाता है। स्टीवर्ट (1993) ने इसे श्मिट सन्निकटन प्रमेय कहा। मैंने इसे श्मिड्ट-एकार्ट-यंग-मिर्स्की प्रमेय भी कहा है।


ऑपरेटर के लिए सबूत -norm2

चलो पूर्ण रैंक के हो । जैसा कि रैंक , इसके रिक्त स्थान में आयाम हैं। सबसे बड़े एकवचन मानों के लिए के दाएं एकवचन वैक्टर द्वारा फैलाए गए स्थान में आयाम हैं। तो इन दो स्थानों को काटना चाहिए। चलो चौराहे से एक इकाई वेक्टर हो। फिर हम मिलते हैं: QED |एन कश्मीर एन - कश्मीर कश्मीर + 1 एक्स कश्मीर + 1 डब्ल्यू एक्स - एक 2 2( एक्स - एक ) डब्ल्यू 2 2 = एक्स डब्ल्यू 2 2 = कश्मीर + 1 Σ मैं = 1 एस 2 मैं ( v मैं डब्ल्यू ) 2रों 2XnAknkk+1Xk+1w

XA22(XA)w22=Xw22=i=1k+1si2(viw)2sk+12=XXk22,

फ्रोबेनियस मानदंड का प्रमाण

हम मैट्रिक्स लगाना चाहते हैं रैंक के कि कम करता । हम को फ़ैक्टर कर सकते हैं , जहाँ के ऑर्थोनॉर्मल कॉलम हैं। न्यूनतम लिए , समाधान साथ एक प्रतिगमन समस्या है । इसे इन करने पर, हम देखते हैं कि अब हमें जहां का सहसंयोजक मैट्रिक्स है , यानीकश्मीर एक्स - एक 2 एफ= बी डब्ल्यू डब्ल्यू कश्मीर एक्स - बी डब्ल्यू 2 डब्ल्यू बी = एक्स डब्ल्यू एक्स - एक्स डब्ल्यू डब्ल्यू 2 = एक्स 2 - एक्स डब्ल्यू डब्ल्यू 2 = c o n s t - W W cAkXAF2A=BWWkXBW2WB=XWΣ एक्स Σ = एक्स एक्स / ( n - 1 ) डब्ल्यू कश्मीर

XXWW2=X2XWW2=consttr(WWXXWW)=constconsttr(WΣW),
ΣXΣ=XX/(n1)। इसका मतलब है कि पुनर्निर्माण त्रुटि के स्तंभों के रूप में लेने के द्वारा कम से कम है कुछ orthonormal वैक्टर प्रक्षेपण की कुल अन्तर को बढ़ाता है।Wk

यह सर्वविदित है कि ये पहले कोविरियन मैट्रिक्स के eigenvectors हैं। वास्तव में, यदि , तो । लिखना जिसमें ऑर्थोनॉर्मल कॉलम भी हैं, हमें अधिकतम प्राप्त करने के साथ । प्रमेय तो तुरंत अनुसरण करता है।kX=USVΣ=VS2V/(n1)=VΛVR=VW

tr(WΣW)=tr(RΛR)=iλijRij2i=1kλk,
W=Vk

निम्नलिखित तीन संबंधित सूत्र देखें:


फ्रोबेनियस मानदंड के लिए पहले प्रमाण का प्रयास

यह प्रमाण मुझे कहीं ऑनलाइन मिला लेकिन यह गलत है (एक अंतर है), जैसा कि टिप्पणियों में @cardinal द्वारा समझाया गया है।

फ्रोबेनियस मानदंड एकात्मक परिवर्तनों के तहत अपरिवर्तनीय है, क्योंकि वे एकवचन मूल्यों को नहीं बदलते हैं। तो हम प्राप्त करते हैं: जहां । जारी:यह कम से कम तब होता है जब सभी ऑफ-विकर्ण तत्व शून्य होते हैं और सभी विकर्ण शब्द सबसे बड़ा एकवचन मान को रद्द करते हैं [यहाँ अंतर: यह स्पष्ट नहीं है] , अर्थात और इसलिए ।

XAF=USVA=SUAV=SB,
B=UAVबी के
XAF=ij(SijBij)2=i(siBii)2+ijBij2.
Bkksi Boptimal=SkAoptimal=UkSkVk

2
फ्रोबेनिअस मानदंड के मामले में प्रमाण सही नहीं है (या कम से कम पूर्ण) क्योंकि तर्क यहाँ इस संभावना को समाप्त नहीं करता है कि उसी रैंक का एक मैट्रिक्स "छोटे" बंद होने के दौरान कुछ अन्य विकर्ण शब्दों को रद्द कर सकता है। विकर्ण। अंतराल को और अधिक स्पष्ट रूप से देखने के लिए कि विकर्णों को स्थिर और "शून्य" करना, अक्सर विकर्णों की रैंक को बढ़ा सकता है !
कार्डिनल

1
यह भी ध्यान दें कि एसवीडी को बेल्ट्रामि (कम से कम एक सामान्य रूप में, विशेष मामले में) और जॉर्डन को 1874 की शुरुआत में जाना जाता था।
कार्डिनल

@कार्डिनल: हम्म, मुझे यकीन नहीं है कि मैं अंतर देख रहा हूं। तो कुछ अन्य विकर्ण मामले में बाहर रद्द के बजाय सबसे बड़ी हैं और कुछ अशून्य है बंद विकर्ण शर्तों के बजाय, तो दोनों रकम, और , बढ़ने जा रहे हैं। तो यह केवल पुनर्निर्माण त्रुटि को बढ़ाएगा। नहीं? फिर भी, मैंने साहित्य में फ्रोबेनियस मानदंड के लिए एक और प्रमाण खोजने की कोशिश की, और पढ़ा है कि इसे किसी तरह से ऑपरेटर के मानक मामले से आसानी से पालन करना चाहिए। लेकिन अभी तक मैं यह नहीं देखता कि इसे कैसे फॉलो करना चाहिए ...एस कश्मीर Σ मैं ( एस मैं - बी मैं मैं ) 2 Σ मैं जे बी 2 मैं jBSki(siBii)2ijBij2
अमीबा का कहना है कि मोनिका

3
मैं कर गिनीकृमि स्टीवर्ट (1993) की तरह, विलक्षण मूल्य अपघटन, के प्रारंभिक इतिहास पर सियाम समीक्षा , वॉल्यूम। ३५, नहीं। ४, ५५१-५६६ और, ऐतिहासिक मामलों में आपकी पहले से प्रदर्शित रुचि को देखते हुए, मुझे लगता है कि आप भी करेंगे। दुर्भाग्य से, मुझे लगता है कि स्टीवर्ट अनजाने में अत्यधिक Schmidt के 1907 प्रमाण की लालित्य को खारिज कर दिया। इसके भीतर छिपा एक प्रतिगमन व्याख्या है जिसे स्टीवर्ट अनदेखा करते हैं और जो वास्तव में काफी सुंदर है। एक और प्रमाण है जो आपके द्वारा लिए गए प्रारंभिक विकर्ण दृष्टिकोण का अनुसरण करता है, लेकिन जिसे अंतराल को भरने के लिए कुछ अतिरिक्त काम की आवश्यकता होती है। (cont।)
कार्डिनल

2
@कार्डिनल: हां, आप सही कह रहे हैं, अब मुझे अंतर दिखाई दे रहा है। स्टीवर्ट पेपर के लिए बहुत बहुत धन्यवाद, यह एक बहुत ही दिलचस्प पढ़ा गया था। मैं देखता हूं कि स्टीवर्ट श्मिट और वेइल के साक्ष्य प्रस्तुत करते हैं, लेकिन वे दोनों इस बात की तुलना में अधिक जटिल दिखते हैं कि मैं यहां क्या कॉपी करना चाहूंगा (और अब तक मुझे उनके ध्यान से अध्ययन करने का समय नहीं मिला है)। मुझे आश्चर्य है: मुझे उम्मीद थी कि यह एक बहुत ही सरल परिणाम होगा, लेकिन ऐसा लगता है कि यह मेरे विचार से कम तुच्छ है। विशेष रूप से, मैंने उम्मीद नहीं की होगी कि फ्रोबेनियस मामला ऑपरेटर मानक एक की तुलना में बहुत अधिक जटिल है। मैं अब पोस्ट को संपादित करूंगा। नया साल मुबारक हो!
अमीबा का कहना है कि
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.