नहीं, पीसीए के सामान्य सूत्र उत्तल समस्याएं नहीं हैं । लेकिन उन्हें उत्तल अनुकूलन समस्या में बदला जा सकता है।
अंतर्दृष्टि और इसका मज़ा केवल उत्तर प्राप्त करने के बजाय परिवर्तनों के अनुक्रम का अनुसरण और कल्पना कर रहा है: यह यात्रा में निहित है, गंतव्य नहीं। इस यात्रा के मुख्य चरण हैं
उद्देश्य समारोह के लिए एक सरल अभिव्यक्ति प्राप्त करें।
अपने डोमेन को बढ़ाएँ, जो उत्तल नहीं है, जो एक है।
उद्देश्य को संशोधित करें, जो उत्तल नहीं है, जो कि एक तरह से है, जो स्पष्ट रूप से उन बिंदुओं को नहीं बदलता है जिन पर यह अपने इष्टतम मूल्यों को प्राप्त करता है।
यदि आप कड़ी निगरानी रखते हैं, तो आप एसवीडी और लैग्रेग मल्टीप्लायरों को दुबकते हुए देख सकते हैं - लेकिन वे सिर्फ एक दृश्य हैं, वहाँ प्राकृतिक रुचि के लिए, और मैं आगे उन पर कोई टिप्पणी नहीं करूंगा।
पीसीए (या कम से कम इसके प्रमुख चरण) का मानक विचरण-अधिकतमकरण है
Maximize f(x)= x′Ax subject to x′x=1(*)
जहाँ मैट्रिक्स डेटा से निर्मित एक सममित, धनात्मक-अर्धवृत्ताकार मैट्रिक्स है (आमतौर पर इसके वर्ग और उत्पाद मैट्रिक्स का योग, इसका सहसंयोजक मैट्रिक्स या इसका सहसंबंध मैट्रिक्स)।एn×nA
(समान रूप से, हम असंबंधित उद्देश्य को अधिकतम करने का प्रयास कर सकते हैं । न केवल यह एक नास्टियर अभिव्यक्ति है - यह अब एक द्विघात कार्य नहीं है - विशेष मामलों को रेखांकन करेगा। जल्दी से दिखाओ कि यह एक उत्तल कार्य नहीं है, या तो। आमतौर पर कोई भी इस फ़ंक्शन का निरीक्षण करता है, rescalings तहत अपरिवर्तनीय है और फिर इसे विवश सूत्रीकरण तक कम कर देता है ।एक्स → λ एक्स ( * )x′Ax/x′xx→λx(∗)
किसी भी अनुकूलन समस्या को सार रूप में तैयार किया जा सकता है
कम से कम एक ढूंढें जो फ़ंक्शन को जितना संभव हो उतना बड़ा बनाता है। च : एक्स → आरx∈Xf:X→R
याद रखें कि एक अनुकूलन समस्या उत्तल है जब इसे दो अलग-अलग गुणों का आनंद मिलता है :
डोमेन उत्तल है। X⊂Rn इसे कई तरीकों से तैयार किया जा सकता है। एक यह है कि जब भी और और , भी । ज्यामितीय रूप से: जब भी लाइन सेगमेंट के दो समापन बिंदु , तो पूरा खंड में निहित होता है । वाई ∈ एक्स 0 ≤ λ ≤ 1 λ एक्स + ( 1 - λ ) y ∈ एक्स एक्स एक्सx∈Xy∈X0≤λ≤1λx+(1−λ)y∈XXX
समारोह f उत्तल है। इसे भी कई तरीकों से तैयार किया जा सकता है। एक यह है कि जब भी और वाई ∈ एक्स और 0 ≤ λ ≤ 1 , च ( λ एक्स + ( 1 - λ ) y ) ≥ λ च ( एक्स ) + ( 1 - λ ) च ( y ) । (हमें एक्स की जरूरत थीx∈Xy∈X0≤λ≤1
f(λx+(1−λ)y)≥λf(x)+(1−λ)f(y).
Xकोई मतलब करने के लिए इस हालत के लिए क्रम में उत्तल होने के लिए) ज्यामितीय:। जब भी में किसी भी रेखा खंड है एक्स , का ग्राफ च (के रूप में इस क्षेत्र के लिए प्रतिबंधित) को जोड़ने के ऊपर या खंड पर झूठ ( एक्स , च ( एक्स ) ) और ( y , च ( y ) ) में आर एन + 1 ।xy¯Xf(x,f(x))(y,f(y))Rn+1
एक उत्तल समारोह का आदर्श स्थानीय स्तर पर गैर सकारात्मक अग्रणी गुणांक के साथ हर जगह परवलयिक है: किसी भी रेखा खंड पर यह रूप में व्यक्त किया जा सकता है के साथ एक ≤ 0।y→ay2+by+ca≤0.
के साथ एक कठिनाई वह यह है कि एक्स इकाई क्षेत्र है एस एन - 1 ⊂ आर एन जो निश्चित उत्तल नहीं है,। (∗)XSn−1⊂Rn हालाँकि, हम छोटे वैक्टर को शामिल करके इस समस्या को संशोधित कर सकते हैं। ऐसा इसलिए है क्योंकि जब हम एक कारक λ द्वारा को स्केल करते हैं , तो f को λ 2 से गुणा किया जाता है । जब 0 < एक्स ' एक्स < 1 , हम माप सकते हैं एक्स इकाई लंबाई तक यह गुणा करके λ = 1 / √xλfλ20<x′x<1x, जिससे बढ़तीचलेकिन इकाई गेंद के भीतर रहतेडीएन={x∈ आर एन|एक्स'एक्स≤1}। चलो इसलिए हमें पुन:(*)के रूप मेंλ=1/x′x−−−√>1f Dn={x∈Rn∣x′x≤1}(∗)
Maximize f(x)= x′Ax subject to x′x≤1(**)
इसका डोमेन जो स्पष्ट रूप से उत्तल है, इसलिए हम वहां आधे रास्ते पर हैं। यह च के ग्राफ के उत्तलता पर विचार करता है ।X=Dnf
एक अच्छा तरीका करने के लिए लगता है कि समस्या के बारे में --even अगर आप इसी गणना बाहर ले जाने का इरादा नहीं - स्पेक्ट्रल प्रमेय के संदर्भ में है। (∗∗) यह कहता है कि एक ऑर्थोगोनल परिवर्तन , आप आर एन के कम से कम एक आधार पा सकते हैं जिसमें ए विकर्ण है: अर्थात्।PRnA
A=P′ΣP
जहां के सभी बंद विकर्ण प्रविष्टियों शून्य कर रहे हैं। पी के इस तरह के विकल्प के बारे में ए के बारे में कुछ भी नहीं बदलने के बारे में कल्पना की जा सकती है , लेकिन केवल यह बदलने के लिए कि आप इसका वर्णन कैसे करते हैं : जब आप अपने दृष्टिकोण को घुमाते हैं, तो फ़ंक्शन x के स्तर हाइपरसर्फेस के अक्ष → x ′ A x (जो) हमेशा ellipsoids थे) समन्वय अक्षों के साथ संरेखित करें।ΣPAx→x′Ax
के बाद से सकारात्मक-semidefinite है, सभी के विकर्ण प्रविष्टियों Σ गैर नकारात्मक होना चाहिए। हम आगे कुल्हाड़ियों दूसरे स्थान पर रखना कर सकते हैं (जो सिर्फ एक और orthogonal परिवर्तन है, और इसलिए में समाहित किया जा सकता है पी ) है कि आश्वस्त करने के लिए σ 1 ≥ σ 2 ≥ ⋯ ≥ σ n ≥ 0।AΣP
σ1≥σ2≥⋯≥σn≥0.
अगर हम करते हैं नए निर्देशांक हो एक्स (entailing y = पी एक्स ), समारोह च हैx=P′yxy=Pxf
f(y)=y′Ay=x′P′APx=x′Σx=σ1x21+σ2x22+⋯+σnx2n.
Xσi
(∗∗)x′x=1σ1fXffσ1
g(y)=f(y)−σ1y′y.
σ1fgfX
−σ1−σ1y′yPy′y=x′xxg
g(y)=σ1x21+⋯+σnx2n−σ1(x21+⋯+x2n)=(σ2−σ1)x22+⋯+(σn−σ1)x2n.
σ1≥σiiggx2=x3=⋯=xn=0x′x=1x1=±1y=P(±1,0,…,0)′P
g∂Dn=Sn−1y′y=1fgσ1gfDnfg