पीसीए अनुकूलन उत्तल है?


13

प्रिंसिपल कंपोनेंट एनालिसिस (PCA) का उद्देश्य फ़ंक्शन L2 मानदंड में पुनर्निर्माण त्रुटि को कम कर रहा है (अनुभाग 2.12 यहां देखें । एक और दृश्य प्रक्षेपण पर विचरण को अधिकतम करने की कोशिश कर रहा है। हमारे पास यहां एक उत्कृष्ट पोस्ट भी है: PCA का उद्देश्य फ़ंक्शन क्या है। ; )।

मेरा सवाल यह है कि पीसीए अनुकूलन उत्तल है? (मुझे यहां कुछ चर्चाएं मिलीं , लेकिन काश कोई व्यक्ति सीवी पर यहां एक अच्छा सबूत दे पाता)।


3
नहीं। आप एक उत्तल फ़ंक्शन (बाधाओं के तहत) को अधिकतम कर रहे हैं ।
user603

5
मुझे लगता है कि आपको "पीसीए अनुकूलन" से क्या मतलब है इसके बारे में आपको विशिष्ट होना चाहिए। एक मानक सूत्रीकरण को अधीन करना है । समस्या यह है कि उत्तलता का कोई मतलब नहीं है: डोमेन एक क्षेत्र है, न कि एक यूक्लिडियन स्थान। xAxxx=1xx=1
whuber

1
@ आपकी टिप्पणी के लिए धन्यवाद, मैं सीमित ज्ञान के कारण प्रश्न को स्पष्ट नहीं कर पा रहा हूं। मैं कुछ उत्तरों की प्रतीक्षा कर सकता हूं, इससे मुझे उसी समय प्रश्न को स्पष्ट करने में मदद मिल सकती है।
हाइताओ दू

3
मैं आपको "उत्तल" की किसी भी परिभाषा से परिचित कराऊंगा जिससे आप परिचित हैं। क्या वे सभी अन्य बिंदुओं के बीच "झूठ बोल" के क्षेत्र में बिंदुओं की अवधारणा को शामिल नहीं करते हैं? यह याद रखने योग्य है, क्योंकि यह आपको फ़ंक्शन के डोमेन की ज्यामिति और साथ ही फ़ंक्शन मानों के किसी भी बीजीय या विश्लेषणात्मक गुणों पर विचार करने के लिए याद दिलाता है। उस प्रकाश में, मेरे साथ ऐसा होता है कि डोमेन उत्तल बनाने के लिए विचरण-अधिकतमकरण सूत्र को थोड़ा संशोधित किया जा सकता है: बस बजाय आवश्यकता होती है । समाधान एक ही है - और जवाब काफी स्पष्ट हो जाता है। एक्स ' एक्स = 1xx1xx=1
whuber

जवाबों:


18

नहीं, पीसीए के सामान्य सूत्र उत्तल समस्याएं नहीं हैं । लेकिन उन्हें उत्तल अनुकूलन समस्या में बदला जा सकता है।

अंतर्दृष्टि और इसका मज़ा केवल उत्तर प्राप्त करने के बजाय परिवर्तनों के अनुक्रम का अनुसरण और कल्पना कर रहा है: यह यात्रा में निहित है, गंतव्य नहीं। इस यात्रा के मुख्य चरण हैं

  1. उद्देश्य समारोह के लिए एक सरल अभिव्यक्ति प्राप्त करें।

  2. अपने डोमेन को बढ़ाएँ, जो उत्तल नहीं है, जो एक है।

  3. उद्देश्य को संशोधित करें, जो उत्तल नहीं है, जो कि एक तरह से है, जो स्पष्ट रूप से उन बिंदुओं को नहीं बदलता है जिन पर यह अपने इष्टतम मूल्यों को प्राप्त करता है।

यदि आप कड़ी निगरानी रखते हैं, तो आप एसवीडी और लैग्रेग मल्टीप्लायरों को दुबकते हुए देख सकते हैं - लेकिन वे सिर्फ एक दृश्य हैं, वहाँ प्राकृतिक रुचि के लिए, और मैं आगे उन पर कोई टिप्पणी नहीं करूंगा।


पीसीए (या कम से कम इसके प्रमुख चरण) का मानक विचरण-अधिकतमकरण है

(*)Maximize f(x)= xAx  subject to  xx=1

जहाँ मैट्रिक्स डेटा से निर्मित एक सममित, धनात्मक-अर्धवृत्ताकार मैट्रिक्स है (आमतौर पर इसके वर्ग और उत्पाद मैट्रिक्स का योग, इसका सहसंयोजक मैट्रिक्स या इसका सहसंबंध मैट्रिक्स)।n×nA

(समान रूप से, हम असंबंधित उद्देश्य को अधिकतम करने का प्रयास कर सकते हैं । न केवल यह एक नास्टियर अभिव्यक्ति है - यह अब एक द्विघात कार्य नहीं है - विशेष मामलों को रेखांकन करेगा। जल्दी से दिखाओ कि यह एक उत्तल कार्य नहीं है, या तो। आमतौर पर कोई भी इस फ़ंक्शन का निरीक्षण करता है, rescalings तहत अपरिवर्तनीय है और फिर इसे विवश सूत्रीकरण तक कम कर देता है ।एक्स λ एक्स ( * )xAx/xxxλx()

किसी भी अनुकूलन समस्या को सार रूप में तैयार किया जा सकता है

कम से कम एक ढूंढें जो फ़ंक्शन को जितना संभव हो उतना बड़ा बनाता है।: एक्सआरxXf:XR

याद रखें कि एक अनुकूलन समस्या उत्तल है जब इसे दो अलग-अलग गुणों का आनंद मिलता है :

  1. डोमेन उत्तल है। XRn इसे कई तरीकों से तैयार किया जा सकता है। एक यह है कि जब भी और और , भी । ज्यामितीय रूप से: जब भी लाइन सेगमेंट के दो समापन बिंदु , तो पूरा खंड में निहित होता है । वाई एक्स 0 λ 1 λ एक्स + ( 1 - λ ) y एक्स एक्स एक्सxXyX0λ1λx+(1λ)yXXX

  2. समारोह f उत्तल है। इसे भी कई तरीकों से तैयार किया जा सकता है। एक यह है कि जब भी और वाई एक्स और 0 λ 1 , ( λ एक्स + ( 1 - λ ) y ) λ ( एक्स ) + ( 1 - λ ) ( y ) (हमें एक्स की जरूरत थीxXyX0λ1

    f(λx+(1λ)y)λf(x)+(1λ)f(y).
    Xकोई मतलब करने के लिए इस हालत के लिए क्रम में उत्तल होने के लिए) ज्यामितीय:। जब भी में किसी भी रेखा खंड है एक्स , का ग्राफ (के रूप में इस क्षेत्र के लिए प्रतिबंधित) को जोड़ने के ऊपर या खंड पर झूठ ( एक्स , ( एक्स ) ) और ( y , ( y ) ) में आर एन + 1xy¯Xf(x,f(x))(y,f(y))Rn+1

    एक उत्तल समारोह का आदर्श स्थानीय स्तर पर गैर सकारात्मक अग्रणी गुणांक के साथ हर जगह परवलयिक है: किसी भी रेखा खंड पर यह रूप में व्यक्त किया जा सकता है के साथ एक 0।yay2+by+ca0.

के साथ एक कठिनाई वह यह है कि एक्स इकाई क्षेत्र है एस एन - 1आर एन जो निश्चित उत्तल नहीं है,। ()XSn1Rn हालाँकि, हम छोटे वैक्टर को शामिल करके इस समस्या को संशोधित कर सकते हैं। ऐसा इसलिए है क्योंकि जब हम एक कारक λ द्वारा को स्केल करते हैं , तो f को λ 2 से गुणा किया जाता है । जब 0 < एक्स ' एक्स < 1 , हम माप सकते हैं एक्स इकाई लंबाई तक यह गुणा करके λ = 1 / xλfλ20<xx<1x, जिससे बढ़तीलेकिन इकाई गेंद के भीतर रहतेडीएन={x आर एन|एक्स'एक्स1} चलो इसलिए हमें पुन:(*)के रूप मेंλ=1/xx>1f Dn={xRnxx1}()

(**)Maximize f(x)= xAx  subject to  xx1

इसका डोमेन जो स्पष्ट रूप से उत्तल है, इसलिए हम वहां आधे रास्ते पर हैं। यह के ग्राफ के उत्तलता पर विचार करता है ।X=Dnf

एक अच्छा तरीका करने के लिए लगता है कि समस्या के बारे में --even अगर आप इसी गणना बाहर ले जाने का इरादा नहीं - स्पेक्ट्रल प्रमेय के संदर्भ में है। () यह कहता है कि एक ऑर्थोगोनल परिवर्तन , आप आर एन के कम से कम एक आधार पा सकते हैं जिसमें विकर्ण है: अर्थात्।PRnA

A=PΣP

जहां के सभी बंद विकर्ण प्रविष्टियों शून्य कर रहे हैं। पी के इस तरह के विकल्प के बारे में ए के बारे में कुछ भी नहीं बदलने के बारे में कल्पना की जा सकती है , लेकिन केवल यह बदलने के लिए कि आप इसका वर्णन कैसे करते हैं : जब आप अपने दृष्टिकोण को घुमाते हैं, तो फ़ंक्शन x के स्तर हाइपरसर्फेस के अक्ष x A x (जो) हमेशा ellipsoids थे) समन्वय अक्षों के साथ संरेखित करें।ΣPAxxAx

के बाद से सकारात्मक-semidefinite है, सभी के विकर्ण प्रविष्टियों Σ गैर नकारात्मक होना चाहिए। हम आगे कुल्हाड़ियों दूसरे स्थान पर रखना कर सकते हैं (जो सिर्फ एक और orthogonal परिवर्तन है, और इसलिए में समाहित किया जा सकता है पी ) है कि आश्वस्त करने के लिए σ 1σ 2σ n0।AΣP

σ1σ2σn0.

अगर हम करते हैं नए निर्देशांक हो एक्स (entailing y = पी एक्स ), समारोह हैx=Pyxy=Pxf

f(y)=yAy=xPAPx=xΣx=σ1x12+σ2x22++σnxn2.

Xσi

()xx=1σ1fXffσ1

g(y)=f(y)σ1yy.

σ1fgfX

σ1σ1yyPyy=xxxg

g(y)=σ1x12++σnxn2σ1(x12++xn2)=(σ2σ1)x22++(σnσ1)xn2.

σ1σiiggx2=x3==xn=0xx=1x1=±1y=P(±1,0,,0)P

gDn=Sn1yy=1fgσ1gfDnfg


4
σ1

सभी काउंट्स पर @amoeba राइट; धन्यवाद। मैंने उस बिंदु की चर्चा को बढ़ाया है।
whuber

3
(+1) आपके उत्तर में, आप एक उत्तल कार्य को परिभाषित करने के लिए प्रतीत होते हैं कि अधिकांश लोग एक अवतल कार्य मानते हैं (शायद चूंकि उत्तल अनुकूलन समस्या में उत्तल डोमेन और अवतल कार्य होता है, जिस पर अधिकतम गणना होती है (या) एक उत्तल समारोह जिस पर एक न्यूनतम गणना की जाती है))
user795305

2
gXf

2
fgg

6

नहीं।

kM

X^=argminrank(X)kMXF2

F

हालांकि मानक उत्तल है, जिस सेट पर इसे ऑप्टिमाइज़ किया गया है वह नॉनवॉन्क्स है।


एक उत्तल छूट पीसीए की समस्या का उत्तल कम रैंक सन्निकटन कहा जाता है

X^=argminXcMXF2

1

आप विवरण के लिए सांख्यिकीय सीखने को स्पार्सिटी , ch 6 (मैट्रिक्स डिकम्पोजिशन) के साथ देख सकते हैं ।

यदि आप अधिक सामान्य समस्याओं में रुचि रखते हैं और वे कैसे उत्तलता से संबंधित हैं, तो सामान्यीकृत निम्न रैंक मॉडल देखें


1

अस्वीकरण: पिछले उत्तर यह समझाने का एक बहुत अच्छा काम करते हैं कि कैसे पीसीए अपने मूल निर्माण में गैर-उत्तल है लेकिन उत्तल अनुकूलन समस्या में बदला जा सकता है। मेरा उत्तर केवल उन गरीब आत्माओं (जैसे कि मेरे लिए) के लिए है, जो इकाई क्षेत्रों और SVDs के शब्दजाल से परिचित नहीं हैं - जो कि, btw, जानना अच्छा है।

मेरा स्रोत प्रो। तिब्शीरानी द्वारा किया गया यह व्याख्यान नोट्स है

उत्तल अनुकूलन तकनीकों के साथ हल की जाने वाली अनुकूलन समस्या के लिए, दो आवश्यक शर्तें हैं।

  1. उद्देश्य फ़ंक्शन को उत्तल करना होगा।
  2. बाधा कार्यों को भी उत्तल होना चाहिए।

पीसीए के अधिकांश योगों में एक मैट्रिक्स के रैंक पर एक बाधा शामिल होती है।

rank(X)=k,J11J22


Xk

Xk
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.