LLE (स्थानीय रैखिक एम्बेडिंग) एल्गोरिथ्म के चरण बताएं?


13

मैं समझता हूं कि एलएलई के लिए एल्गोरिथ्म के पीछे मूल सिद्धांत तीन चरणों के होते हैं।

  1. कुछ मीट्रिक जैसे k-nn द्वारा प्रत्येक डेटा बिंदु के पड़ोस का पता लगाना।
  2. प्रत्येक पड़ोसी के लिए वेट खोजें, जो डेटा बिंदु पर पड़ोसी के प्रभाव को दर्शाता है।
  3. गणना की गई वज़न के आधार पर डेटा के कम आयामी एम्बेडिंग का निर्माण करें।

लेकिन चरण 2 और 3 की गणितीय व्याख्या उन सभी पाठ्य पुस्तकों और ऑनलाइन संसाधनों में भ्रमित हैं जो मैंने पढ़े हैं। सूत्रों का उपयोग क्यों किया जाता है, इसका मैं कारण नहीं बता पा रहा हूं।

इन चरणों का अभ्यास कैसे किया जाता है? क्या गणितीय सूत्रों का उपयोग करने का कोई सहज तरीका है?

सन्दर्भ: http://www.cs.nyu.edu/~roweis/lle/publications.html

जवाबों:


10

स्थानीय रैखिक एम्बेडिंग (LLE) दूर की वस्तुओं के बीच दूरी का अनुमान लगाने की आवश्यकता को समाप्त करता है और स्थानीय रैखिक फिट द्वारा वैश्विक गैर-रैखिक संरचना को पुनर्प्राप्त करता है। एलएलई लाभप्रद है क्योंकि इसमें सीखने की दर या अभिसरण मानदंड जैसे कोई पैरामीटर शामिल नहीं हैं। LLE भी के आंतरिक आयाम के साथ अच्छी तरह से तराजू । LLE के लिए उद्देश्य फ़ंक्शन यदि मैं और जम्मू वस्तुओं के लिए भार मैट्रिक्स W तत्व w i को j पर सेट करें तो jY

ζ(Y)=(YWY)2=Y(IW)(IW)Y
यू = जी β यू कश्मीर × 1 जी कश्मीर × कश्मीर मैं β कश्मीर × 1 डी कश्मीर × कश्मीर पी x मैं जी τ τ एल मीटर = - 1Wwijijji का कोई निकटतम पड़ोसी नहीं हूं , अन्यथा, वस्तु के K- निकटतम पड़ोसियों के लिए वज़न i कम से कम वर्ग के माध्यम से निर्धारित होता है जो कि जहां निर्भर चर एक है लोगों की वेक्टर, एक है वस्तु के सभी निकटतम पड़ोसियों के लिए ग्राम मैट्रिक्स , और एक वजन का वेक्टर है जो सम-टू-यूनिटी बाधाओं का पालन करता है। Let एक सममित सकारात्मक अर्धविराम
U=Gβ
UK×1GK×KiβK×1DK×Kदूरी- के सभी जोड़े के लिए दूरी मैट्रिक्स -डायमेंशनल ऑब्जेक्ट । यह दिखाया जा सकता है कि तत्वों- साथ तत्वों -केंद्रित दूरी मैट्रिक्स के प्रतिगमन गुणांक निर्धारित संख्यानुसार उपयोग कर रहे हैं pxiGτ
τlm=12(dlm21Kldlm21Kmdlm2+lmdlm2).
K
βK×1=(ττ)K×K1τUK×1,
और यह पुष्टि करने के लिए जाँच की जाती है कि वे एकता के योग हैं। के मान पंक्ति में एम्बेडेड रहे हैं के वस्तु के कश्मीर निकटतम पड़ोसियों के लिए इसी विभिन्न स्तंभ पदों पर , साथ ही पक्षांतरित तत्वों। यह डेटासेट में प्रत्येक वें ऑब्जेक्ट के लिए दोहराया जाता है । यह ध्यान देने योग्य है कि यदि निकटतम पड़ोसी की संख्या बहुत कम है, तो को विरल हो सकता है, जिससे ईजेननलिसिस मुश्किल हो सकता है। यह देखा गया कि निकटतम पड़ोसियों का परिणामβiWiiKWK=9Wमैट्रिंस जिनमें ईजेननलिसिस के दौरान पैथोलॉजी नहीं थी। वस्तुनिष्ठ फ़ंक्शन को के सबसे छोटे गैर-शून्य eigenvalues ​​को खोजने के द्वारा किया जाता है। का घटा हुआ रूप द्वारा दर्शाया जाता है, जहां के आयाम जो कि के दो सबसे कम पर आधारित हैं। ।
(IW)(IW)E=ΛDE.
XY=EEn×2Λ


"के = 9 निकटतम पड़ोसी" क्या यह की पर निर्भर नहीं करता है ? उदाहरण के लिए, यदि 9 आयाम कम हैं, तो वेट मैट्रिक्स विशिष्ट रूप से निर्धारित नहीं है। क्या इससे LLE को समस्या होती है? Y YYW
स्कॉट

हां, लेकिन अगर 8 आयामों की बात करें, तो यादृच्छिक डेटा के लिए शाब्दिक रूप से हर बिंदु को 9 अन्य लोगों के रैखिक संयोजन के रूप में पूरी तरह से लिखा जा सकता है, अनंत तरीकों से।
स्कॉट

तकनीक को लागू करते समय हमेशा "क्या होगा अगर" परिदृश्य होते हैं, और यही कारण है कि पैरामीटर बाधाओं का उपयोग किया जाता है।
१।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.