दूरी (मैट्रिक्स) मैट्रिक्स के लिए समानता मैट्रिक्स परिवर्तित


27

रैंडम वन एल्गोरिथ्म में, ब्रीमन (लेखक) समानता मैट्रिक्स का निर्माण निम्नानुसार करता है:

  1. जंगल में प्रत्येक पेड़ के नीचे सभी सीखने के उदाहरण भेजें

  2. यदि दो उदाहरणों में समान मैट्रिक्स में एक समान पत्ती वृद्धि के तत्व में 1 से भूमि आती है

  3. पेड़ों की संख्या के साथ मैट्रिक्स को सामान्य करें

वह कहता है:

मामलों n और k के बीच स्थितियाँ एक मैट्रिक्स {prox (n, k)} बनाती हैं। उनकी परिभाषा से, यह दिखाना आसान है कि यह मैट्रिक्स 1 के ऊपर सममित, सकारात्मक निश्चित और 1 से घिरा हुआ है, 1. के बराबर विकर्ण तत्व के साथ। यह निम्नानुसार है कि 1-प्रॉक्स (एन, के) मान एक यूक्लिडियन में वर्ग दूरी हैं। आयामों का स्थान मामलों की संख्या से अधिक नहीं है। स्रोत

अपने कार्यान्वयन में, वह sqrt (1-प्रॉक्स) का उपयोग करता है , जहां प्रॉक्स एक समानता मैट्रिक्स है, इसे डिस्टेंस मैट्रिक्स में परिवर्तित करने के लिए। मुझे लगता है कि इसे "यूक्लिडियन स्पेस में चक्रवात दूरियों" के साथ कुछ करना है-ऊपर दिया गया है।

क्या कोई इस बात पर थोड़ा प्रकाश डाल सकता है कि यह क्यों है कि यूक्लिडियन स्पेस में 1-प्रॉक्स दूर की दूरी पर है और दूरी मैट्रिक्स पाने के लिए वह स्क्वेर्ड रूट का उपयोग क्यों करता है?

जवाबों:


30

enter image description here

कोसाइन प्रमेय के अनुसार , यूक्लिडियन स्पेस में (इयूक्लिडियन) दो बिंदुओं (वैक्टर) 1 और 2 के बीच की दूरी । चौकोर लंबाई h 2 1 और h 2 2 हैd122=h12+h222h1h2cosϕh12h22 क्रमशः अंक 1 और 2 के वर्ग निर्देशांक के योग हैं, (वे पाइथोगोरियन कर्ण हैं)। मात्रा कहा जाता है अदिश उत्पादh1h2cosϕ (= डॉट उत्पाद, वैक्टर 1 और 2 के आंतरिक उत्पाद)।

स्केलर उत्पाद को 1 और 2 के बीच एक कोण-प्रकार की समानता भी कहा जाता है, और यूक्लिडियन अंतरिक्ष में यह ज्यामितीय रूप से सबसे वैध समानता माप है, क्योंकि यह आसानी से यूक्लिडियन दूरी और इसके विपरीत ( यहां देखें ) में परिवर्तित हो जाता है ।

सहप्रसरण गुणांक और पियर्सन सहसंबंध हैं अदिश उत्पादों। यदि आप अपने बहुभिन्नरूपी डेटा को केंद्र में रखते हैं (ताकि मूल बिंदुओं के बादल के केंद्र में हो) तो का सामान्यीकृत वैक्टर के वेरिएंट होते हैं (ऊपर की तस्वीर पर चर X और Y की नहीं), जबकि cos iv के लिए केंद्रित डेटा पियर्सन आर है ; हां, एक अदिश उत्पाद σh2cosϕr सहप्रसरण है। [एक ओर ध्यान दें। यदि आप अभीडेटा के नहीं बल्किचर केबीच सहसंबंध / सहसंबंध के बारे में सोच रहे हैं, तो आप पूछ सकते हैं कि क्या वैरिएबल होने के लिए वैरिएबल खींचना संभव है जैसे कि ऊपर की तस्वीर पर। हां, संभव है, इसे "σ1σ2r12विषय स्थान "प्रतिनिधित्व का तरीका। कोसाइन प्रमेय इस उदाहरण पर" वैक्टर "के रूप में जो भी लिया जाता है, उसके बावजूद सही रहता है - डेटा पॉइंट या डेटा सुविधाएँ।]

hsd2=2(1s)d2d2=1srr

sshd

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.