मैं एक अच्छे तर्क की तलाश में हूं कि मशीन लर्निंग में यूक्लिडियन दूरी पर मैनहट्टन की दूरी का उपयोग क्यों किया जाए ।
इस MIT लेक्चर पर अब तक मुझे जो सबसे अच्छी बात लगी, वह है ।
36:15 पर आप निम्नलिखित बयान देख सकते हैं:
"आमतौर पर यूक्लिडियन मीट्रिक का उपयोग करें; मैनहट्टन उपयुक्त हो सकता है यदि विभिन्न आयाम तुलनीय नहीं हैं। "
कुछ ही समय बाद प्रोफेसर कहते हैं कि, क्योंकि एक सरीसृप के पैरों की संख्या 0 से 4 तक भिन्न होती है (जबकि अन्य विशेषताएं बाइनरी हैं, केवल 0 से 1 तक भिन्न होती हैं), "पैरों की संख्या" सुविधा बहुत अधिक होने पर समाप्त हो जाएगी वजन अगर यूक्लिडियन दूरी का उपयोग किया जाता है। यकीन है कि पर्याप्त, वास्तव में सही है। लेकिन मैनहट्टन दूरी का उपयोग करने पर भी किसी को यह समस्या होगी (केवल यह कि समस्या थोड़ी कम हो जाएगी क्योंकि हम अंतर को यूक्लिडियन दूरी पर नहीं करते हैं)।
उपरोक्त समस्या को हल करने का एक बेहतर तरीका "पैरों की संख्या" सुविधा को सामान्य करना होगा, इसलिए इसका मूल्य हमेशा 0 और 1 के बीच होगा।
इसलिए, चूंकि समस्या को हल करने का एक बेहतर तरीका है, इसलिए ऐसा महसूस हुआ कि इस मामले में मैनहट्टन दूरी का उपयोग करने के तर्क में एक मजबूत बिंदु का अभाव था, कम से कम मेरी राय में।
क्या किसी को वास्तव में पता है कि क्यों और कब कोई यूक्लिडियन से अधिक मैनहट्टन दूरी का उपयोग करेगा? क्या कोई मुझे एक उदाहरण दे सकता है जिसमें मैनहट्टन दूरी का उपयोग करने से बेहतर परिणाम मिलेंगे?