आप सही रास्ते पर हैं।
Invariance का अर्थ है कि आप किसी वस्तु को एक वस्तु के रूप में पहचान सकते हैं, तब भी जब उसका स्वरूप किसी न किसी रूप में भिन्न होता है। यह आम तौर पर एक अच्छी बात है, क्योंकि यह दृश्य / इनपुट की बारीकियों में दर्शक / कैमरा और वस्तु के सापेक्ष स्थिति जैसे परिवर्तनों के बीच वस्तु की पहचान, श्रेणी (आदि) को संरक्षित करता है।
नीचे दी गई छवि में एक ही प्रतिमा के कई दृश्य हैं। आप (और अच्छी तरह से प्रशिक्षित तंत्रिका नेटवर्क) यह पहचान सकते हैं कि हर चित्र में एक ही वस्तु दिखाई देती है, भले ही वास्तविक पिक्सेल मूल्य काफी भिन्न हों।
ध्यान दें कि यहां अनुवाद का एक विशिष्ट अर्थ है, ज्यामिति से उधार लिया गया। यह किसी भी प्रकार के रूपांतरण का उल्लेख नहीं करता है, इसके विपरीत, फ्रांसीसी से अंग्रेजी में अनुवाद या फ़ाइल स्वरूपों के बीच। इसके बजाय, इसका मतलब है कि छवि में प्रत्येक बिंदु / पिक्सेल को एक ही दिशा में समान मात्रा में स्थानांतरित किया गया है। वैकल्पिक रूप से, आप मूल के बारे में सोच सकते हैं क्योंकि विपरीत दिशा में एक समान राशि स्थानांतरित की गई है। उदाहरण के लिए, हम प्रत्येक पिक्सेल 50 या 100 पिक्सेल को दाईं ओर ले जाकर पहली पंक्ति में दूसरी और तीसरी छवियां उत्पन्न कर सकते हैं।
कोई यह दिखा सकता है कि अनुवाद के संबंध में कनवल्शन ऑपरेटर कमिट करता है। आप convolve तो
च के साथ
जी , यह बात अगर आप convolved उत्पादन अनुवाद नहीं करता है
च∗ जी , या यदि आप अनुवाद
f या
g पहले तो उन्हें convolve। विकिपीडिया में कुछ
ज्यादा है ।
अनुवाद-अपरिवर्तनीय वस्तु मान्यता के लिए एक दृष्टिकोण वस्तु का "टेम्पलेट" लेना है और छवि में ऑब्जेक्ट के हर संभावित स्थान के साथ इसे प्रमाणित करना है। यदि आपको किसी स्थान पर बड़ी प्रतिक्रिया मिलती है, तो यह सुझाव देता है कि टेम्पलेट जैसा दिखने वाला ऑब्जेक्ट उस स्थान पर स्थित है। इस दृष्टिकोण को अक्सर टेम्पलेट-मिलान कहा जाता है ।
Invariance बनाम Equivariance
Santanu_Pattanayak के जवाब ( यहाँ ) बताते अनुवाद के बीच एक अंतर है कि निश्चरता और अनुवाद equivariance । ट्रांसलेशन इनवेरियन का मतलब है कि सिस्टम उसी प्रतिक्रिया का उत्पादन करता है, भले ही इसका इनपुट कैसे शिफ्ट किया गया हो। उदाहरण के लिए, शीर्ष पंक्ति में सभी तीन छवियों के लिए एक फेस-डिटेक्टर "फेस एफओसीडी" की रिपोर्ट कर सकता है। इक्विवेरियन का मतलब है कि सिस्टम पदों पर समान रूप से अच्छी तरह से काम करता है, लेकिन इसकी प्रतिक्रिया लक्ष्य की स्थिति के साथ बदल जाती है। उदाहरण के लिए, "फेस-इनस" का हीट मैप बाईं, केंद्र और दाईं ओर समान होता है, जब यह छवियों की पहली पंक्ति को संसाधित करता है।
यह कभी-कभी एक महत्वपूर्ण अंतर होता है, लेकिन बहुत से लोग दोनों घटनाओं को "इनवेरियन" कहते हैं, खासकर जब से यह एक तुच्छ प्रतिक्रिया को एक अपरिवर्तनीय में बदलने के लिए तुच्छ होता है - बस सभी स्थिति की जानकारी की उपेक्षा)।