"स्केल-इनवेरिएंट" शब्द का अर्थ यहाँ निम्नलिखित है। चलो कहते हैं कि तुम छवि है मैं , और आप एक सुविधा (एक ब्याज बिंदु उर्फ) का पता चला है च कुछ स्थान पर (एक्स, वाई) और कुछ पैमाने स्तर पर रों । अब मान लें कि आपके पास एक छवि I 'है , जो कि I का छोटा संस्करण है (उदाहरण के लिए, डाउनसम्पल्ड)। तो फिर, अगर आपके सुविधा डिटेक्टर पैमाने-अपरिवर्तनीय है, तो आप इसी सुविधा का पता लगाने के लिए सक्षम होना चाहिए 'एफ में मैं' इसी स्थान पर (एक्स ', वाई') और इसी पैमाने s ' है, जहां (एक्स, वाई, एस) और (x ', y', s ') उपयुक्त स्केलिंग परिवर्तन द्वारा संबंधित हैं।
दूसरे शब्दों में, यदि आपके स्केल-इनवेरिएंट डिटेक्टर ने किसी के चेहरे के अनुरूप एक फीचर बिंदु का पता लगाया है, और फिर आप उसी दृश्य पर अपने कैमरे से ज़ूम इन या आउट करते हैं, तो आपको अभी भी उस चेहरे पर एक सुविधा बिंदु का पता लगाना चाहिए।
बेशक, आप एक "फीचर डिस्क्रिप्टर" भी चाहते हैं जो आपको दो विशेषताओं से मेल खाने की अनुमति देगा, जो कि वास्तव में SIFT आपको देता है।
इसलिए, आपको आगे भ्रमित करने के जोखिम में, दो चीजें हैं जो यहां पैमाने-अपरिवर्तनीय हैं। एक DoG ब्याज बिंदु डिटेक्टर है, जो स्केल-इनवेरिएंट है, क्योंकि यह एक विशेष प्रकार की छवि सुविधाओं (ब्लॉब्स) का पता लगाता है, भले ही उनके पैमाने कुछ भी हों। दूसरे शब्दों में, DoG डिटेक्टर किसी भी आकार के ब्लब्स का पता लगाता है। दूसरी स्केल-इनवेरिएंट चीज़ फीचर डिस्क्रिप्टर है, जो ग्रेडिएंट ओरिएंटेशन का एक हिस्टोग्राम है, जो स्केल में बदलाव के बावजूद एक ही इमेज फीचर के लिए कम या ज्यादा समान रहता है।
वैसे, गॉसियंस के अंतर का उपयोग यहां लैपेलियन-ऑफ-गॉसियन फिल्टर के एक सन्निकटन के रूप में किया जाता है।