निम्नलिखित लोव 2004 पेपर ( http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf ) से है।
एक स्पष्ट दृष्टिकोण उचित पैमाने पर मुख्य बिंदु के आसपास स्थानीय छवि तीव्रता का नमूना लेना होगा, और सामान्यीकृत सहसंबंध उपाय का उपयोग करके इनका मिलान करना होगा। हालांकि, छवि पैच का साधारण सहसंबंध उन परिवर्तनों के प्रति अत्यधिक संवेदनशील है, जो नमूनों के गलत उपयोग का कारण बनते हैं, जैसे कि point ne या 3D व्यूपॉइंट परिवर्तन या गैर-कठोर विकृति। एडलमैन, इंट्रेटर और पोगियो (1997) द्वारा एक बेहतर दृष्टिकोण का प्रदर्शन किया गया है। उनका प्रस्तावित प्रतिनिधित्व जैविक दृष्टि के एक मॉडल पर आधारित था, विशेष रूप से प्राथमिक दृश्य प्रांतस्था में जटिल न्यूरॉन्स के।ये जटिल न्यूरॉन्स एक विशेष अभिविन्यास और स्थानिक आवृत्ति पर एक ढाल का जवाब देते हैं, लेकिन रेटिना पर ग्रेडिएंट के स्थान को ठीक स्थानीयकृत होने के बजाय एक छोटे ग्रहणशील rather बड़े पर स्थानांतरित करने की अनुमति दी जाती है। एडेलमैन एट अल। परिकल्पना है कि इन जटिल न्यूरॉन्स का कार्य 3 डी वस्तुओं के मिलान और मान्यता की दृष्टि से देखने के लिए अनुमति देना था।
मैं SIFT डिस्क्रिप्टर को समझने की कोशिश कर रहा हूं। मैं पिछले चरण (कीपॉइंट डिटेक्टर) को समझता हूं।
मुझे नहीं पता कि इसे क्यों लागू किया गया है। मैं कहानी के पीछे की कहानी जानना चाहता हूं।