SIFT / SURF के लिए कुछ मुफ्त विकल्प हैं जो वाणिज्यिक अनुप्रयोगों में उपयोग किए जा सकते हैं?


66

जहाँ तक मैं समझता हूँ, SURF और SIFT दोनों ही पेटेंट संरक्षित हैं।
क्या कोई वैकल्पिक तरीके हैं जो किसी व्यावसायिक अनुप्रयोग में स्वतंत्र रूप से उपयोग किए जा सकते हैं ?

पेटेंट की अधिक जानकारी के लिए देखें : http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html


7
याद रखें कि वे केवल उन देशों में पेटेंट कराए जाते हैं, जो सॉफ्टवेयर पेटेंट की अनुमति देते हैं - जो (अभी तक) में शामिल नहीं हैं
मार्टिन बेकेट

1
@MartinBeckett, क्या विकास, परिनियोजन, या दोनों को कवर करता है?
एंड्रे रुबेश्टिन

2
यह सॉफ्टवेयर पेटेंट के बारे में मुश्किल बात है। एक पेटेंट किसी देश में निर्माण या बिक्री को रोकता है लेकिन अनुसंधान या विकास को नहीं। अब सॉफ्टवेयर डेवलपमेंट क्या है?
मार्टिन बेकेट

SIFT में वास्तव में क्या पेटेंट है? SIFT के तीन चरण हैं: (i) स्केल स्पेस का निर्माण, (ii) की-पॉइंट डिटेक्टर और (iii) डिस्क्रिप्टर जनरेटर। मेरी भावना यह है कि केवल डिस्क्रिप्टर जेनरेटर ही पेटेंट है। क्या मैं सही हूँ? धन्यवाद

यह पूछे गए प्रश्न का उत्तर नहीं है, और जैसा कि उत्तरों के बजाय टिप्पणियों में है।
ThP

जवाबों:


62

SIFT और SURF दोनों लेखकों को अपने मूल एल्गोरिदम के उपयोग के लिए लाइसेंस फीस की आवश्यकता होती है।

मैंने स्थिति के बारे में कुछ शोध किए हैं और यहां संभावित विकल्प दिए गए हैं:

मुख्य बिंदु डिटेक्टर:

  • हैरिस कॉर्नर डिटेक्टर
  • हैरिस-लाप्लास - हैरिस डिटेक्टर का स्केल-इनवेरिएंट संस्करण (एक एफाइन इनवेरिएंट संस्करण भी मौजूद है, जिसे मिकोलाज़स्की और श्मिट द्वारा प्रस्तुत किया गया है, और मेरा मानना ​​है कि यह भी पेटेंट मुक्त है)।
  • मल्टी-स्केल ओरिएंटेड पैच (एमओपी) - हालांकि यह पेटेंट कराया गया है, डिटेक्टर मूल रूप से मल्टी-स्केल हैरिस है, इसलिए इसके साथ कोई समस्या नहीं होगी (विवरणक 2D तरंगिका-रूपांतरित छवि पैच है)
  • LoG फ़िल्टर - चूंकि पेटेंट SIFT, स्केल में ब्याज बिंदुओं को स्थानीय बनाने के लिए LoG (Gaussian का अंतर) (Gaussian का अंतर) का उपयोग करता है, LoG अकेले संशोधित, पेटेंट-मुक्त एल्गोरिथ्म में इस्तेमाल किया जा सकता है, कठिन कार्यान्वयन थोड़ा धीमा चला सकता है।
  • फास्ट
  • BRISK (विवरणक शामिल है)
  • ORB (एक विवरणक शामिल है)
  • KAZE - उपयोग करने के लिए नि: शुल्क, M-SURF डिस्क्रिप्टर (KAZE के nonlinear स्केल स्पेस के लिए संशोधित), SIFT और SURF दोनों को बेहतर बनाता है
  • A-KAZE - KAZE का त्वरित संस्करण, उपयोग करने के लिए मुफ़्त, M-LDB डिस्क्रिप्टर (संशोधित फास्ट बाइनरी एक्सपर्टर)

मुख्य विवरण:

  • सामान्यीकृत ढाल - सरल, कार्यशील समाधान
  • पीसीए ने छवि पैच को बदल दिया
  • वेवलेट रूपांतरित छवि पैच - विवरण एमओपीएस पेपर में दिए गए हैं, लेकिन पेटेंट मुद्दे से बचने के लिए इसे अलग तरीके से लागू किया जा सकता है (जैसे विभिन्न तरंगिका आधार या अलग-अलग अनुक्रमण योजना का उपयोग करके)
  • उन्मुख ग्रेडिएंट्स का हिस्टोग्राम
  • GLOH
  • lesh
  • तेज
  • ओर्ब
  • सनकी
  • LDB

ध्यान दें कि यदि आप ब्याज बिंदु के लिए अभिविन्यास प्रदान करते हैं और तदनुसार छवि पैच को घुमाते हैं, तो आपको मुफ्त में घूर्णी व्युत्क्रम मिलता है। यहां तक ​​कि हैरिस कोने घूर्णी रूप से अपरिवर्तनीय हैं और विवरणक भी बनाया जा सकता है।

हगिन में कुछ और पूर्ण समाधान किया जाता है, क्योंकि वे पेटेंट-मुक्त ब्याज बिंदु डिटेक्टर के लिए भी संघर्ष करते थे।


आपके उत्तर के लिए धन्यवाद। क्या उन्हें रॉयल्टी चाहिए?
एंड्रे रुबेश्टिन

1
हां, दोनों को रॉयल्टी फीस चाहिए। मूल्य पर बातचीत करने की आवश्यकता है, लेकिन यह लगभग 20.000 USD / वर्ष है और रॉयल्टी शुल्क लगभग 5% है। MOPs अब Microsoft द्वारा पेटेंट कराया गया है (मैंने पेटेंट के बारे में अधिक जानकारी के लिए रिचर्ड सेज़िस्की से संपर्क किया है)।
लिबोर

1
पेटेंट सिद्धांत रूप में सार्वजनिक कर रहे हैं, इसलिए यदि आप इसके बारे में अधिक जानना चाहते हैं, यह पेटेंट डेटाबेस में देखो (जैसे यूरोपीय डाटाबेस
Geerten

क्या उनमें से कोई भी मुख्य वर्णनकर्ता स्केल-इनवेरिएंट हैं?
डिएगो

1
हैरिस-लाप्लास स्केल-इनवेरिएंट है। या आप अन्य डिटेक्टरों को स्केल-इनवेरिएंट बना सकते हैं, स्केल स्पेस मैक्सिमा को फ़िल्टर करके और प्रत्येक ज्ञात बिंदु के लिए एक विशेषता स्केल कंप्यूटिंग कर सकते हैं।
लिबोर

26

एक अपेक्षाकृत नई विधि है, आप इस पर गौर करना चाहते हैं: BRISK , बाइनरी रोबस्ट इनवेरिएंट स्केलेबल कीप्वाइंट्स :

इस पत्र में हम BRISK का प्रस्ताव रखते हैं, जो कि कीपिंग डिटेक्शन, विवरण और मिलान के लिए एक उपन्यास विधि है। बेंचमार्क डेटासेट पर एक व्यापक मूल्यांकन में अत्याधुनिक एल्गोरिदम के रूप में BRISK के अनुकूली, उच्च गुणवत्ता वाले प्रदर्शन का पता चलता है, यद्यपि नाटकीय रूप से कम कम्प्यूटेशनल लागत (मामलों में SURF की तुलना में तेजी से परिमाण का एक क्रम) पर। गति की कुंजी एक उपन्यास स्केल-स्पेस FAST- आधारित डिटेक्टर के संयोजन में निहित है, प्रत्येक कीपपॉइंट पड़ोस के समर्पित नमूने द्वारा पुनर्प्राप्त तीव्रता तुलना से बिट-स्ट्रिंग डिस्क्रिप्टर की असेंबली के साथ संयोजन में।

यह पेटेंट-मुक्त और उपयोग करने के लिए स्वतंत्र है (जैसा कि एल्गोरिथ्म के लेखक द्वारा बताया गया था)।


12

यहां किसी पर भरोसा न करें, किसी वकील से बात करें। अगर मैं कहूं, तो कानूनी दुनिया हमसे बिल्कुल अलग है। आप वास्तव में क्या करना चाहते हैं (और कहां, आदि) के आधार पर, एक समाधान हो सकता है जहां आप SURF या SIFT का उपयोग कर सकते हैं। मैं अतीत में हैरान था कि कैसे मजबूत लाइसेंस पर काबू पाया जा सकता है।


8

मैं बल्कि KAZE / AKAZE में देखूंगा, जो महत्वपूर्ण गति के साथ समान रूप से अच्छा प्रदर्शन करता है। विकृति के मामलों को भी सहन किया जाता है। OpenCV ने हाल ही में GSoC 2014 के माध्यम से एक कार्यान्वयन प्राप्त किया है। आप इसे यहां पा सकते हैं । इसका OpenCV ट्यूटोरियल भी यहां मौजूद है


धन्यवाद। KAZE आशाजनक लग रहा है - यह SIFT / SURF की तुलना में बेहतर समग्र प्रदर्शन है। हालांकि नॉनलाइन स्केल स्केल गणना को लागू करना कठिन हो सकता है, यह प्रयास के लायक हो सकता है।
लिबोर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.