मैं एक वीडियो फ़ाइल के अंदर एक टीवी चैनल लोगो का पता लगाने की कोशिश कर रहा हूं, इसलिए बस एक इनपुट .mp4
वीडियो दिया गया है , यह पता लगाएं कि क्या यह एक विशिष्ट फ्रेम में मौजूद लोगो है, पहले फ्रेम कहें या नहीं।
हमारे पास पहले से ही वह लोगो है (हालाँकि% 100 समान आकार नहीं हो सकता है) और स्थान हमेशा तय होता है।
मेरे पास पहले से ही एक पैटर्न मिलान-आधारित दृष्टिकोण है। लेकिन इसके लिए पैटर्न 100% समान होना चाहिए। मैं इसे प्राप्त करने के लिए डीप लर्निंग और न्यूरल नेटवर्क का उपयोग करना चाहूंगा। मैं उसे कैसे कर सकता हूँ? मेरा मानना है कि सीएनएन की उच्च दक्षता हो सकती है?