लोगो का पता लगाने के लिए AI या न्यूरल नेटवर्क का उपयोग करें

10

मैं एक वीडियो फ़ाइल के अंदर एक टीवी चैनल लोगो का पता लगाने की कोशिश कर रहा हूं, इसलिए बस एक इनपुट .mp4वीडियो दिया गया है , यह पता लगाएं कि क्या यह एक विशिष्ट फ्रेम में मौजूद लोगो है, पहले फ्रेम कहें या नहीं।

हमारे पास पहले से ही वह लोगो है (हालाँकि% 100 समान आकार नहीं हो सकता है) और स्थान हमेशा तय होता है।

मेरे पास पहले से ही एक पैटर्न मिलान-आधारित दृष्टिकोण है। लेकिन इसके लिए पैटर्न 100% समान होना चाहिए। मैं इसे प्राप्त करने के लिए डीप लर्निंग और न्यूरल नेटवर्क का उपयोग करना चाहूंगा। मैं उसे कैसे कर सकता हूँ? मेरा मानना है कि सीएनएन की उच्च दक्षता हो सकती है?

— टीना जे
स्रोत

1

ऐ में आपका स्वागत है! महान विषय।

— DukeZhou

1

@DukeZhou Tnx! मुझे आशा है कि मुझे कुछ नमूना कोड के संकेत के साथ उचित उत्तर मिलेंगे।

— टीना जे

5

छवि पहचान करने के लिए आपको कुछ विशेषताओं के साथ छवि का प्रतिनिधित्व करने का एक तरीका खोजना होगा।

एक अच्छी छवि पहचान एल्गोरिथ्म की परिभाषित विशेषताओं में से एक यह है कि यह खारे क्षेत्रों का पता लगाने की क्षमता है, यानी ऐसे क्षेत्र जिनमें सबसे अधिक जानकारी होती है

वर्तमान में सामग्री-आधारित छवि वर्गीकरण के लिए गहन सीखने पर बहुत ध्यान दिया जाता है। आप सीएनएन की तीन या अधिक परतों वाले गहरी सीखने को लागू करके अच्छे परिणाम प्राप्त कर सकते हैं, जहां प्रत्येक परत छवि की एक या अधिक विशेषता निकालने के लिए जिम्मेदार है।

— सेठ सिम्बा
स्रोत

धन्यवाद। मैं खुद CNN का आदमी नहीं हूं। लेकिन क्या कोई स्रोत कोड के लिए कोई संकेतक है जिसने लोगो छवि दी है, यह पता लगा सकता है कि यह मौजूद है या नहीं?

— टीना जे

3

अरे, कृपया सतलोक कोविंद द्वारा दीपलोगो को जीथूब पर देखें। यह पायथन पर लिखा गया है और ब्रांड लोगो को पहचानने के लिए सीएनएन का उपयोग करता है। मैंने नीचे लिंक दिया है। चीयर्स। github.com/satojkovic/DeepLogo

— सेठ सिम्बा

3

क्योंकि यह वीडियो इनपुट है और लोगो आमतौर पर स्थिर होते हैं क्योंकि वे हार्डवेयर या सॉफ़्टवेयर द्वारा लाइव या रिकॉर्ड किए गए फ़्रेम पर स्तरित होते हैं, कार्य कठिन नहीं है। लोगो में आमतौर पर सीमित रंग पट्टियाँ और कुरकुरा किनारे भी होते हैं। उनके फॉन्ट की विशेषताएं, जब वे शब्द या सम्‍मिलित करते हैं तो आमतौर पर संगत भी होते हैं। ये सामान्य ज्ञान हैं जिनका गहन शिक्षा में उपयोग किया जा सकता है।

इस लेखक द्वारा पोस्ट किए गए अन्य इसी तरह के प्रश्न के साथ, LSTM और CNN परतों के संयोजन को लोगो को खोजने और अलग करने के लिए प्रशिक्षित किया जा सकता है। कुछ इमेज ट्रिक्स के साथ, लोगो के पीछे की छवि को भी एक समान सटीकता और विश्वसनीयता के साथ पुन: निर्मित किया जा सकता है, जो लोगो के चारों ओर सीखने की तकनीकों के समान सेट के माध्यम से पिक्सेल से प्राप्त होता है।

ये विकास के लिए कुछ शुरुआती बिंदु हैं।

— डगलस डसेको
स्रोत