छवि वर्गीकरण के लिए गैर-वर्ग छवियां


9

मेरे पास विस्तृत चित्र का डेटासेट है: 1760x128 हालांकि मैंने ट्यूटोरियल और किताबें पढ़ी हैं, और उनमें से अधिकांश में कहा गया है कि इनपुट छवियों को वर्ग होना चाहिए और यदि नहीं, तो वे पहले से ही प्रशिक्षित (वर्ग छवियों पर) cnns में प्रशिक्षित होने के लिए वर्ग में बदल जाते हैं। क्या गैर वर्ग चित्रों के लिए cnn को प्रशिक्षित करने का एक तरीका है, या क्या मुझे गद्दी के रूप में किसी अन्य विकल्प की तलाश करनी चाहिए?

जवाबों:


4

वर्गीकरण के आधार पर समस्या को हल करने के कई तरीके हैं। स्लाइडिंग विंडोज वह विधि है जिससे मैं सबसे अधिक परिचित हूं, इसका उपयोग तंत्रिका नेटवर्क विधियों के लिए किया जाता है। इस विधि में एक छोटी उप-छवि लेना और कुछ ओवरलैप के साथ इसे ऊपर और नीचे शिफ्ट करना शामिल है। कुछ मुद्दों में इष्टतम बदलाव के मापदंडों और बहु ​​पैमाने के मुद्दों को खोजना शामिल है।

अंतिम पहचान आमतौर पर इस बात से निर्धारित होती है कि क्लासिफायर कितना आश्वस्त है कि प्रत्येक उप-छवियाँ उस वर्ग में हैं: उदाहरण के लिए बहुमत वोट, कुल संभावना या निर्णय सीमा से कुल दूरी। मैंने नीचे कुछ सामग्री सूचीबद्ध की है, पहला HOG क्लासिफायरियर विधि के लिए है, लेकिन अवधारणाएं समान हैं।

  1. ऑब्जेक्ट डिटेक्शन स्लाइडिंग विंडोज
  2. ऑब्जेक्ट श्रेणी जांच: स्लाइडिंग विंडोज
  3. एकीकृत नेटवर्क का उपयोग करते हुए एकीकृत पहचान, स्थानीयकरण और जांच से अधिक

2

यदि आप CNN का उपयोग कर रहे हैं तो इससे कोई समस्या नहीं होनी चाहिए। मैंने चेहरों को पहचानने के लिए एक सीएनएन बनाया, और चूंकि चेहरे आम तौर पर लगभग 70% चौड़े होते हैं क्योंकि वे लम्बे होते हैं, मैंने प्रशिक्षण छवियों का उपयोग किया जो कि 80x100 पिक्सेल हैं (सिर एक कोण पर होने की स्थिति में थोड़ी अतिरिक्त चौड़ाई)। आपके फ़िल्टर अभी भी वर्ग होने चाहिए।

यह सब बदलाव यह होगा कि अब आपको केवल एक मूल्य के बजाय अपने सक्रियण / पूल किए गए नक्शे के लिए एक चौड़ाई और ऊंचाई का ट्रैक रखना होगा जो आपको आकार बताता है। उदाहरण के लिए -

80 x 100 की इनपुट छवि लागू करें 5 x 5 कनवल्शन फ़िल्टर 76 x 96 पर सक्रियणों का एक मानचित्र देता है 2 x 2 लागू करें पूलिंग 38 x 48 पर पूलित सक्रियणों का एक मानचित्र देता है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.