सीएनएन के लिए छवि का आकार परिवर्तन और पैडिंग


14

मैं छवि पहचान के लिए एक सीएनएन को प्रशिक्षित करना चाहता हूं। प्रशिक्षण के लिए छवियों का आकार निश्चित नहीं है। मैं उदाहरण के लिए CNN के लिए इनपुट आकार 50x100 (ऊंचाई x चौड़ाई) होना चाहता हूं। जब मैं इनपुट आकार के लिए कुछ छोटे आकार की छवियों (उदाहरण के लिए 32x32) का आकार बदलता हूं, तो छवि की सामग्री क्षैतिज रूप से बहुत अधिक खींची जाती है, लेकिन कुछ मध्यम आकार की छवियों के लिए यह ठीक दिखता है।

नष्ट हो रही सामग्री से बचने के लिए छवियों को आकार देने के लिए उचित विधि क्या है?

(मैं चौड़ाई और ऊंचाई के अनुपात को ध्यान में रखते हुए उन्हें कुछ हद तक आकार देने के बाद 0 से पूर्ण आकार की छवियों के बारे में सोच रहा हूं। क्या यह इस विधि के साथ ठीक होगा?)

जवाबों:


10

Stackoverflow पर यह सवाल आपकी मदद कर सकता है। योग करने के लिए, कुछ गहरे सीखने वाले शोधकर्ताओं को लगता है कि छवि के एक बड़े हिस्से को गद्दी देना एक अच्छा अभ्यास नहीं है, क्योंकि तंत्रिका नेटवर्क को सीखना होगा कि गद्देदार क्षेत्र वर्गीकरण के लिए प्रासंगिक नहीं है, और यह सीखने की ज़रूरत नहीं है कि यदि आप उदाहरण के लिए, प्रक्षेप का उपयोग करें।


5

आपके पास कुछ विकल्प हैं:

छोटी छवियों के लिए:

  • प्रक्षेप के माध्यम से उतार-चढ़ाव
  • शून्य का उपयोग करके छवि को पैड करें

यदि आप अपसम्पलिंग के माध्यम से पहलू अनुपात को बनाए रखने में असमर्थ हैं, तो आप सबसे बड़े आयाम में अतिरिक्त पिक्सेल को अपडाउन और क्रॉप कर सकते हैं। बेशक यह डेटा खोने के परिणामस्वरूप होगा, लेकिन आप बार-बार अपनी फसल के केंद्र को स्थानांतरित कर सकते हैं। यह आपके मॉडल को अधिक मजबूत बनाने में मदद करेगा।


बड़ी छवियों के लिए:

  • downsample
  • अपने इनपुट आकार को कम करें

अंत में, यदि आप एक पूर्ण रूप से संवादात्मक नेटवर्क (FCN) का उपयोग कर रहे हैं, तो आपको अपनी छवियों का आकार बदलने की आवश्यकता नहीं है।

टी एल; डॉ:

हां, शून्य के साथ पैडिंग एक वैध विकल्प है।


अगर मैंने एक पूरी तरह से दृढ़ नेटवर्क के लिए वेट को प्रशिक्षित किया है जो 3 वीडियो फ्रेम को स्वीकार करता है, तो मैं कैसे एक समान आर्किटेक्चर वाले नेटवर्क के लिए इन वेट का उपयोग कर सकता हूं, इनपुट आकार को छोड़कर 11 फ्रेम तक बढ़ जाता है? मैं केवल भविष्यवाणियां कर रहा हूं, आगे प्रशिक्षण नहीं। मेरा सवाल यहाँ है: datascience.stackexchange.com/questions/55737/…
mLstudent33

3

आप निम्न कर सकते हैं पहले कुछ हद तक छवियों का आकार बदलें और फिर सभी पक्षों से छवि को पैड करें, जो छवि में सुविधाओं को बनाए रखने में मदद कर सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.