मैं डेटा प्रीप्रोसेस कर रहा हूं और बाद में अपने डेटा पर एक कॉनवॉनेट बनाने जा रहा हूं।
मेरा प्रश्न है: कहो कि मेरे पास 100 छवियों के साथ कुल डेटा सेट है, मैं प्रत्येक 100 छवियों में से प्रत्येक के लिए माध्य की गणना कर रहा था और फिर इसे प्रत्येक छवियों से घटाता हूं, फिर इसे ट्रेन और सत्यापन सेट में विभाजित करता हूं, और मैं यही करता हूं दिए गए परीक्षण सेट पर प्रक्रिया करने के लिए कदम, लेकिन ऐसा लगता है कि यह इस लिंक के अनुसार एक सही तरीका नहीं है: http://cs231n.github.io/neural-networks-2/#datapre
" आम नुकसान । प्रीप्रोसेसिंग के बारे में बनाने के लिए एक महत्वपूर्ण बिंदु यह है कि किसी भी प्रीप्रोसेसिंग आँकड़े (जैसे डेटा माध्य) को केवल प्रशिक्षण डेटा पर गणना की जानी चाहिए, और फिर सत्यापन / परीक्षण डेटा पर लागू किया जाएगा। जैसे कि माध्य की गणना करना और इसे घटाना। संपूर्ण डेटासेट में प्रत्येक छवि और फिर डेटा को ट्रेन / वैल / टेस्ट विभाजन में विभाजित करना एक गलती होगी। इसके बजाय, इसका मतलब केवल प्रशिक्षण डेटा पर गणना की जानी चाहिए और फिर सभी विभाजन (ट्रेन / वैल / टेस्ट) से समान रूप से घटाया जाना चाहिए। "
मैं अनुमान लगा रहा हूँ कि लेखक क्या कह रहा है, मतलब की गणना न करें और इसे प्रत्येक छवि के भीतर घटाएँ, लेकिन कुल छवि सेट के माध्यम से गणना करें (यानी (image1 + ... + image100) / 100) और इसका मतलब घटाएँ प्रत्येक छवि।
मैं बिल्कुल नहीं समझता कि क्या कोई समझा सकता है? और संभवतः यह भी बताएं कि मैं जो कर रहा था वह गलत क्यों है (यदि यह वास्तव में गलत है)।