जहां तक मैं समझता हूं कि समस्या निम्नलिखित है: छवि मान्यता में आपके नेटवर्क के इनपुट पिक्सेल (ग्रेस्केल या केवल 1 और 0 काले और सफेद के लिए) हो सकते हैं। यदि आप चाहते हैं, उदाहरण के लिए हस्तलिखित संख्याओं को पहचानें तो केवल ऐसे मूल्यों के साथ काम करना बहुत मुश्किल है क्योंकि आप कभी नहीं जानते हैं कि वास्तव में संख्या (यानी काले मूल्य) कहां होगी।
क्या पिक्सेल 140 काला या 142 काला है? दोनों ही मामलों में यह अच्छी तरह से एक तीन हो सकता है। उम्र / वजन के उदाहरण में ये इनपुट अच्छी तरह से परिभाषित हैं। फीचर 2 वजन है। फीचर 3 उम्र है। ये "आयाम" आपके डेटासेट में "हॉप" नहीं होना चाहिए।
तो: आपके चित्र प्रशिक्षण में "थ्रीज़" या "कार" या "हाउस" को चित्र में अपने स्थान से स्वतंत्र माना जाना है, अर्थात पिक्सेल मान, अर्थात फीचर / इनपुट वेक्टर, अर्थात आयामों को स्पष्ट रूप से परिभाषित करने के विपरीत। इनपुट जैसे कि रोगी डेटा।
आप इसे छवि मान्यता में कैसे हल करते हैं? आप अतिरिक्त ट्रिक्स का उपयोग करते हैं, उदाहरण के लिए कन्वेंशन।