मैं छवि मान्यता के लिए एक कनवल्शन नेटवर्क पर काम कर रहा हूं, और मैं सोच रहा था कि क्या मैं विभिन्न आकारों की छवियों को इनपुट कर सकता हूं (हालांकि बहुत अलग नहीं है)।
इस परियोजना पर: https://github.com/harvardnlp/im2markup
वे कहते हैं:
and group images of similar sizes to facilitate batching
इसलिए प्रीप्रोसेसिंग के बाद भी, चित्र अभी भी विभिन्न आकारों के हैं, जो समझ में आता है क्योंकि वे सूत्र के कुछ हिस्से को नहीं काटेंगे।
क्या विभिन्न आकारों का उपयोग करने में कोई समस्या है? अगर वहाँ हैं, तो मुझे इस समस्या से कैसे संपर्क करना चाहिए (क्योंकि सूत्र सभी एक ही छवि आकार में फिट नहीं होंगे)?
किसी भी इनपुट की बहुत सराहना की जाएगी