तकनीकी शब्दों के दुरुपयोग के लिए माफी माँगता हूँ। मैं संवेदी तंत्रिका नेटवर्क (CNNs) के माध्यम से सिमेंटिक विभाजन की परियोजना पर काम कर रहा हूं; एनकोडर-डिकोडर प्रकार की वास्तुकला को लागू करने की कोशिश कर रहा है, इसलिए आउटपुट इनपुट के समान आकार है।
आप लेबल कैसे डिज़ाइन करते हैं? क्या नुकसान समारोह एक लागू करना चाहिए? विशेष रूप से भारी वर्ग के असंतुलन की स्थिति में (लेकिन वर्गों के बीच का अनुपात छवि से छवि में परिवर्तनशील है)।
समस्या दो वर्गों (ब्याज और पृष्ठभूमि की वस्तुओं) से संबंधित है। मैं टेनसफ़्लो बैकएंड के साथ केर का उपयोग कर रहा हूं।
अब तक, मैं डिज़ाइन किए गए आउटपुट को इनपुट छवियों के समान आयामों के साथ जा रहा हूं, पिक्सेल-वार लेबलिंग लागू करना। मॉडल की अंतिम परत में या तो सॉफ्टमैक्स सक्रियण होता है (2 वर्गों के लिए), या सिग्मॉइड सक्रियण (संभावना व्यक्त करने के लिए कि पिक्सेल ऑब्जेक्ट्स वर्ग के हैं)। मुझे इस तरह के कार्य के लिए एक उपयुक्त उद्देश्य फ़ंक्शन को डिजाइन करने में परेशानी हो रही है:
function(y_pred,y_true)
,
Keras के साथ समझौते में ।
कृपया, इसमें शामिल टेंसरों के आयामों के साथ विशिष्ट होने का प्रयास करें (मॉडल का इनपुट / आउटपुट)। किसी भी विचार और सुझाव बहुत सराहना की है। धन्यवाद !