सवाल:
मैं इस बात पर चर्चा करना चाहता हूं कि लोग एल्गोरिदमिक पैरामीटर कैसे सेट करते हैं जब ग्राउंडट्रॉथ के खिलाफ कोई मान्यता संभव नहीं है (हो सकता है क्योंकि ग्राउंडट्रॉथ बस प्राप्त नहीं किया जा सकता है या प्राप्त करने के लिए बहुत कठिन / थकाऊ है)।
मैंने कई पत्र पढ़े हैं और अंतर्निहित एल्गोरिदम को लागू किया है जिसमें --- मापदंडों का एक सेट "अनुभवजन्य" कहा गया है --- और अक्सर मैंने पाया कि ये वे हैं जो एल्गोरिदम की व्यापकता को प्रभावित करते हैं (भले ही सिद्धांत अंतर्निहित विधि सुरुचिपूर्ण, मोहक और ध्वनि है)।
अगर आप अपने विचार साझा कर सकते हैं तो मैं इसकी सराहना करूंगा। और, इस सवाल का कोई सही या गलत जवाब नहीं है। मैं सिर्फ यह जानना चाहता हूं कि बाकी सभी इससे कैसे निपटते हैं।
पृष्ठभूमि / स्रोत के- प्रश्न:
मैं एक कंप्यूटर वैज्ञानिक हूं जो छवि विश्लेषण, कंप्यूटर दृष्टि और मशीन लर्निंग के क्षेत्रों में काम कर रहा है और यह सवाल मेरे दिमाग में कुछ समय से है क्योंकि मैंने इस दुविधा का सामना किया है और फिर से जब भी मैं एक नया एल्गोरिथ्म डिजाइन करता हूं और मैं खुद को मापदंडों को ट्यून करने में काफी समय खर्च करते हुए पाया।
इसके अलावा, मुझे लगता है, मेरा प्रश्न यहाँ किसी भी क्षेत्र में सामान्य है जहाँ कम्प्यूटेशनल एल्गोरिदम भारी रूप से शामिल हैं, और मैं सभी संबंधित क्षेत्रों के लोगों के विचारों को आमंत्रित करना चाहता हूँ।
मैं आपको कुछ ठोस उदाहरण देना चाहता था, इसलिए यह आपको सोचने में मदद करता है:
--- फीचर डिटेक्शन का मामला लें (सर्कुलर ब्लब्स या सैलिएंट पॉइंट्स कहने दें)। आप अलग-अलग पैमानों (स्केल पैरामीटर्स) पर कुछ फिल्टर (मापदंडों की जरूरत) चलाते हैं और संभवतः प्रतिक्रिया (दहलीज पैरामीटर) को थ्रेशोल्ड करते हैं। इसके खिलाफ आम तौर पर मान्य करने के लिए एक ग्राउंडट्रूथ प्राप्त करना संभव नहीं है और इस तरह से इस तरह के परिदृश्य में अपने मापदंडों को स्वचालित रूप से ट्यून किया जाता है।
--- कोई भी कम्प्यूटेशनल फ्रेमवर्क लें जिसमें बहुत सारे सिग्नल प्रोसेसिंग घटक शामिल हों। ट्यून करने के लिए हमेशा पैरामीटर होते हैं और आमतौर पर कोई ग्राउंडट्रॉथ नहीं होता है और जब आप उन्हें अपने डेटासेट के एक छोटे से यादृच्छिक सबसेट पर सब्जेक्टली ट्यून करते हैं तो आप किसी दिन उस केस का सामना करेंगे जिसके लिए यह सामान्य नहीं है।
जब आप अपने एल्गोरिथ्म में कुछ मध्यवर्ती चरणों के लिए पैरामीटर सेट कर रहे हैं तो यह पैरामीटर शैतान अधिक परेशानी वाला है।
और मैंने अक्सर पाया, इन मापदंडों के लिए अच्छे मूल्यों को खोजने की समस्या को हल करना संभव नहीं है क्योंकि एक उद्देश्य फ़ंक्शन के साथ अनुकूलन समस्या है जिसमें आप एक व्युत्पन्न ले सकते हैं और इस तरह अच्छे मूल्यों को खोजने के लिए मानक अनुकूलन एल्गोरिदम का उपयोग कर सकते हैं।
इसके अलावा, कई मापदंडों में एक एंड-यूज़र के लिए इन मापदंडों को उजागर करना एक विकल्प नहीं है, क्योंकि हम अक्सर गैर-कम्प्यूटेशनल एंड-यूज़र्स के लिए एप्लिकेशन / सॉफ़्टवेयर विकसित करते हैं (बायोलॉजिस्ट, डॉक्टर कहते हैं) और वे आम तौर पर जब आप उन्हें ट्यून करने के लिए कहते हैं, तो वे अव्यवस्थित हो जाते हैं। जब तक इसकी बहुत सहज (लगभग ऑब्जेक्ट आकार की तरह)।
कृपया अपने विचार साझा करें।
I want to kick up a discussion ...
वास्तव में अच्छा संकेत है कि आप जो पूछ रहे हैं वह * .SE प्रारूप के लिए एक अच्छा फिट नहीं है।