पैरामीटर डेविल - उन्हें कैसे सेट करना है जब ग्राउंडट्रूट के खिलाफ कोई सत्यापन संभव नहीं है [बंद]


9

सवाल:

मैं इस बात पर चर्चा करना चाहता हूं कि लोग एल्गोरिदमिक पैरामीटर कैसे सेट करते हैं जब ग्राउंडट्रॉथ के खिलाफ कोई मान्यता संभव नहीं है (हो सकता है क्योंकि ग्राउंडट्रॉथ बस प्राप्त नहीं किया जा सकता है या प्राप्त करने के लिए बहुत कठिन / थकाऊ है)।

मैंने कई पत्र पढ़े हैं और अंतर्निहित एल्गोरिदम को लागू किया है जिसमें --- मापदंडों का एक सेट "अनुभवजन्य" कहा गया है --- और अक्सर मैंने पाया कि ये वे हैं जो एल्गोरिदम की व्यापकता को प्रभावित करते हैं (भले ही सिद्धांत अंतर्निहित विधि सुरुचिपूर्ण, मोहक और ध्वनि है)।

अगर आप अपने विचार साझा कर सकते हैं तो मैं इसकी सराहना करूंगा। और, इस सवाल का कोई सही या गलत जवाब नहीं है। मैं सिर्फ यह जानना चाहता हूं कि बाकी सभी इससे कैसे निपटते हैं।

पृष्ठभूमि / स्रोत के- प्रश्न:

मैं एक कंप्यूटर वैज्ञानिक हूं जो छवि विश्लेषण, कंप्यूटर दृष्टि और मशीन लर्निंग के क्षेत्रों में काम कर रहा है और यह सवाल मेरे दिमाग में कुछ समय से है क्योंकि मैंने इस दुविधा का सामना किया है और फिर से जब भी मैं एक नया एल्गोरिथ्म डिजाइन करता हूं और मैं खुद को मापदंडों को ट्यून करने में काफी समय खर्च करते हुए पाया।

इसके अलावा, मुझे लगता है, मेरा प्रश्न यहाँ किसी भी क्षेत्र में सामान्य है जहाँ कम्प्यूटेशनल एल्गोरिदम भारी रूप से शामिल हैं, और मैं सभी संबंधित क्षेत्रों के लोगों के विचारों को आमंत्रित करना चाहता हूँ।

मैं आपको कुछ ठोस उदाहरण देना चाहता था, इसलिए यह आपको सोचने में मदद करता है:

--- फीचर डिटेक्शन का मामला लें (सर्कुलर ब्लब्स या सैलिएंट पॉइंट्स कहने दें)। आप अलग-अलग पैमानों (स्केल पैरामीटर्स) पर कुछ फिल्टर (मापदंडों की जरूरत) चलाते हैं और संभवतः प्रतिक्रिया (दहलीज पैरामीटर) को थ्रेशोल्ड करते हैं। इसके खिलाफ आम तौर पर मान्य करने के लिए एक ग्राउंडट्रूथ प्राप्त करना संभव नहीं है और इस तरह से इस तरह के परिदृश्य में अपने मापदंडों को स्वचालित रूप से ट्यून किया जाता है।

--- कोई भी कम्प्यूटेशनल फ्रेमवर्क लें जिसमें बहुत सारे सिग्नल प्रोसेसिंग घटक शामिल हों। ट्यून करने के लिए हमेशा पैरामीटर होते हैं और आमतौर पर कोई ग्राउंडट्रॉथ नहीं होता है और जब आप उन्हें अपने डेटासेट के एक छोटे से यादृच्छिक सबसेट पर सब्जेक्टली ट्यून करते हैं तो आप किसी दिन उस केस का सामना करेंगे जिसके लिए यह सामान्य नहीं है।

जब आप अपने एल्गोरिथ्म में कुछ मध्यवर्ती चरणों के लिए पैरामीटर सेट कर रहे हैं तो यह पैरामीटर शैतान अधिक परेशानी वाला है।

और मैंने अक्सर पाया, इन मापदंडों के लिए अच्छे मूल्यों को खोजने की समस्या को हल करना संभव नहीं है क्योंकि एक उद्देश्य फ़ंक्शन के साथ अनुकूलन समस्या है जिसमें आप एक व्युत्पन्न ले सकते हैं और इस तरह अच्छे मूल्यों को खोजने के लिए मानक अनुकूलन एल्गोरिदम का उपयोग कर सकते हैं।

इसके अलावा, कई मापदंडों में एक एंड-यूज़र के लिए इन मापदंडों को उजागर करना एक विकल्प नहीं है, क्योंकि हम अक्सर गैर-कम्प्यूटेशनल एंड-यूज़र्स के लिए एप्लिकेशन / सॉफ़्टवेयर विकसित करते हैं (बायोलॉजिस्ट, डॉक्टर कहते हैं) और वे आम तौर पर जब आप उन्हें ट्यून करने के लिए कहते हैं, तो वे अव्यवस्थित हो जाते हैं। जब तक इसकी बहुत सहज (लगभग ऑब्जेक्ट आकार की तरह)।

कृपया अपने विचार साझा करें।


1
उद्घाटन I want to kick up a discussion ...वास्तव में अच्छा संकेत है कि आप जो पूछ रहे हैं वह * .SE प्रारूप के लिए एक अच्छा फिट नहीं है।
पीटर के.एच.

जवाबों:


2

यह मानते हुए कि है एक जमीनी सच्चाई, ( कम से कम सैद्धांतिक रूप से ) संभव तरीके से उबरने के लिए "ऊब" समस्या एक "बूटस्ट्रैप" जमीनी सच्चाई रचना है में से एक। यदि आपके पास पहले से ही एक सभ्य एल्गोरिथ्म है जो लगभग 80% -90% मामलों में काम करता है, तो आप अपने एल्गोरिथ्म को इंस्टेंस के बड़े सेट पर चला सकते हैं और एक उपयोगकर्ता से केवल गलतियों को चिह्नित करने के लिए कह सकते हैं। इस दृष्टिकोण के अपने दोष हैं, जैसे कि आपके एल्गोरिथ्म के प्रति पूर्वाग्रह।

हालांकि, कुछ ऐसे मामले हैं जिनमें कोई ज़मीनी सच्चाई नहीं है, केवल अलग-अलग सिस्टम ट्रेड-ऑफ़ हैं। उदाहरण के लिए, एक तेज, रंगीन-सटीक, गैर-शोर छवि का उत्पादन करने के लिए एक छवि प्रसंस्करण प्रणाली की आवश्यकता होती है। जाहिर है, आप उन सभी को एक ही समय में नहीं कर सकते। ऐसे मामले में आपको ऑब्जेक्टिव मेट्रिक्स का उपयोग करना चाहिए जिसकी गणना आपके सिस्टम के परिणाम पर की जा सकती है। ( इमेज प्रोसेसिंग के लिए इमाटेस्ट , डीएक्सओ विश्लेषक देखें )।

एक बार जब आपके पास ये होते हैं, तो बहुउद्देश्यीय अनुकूलन के तरीके होते हैं जो व्यापार-नापसंद (जो उपयोगकर्ता के लिए स्पष्ट हैं) से आंतरिक मापदंडों तक मानचित्रण बना सकते हैं।

किसी भी स्थिति में, आपको उपयोगकर्ता को कभी भी ऐसा पैरामीटर नहीं देना चाहिए जिसे वह समझ नहीं सके। यदि सभी विफल रहता है, तो बस पैरामीटर को हार्ड-कोड करें।


2

यह वास्तव में, वास्तव में कठिन समस्या है, लेकिन क्षेत्र में काम का एक अच्छा सौदा है। एक उदाहरण के लिए, इस पेपर को रामानी एंड फेसलर द्वारा SURE के दृष्टिकोण पर एक नज़र डालें । परिचय में पैरामीटर चयन विधियों का एक बड़ा अवलोकन है, उनके संदर्भों की जांच करना सुनिश्चित करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.