जब मैंने दूसरे दाखिलों से पेपर पढ़े तो मेरे भी ऐसे ही सवाल थे। और इससे संबंधित बहुत से प्रश्न पूछे, जैसे कि एजुकेशन डाटा माइनिंग कम्युनिटी में यह एक:
लॉजिक लॉस की बजाय संभावनाओं पर चुकता नुकसान का उपयोग क्यों करें?
यहां मैं बहुत सारी व्यक्तिगत राय पेश करूंगा।
मुझे लगता है कि कई व्यावहारिक उपयोग के मामलों में हानि समारोह बहुत ज्यादा मायने नहीं रखता है। कुछ शोधकर्ता वर्ग के नुकसान के बारे में अधिक जान सकते हैं और इसकी प्रणाली का निर्माण कर सकते हैं, यह अभी भी काम करता है और वास्तविक दुनिया की समस्याओं को हल करता है। शोधकर्ता लॉजिस्टिक लॉस या हिंज लॉस को कभी नहीं जान सकते हैं, और इसे आजमाना चाहते हैं। इसके अलावा, वे इष्टतम गणित मॉडल को खोजने के लिए इच्छुक नहीं हो सकते हैं, लेकिन वास्तविक समस्याओं को हल करना चाहते हैं जिन्हें किसी ने पहले हल करने का प्रयास नहीं किया।
यह एक और उदाहरण है: यदि आप मेरे प्रश्न के उत्तर की जांच करते हैं, तो वे सभी समान हैं। लगभग 0-1 नुकसान के लिए वर्गीकरण में विभिन्न नुकसान कार्यों को चुनने के प्रभाव क्या हैं
अधिक विचार: मशीन सीखने का एक शोध बहुत समय बिता सकता है कि किस मॉडल को चुना जाए, और मॉडल को कैसे अनुकूलित किया जाए। ऐसा इसलिए है क्योंकि मशीन सीखने वाले शोधकर्ता में अधिक डेटा एकत्र करने / अधिक उपाय प्राप्त करने की क्षमता नहीं हो सकती है। और एक मशीन सीखने वाले शोधकर्ता की नौकरी बेहतर गणित हो रही है, एक विशिष्ट वास्तविक दुनिया की समस्या को बेहतर ढंग से हल नहीं कर रही है।
दूसरी ओर, वास्तविक दुनिया में, यदि डेटा बेहतर है, तो यह हर चीज को धड़कता है। इसलिए, तंत्रिका नेटवर्क या यादृच्छिक वन चुनना बहुत अधिक मायने नहीं रखता है। ये सभी मॉडल एक व्यक्ति के समान हैं जो वास्तविक दुनिया की समस्याओं को हल करने के लिए मशीन लर्निंग को एक उपकरण के रूप में उपयोग करना चाहते हैं। एक व्यक्ति जो गणित या उपकरण विकसित करने में दिलचस्पी नहीं रखता है, वह सिस्टम को बेहतर बनाने के लिए विशिष्ट डोमेन ज्ञान का उपयोग करने में अधिक समय बिता सकता है।
जैसा कि मैंने टिप्पणी में उल्लेख किया है। और अगर कोई गणित से मैला है, वह अभी भी कुछ काम करने में सक्षम है।