मैंने अपने कॉलेज में मशीन लर्निंग कोर्स कर लिया है। क्विज़ में से एक में, यह सवाल पूछा गया था।
मॉडल 1:
मॉडल 2:उपरोक्त मॉडलों में से कौन सा डेटा बेहतर होगा? (मान लें कि डेटा रेखीय प्रतिगमन का उपयोग करके बनाया जा सकता है)
सही उत्तर (प्रोफेसर के अनुसार) यह है कि दोनों मॉडल समान रूप से अच्छा प्रदर्शन करेंगे। हालांकि मेरा मानना है कि पहला मॉडल एक बेहतर फिट होगा।
मेरे जवाब के पीछे यही कारण है। दूसरा मॉडल है, जो के रूप में लिखा जा सकता है , पहला मॉडल के रूप में ही नहीं होगा। वास्तव में एक पैराबोला है, और इसलिए इसका न्यूनतम मूल्य है ( इस मामले में 0.25 )। अब इस वजह से, की सीमा पहला मॉडल में की सीमा से अधिक है दूसरे मॉडल में। इसलिए यदि डेटा ऐसा था कि सबसे अच्छा फिट में ढलान कम था , दूसरा मॉडल पहले वाले की तुलना में बहुत खराब प्रदर्शन करेगा। हालाँकि, यदि सबसे अच्छा फिट का ढलान इससे अधिक था , दोनों मॉडल समान रूप से अच्छा प्रदर्शन करेंगे।
तो क्या पहले वाला बेहतर है, या दोनों एक जैसे हैं?