मान लें कि मेरे पास एक छोटा नमूना आकार है, जैसे कि एन = 100, और दो वर्ग। मुझे मशीन लर्निंग के लिए प्रशिक्षण, क्रॉस-सत्यापन, और परीक्षण सेट आकार कैसे चुनना चाहिए?
मैं सहजता से चुनूंगा
- प्रशिक्षण सेट आकार 50 के रूप में
- क्रॉस सत्यापन सेट आकार 25, और
- 25 के रूप में परीक्षण का आकार।
लेकिन शायद यह कम या ज्यादा समझ में आता है। मुझे वास्तव में इन मूल्यों को कैसे तय करना चाहिए? क्या मैं विभिन्न विकल्पों की कोशिश कर सकता हूं (हालांकि मुझे लगता है कि यह इतना बेहतर नहीं है ... सीखने की संभावना बढ़ गई)?
क्या होगा अगर मेरे पास दो से अधिक कक्षाएं थीं?