निश्चित रूप से आपको भी (डबल) रेसमलिंग के लिए विभाजन अनुपात के बारे में फैसला करना होगा ...
हालांकि, रेज़मैपलिंग आमतौर पर विभाजन अनुपात की एक विस्तृत श्रृंखला के लिए काम करता है, यदि आप ध्यान में रखते हैं
- यदि ऐसा नहीं होता है, तो संभव है कि अलग-अलग रनों की संख्या कम हो
- अंतर प्रशिक्षण सेट में पर्याप्त प्रशिक्षण मामलों को छोड़ दें ताकि ट्रेसिंग एल्गोरिथ्म में एक उपयोगी मॉडल का उत्पादन करने का एक अच्छा मौका हो।
- आपके पास जितने अधिक स्वतंत्र मामले हैं, कम महत्वपूर्ण ये विचार हैं।
और क्या होगा यदि आप 10000 <N <1000000 के बड़े पैमाने पर डेटा (लेकिन बड़े डेटा नहीं) पर काम कर रहे हैं?
आप क्या कर सकते हैं यदि आप सुनिश्चित नहीं हैं कि मट्ठा पुनर्जीवन की आवश्यकता है: कुछ समय फिर से भरना। पर्याप्त है ताकि आप माप सकें कि क्या रेज़मैपलिंग आवश्यक था।
- अपनी भविष्यवाणियों की स्थिरता की जाँच करें
- अपने मॉडल मापदंडों की स्थिरता की जांच करें
इन परिणामों के साथ, आप यह तय कर सकते हैं कि आपको अधिक रेज़मैप्लिंग पुनरावृत्तियों को जोड़ना चाहिए या क्या चीजें ठीक हैं जैसा कि वे हैं।