मॉडल चयन पर Scikit जानें के पृष्ठ में नेस्टेड क्रॉस-मान्यता के उपयोग का उल्लेख है:
>>> clf = GridSearchCV(estimator=svc, param_grid=dict(gamma=gammas), ... n_jobs=-1) >>> cross_validation.cross_val_score(clf, X_digits, y_digits)
दो क्रॉस-वेलिडेशन लूप्स समानांतर में किए जाते हैं: एक ग्रिडड्रेससीवी अनुमानक द्वारा गामा सेट करने के लिए और दूसरा एक क्रॉस_वेल_स्कोर द्वारा अनुमानक के पूर्वानुमान प्रदर्शन को मापने के लिए। परिणामी स्कोर नए डेटा पर भविष्यवाणी स्कोर के निष्पक्ष अनुमान हैं।
जो मैं समझता हूं, clf.fit
वह सबसे अच्छा गामा निर्धारित करने के लिए मूल रूप से क्रॉस-सत्यापन का उपयोग करेगा। उस स्थिति में, हमें ऊपर बताए अनुसार नेस्टेड सीवी का उपयोग करने की आवश्यकता क्यों होगी? नोट में उल्लेख किया गया है कि नेस्टेड cv भविष्यवाणी स्कोर के "निष्पक्ष अनुमान" का उत्पादन करता है। क्या ऐसा भी नहीं है clf.fit
?
इसके अलावा, मैं इस cross_validation.cross_val_score(clf, X_digits, y_digits)
प्रक्रिया से सर्वोत्तम अनुमान प्राप्त करने में असमर्थ था । क्या आप सलाह दे सकते हैं कि यह कैसे किया जा सकता है?