टीएल; डीआर: स्तरीकृत शफल के साथ प्रयोग करेंtest_size=0.25
स्किमिट-लर्न स्तरीकृत विभाजन के लिए दो मॉड्यूल प्रदान करता है:
- StratifiedKFold : यह मॉड्यूल प्रत्यक्ष k- गुना क्रॉस-सत्यापन ऑपरेटर के रूप में उपयोगी है: जैसा कि इसमें
n_folds
प्रशिक्षण / परीक्षण सेट स्थापित किए जाएंगे, जैसे कि कक्षाएं दोनों में समान रूप से संतुलित हैं।
कुछ कोड का उपयोग करें (सीधे प्रलेखन से ऊपर)
>>> skf = cross_validation.StratifiedKFold(y, n_folds=2)
>>> len(skf)
2
>>> for train_index, test_index in skf:
... print("TRAIN:", train_index, "TEST:", test_index)
... X_train, X_test = X[train_index], X[test_index]
... y_train, y_test = y[train_index], y[test_index]
...
- स्तरीकृतशफ़लप्लेट : यह मॉड्यूल एक एकल प्रशिक्षण / परीक्षण सेट बनाता है जिसमें समान रूप से संतुलित (स्तरीकृत) कक्षाएं होती हैं। अनिवार्य रूप से यह वही है जो आप चाहते हैं
n_iter=1
। आप यहां परीक्षण-आकार का उल्लेख कर सकते हैंtrain_test_split
कोड:
>>> sss = StratifiedShuffleSplit(y, n_iter=1, test_size=0.5, random_state=0)
>>> len(sss)
1
>>> for train_index, test_index in sss:
... print("TRAIN:", train_index, "TEST:", test_index)
... X_train, X_test = X[train_index], X[test_index]
... y_train, y_test = y[train_index], y[test_index]
>>>