परीक्षण डेटा से एक भ्रम मैट्रिक्स प्राप्त करने के लिए आपको दो चरणों में जाना चाहिए:
- परीक्षण डेटा के लिए भविष्यवाणियां करें
उदाहरण के लिए, model.predict_generator
परीक्षण जनरेटर से पहले 2000 संभावनाओं की भविष्यवाणी करने के लिए उपयोग करें।
generator = datagen.flow_from_directory(
'data/test',
target_size=(150, 150),
batch_size=16,
class_mode=None, # only data, no labels
shuffle=False) # keep data in same order as labels
probabilities = model.predict_generator(generator, 2000)
- लेबल भविष्यवाणियों के आधार पर भ्रम मैट्रिक्स की गणना करें
उदाहरण के लिए, इस मामले की संभावनाओं की तुलना करें कि क्रमशः 1000 बिल्लियां और 1000 कुत्ते हैं।
from sklearn.metrics import confusion_matrix
y_true = np.array([0] * 1000 + [1] * 1000)
y_pred = probabilities > 0.5
confusion_matrix(y_true, y_pred)
परीक्षण और सत्यापन डेटा पर अतिरिक्त नोट
केरस प्रलेखन डेटा के तीन अलग-अलग सेटों का उपयोग करता है: प्रशिक्षण डेटा, सत्यापन डेटा और परीक्षण डेटा। प्रशिक्षण डेटा का उपयोग मॉडल मापदंडों को अनुकूलित करने के लिए किया जाता है। सत्यापन डेटा का उपयोग मेटा-मापदंडों के बारे में विकल्प बनाने के लिए किया जाता है, जैसे युगों की संख्या। इष्टतम मेटा-मापदंडों के साथ एक मॉडल का अनुकूलन करने के बाद परीक्षण डेटा का उपयोग मॉडल प्रदर्शन का उचित अनुमान प्राप्त करने के लिए किया जाता है।