मैंने दो मॉडल (h2o AutoML का उपयोग करके बाइनरी क्लासीफायर) को प्रशिक्षित किया है और मैं उपयोग करने के लिए एक का चयन करना चाहता हूं। मेरे पास निम्नलिखित परिणाम हैं:
model_id auc logloss logloss_train logloss_valid gini_train gini_valid
DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975
DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662
auc
और logloss
कॉलम पार सत्यापन मीट्रिक हैं (पार सत्यापन केवल प्रशिक्षण डेटा का उपयोग करता)। ..._train
और ..._valid
मैट्रिक्स क्रमशः मॉडल के माध्यम से प्रशिक्षण और मान्यता मैट्रिक्स चलाकर पाए जाते हैं। मैं या तो उपयोग करना चाहते हैं logloss_valid
या gini_valid
एक सबसे अच्छा मॉडल का चयन करें।
मॉडल 1 में एक बेहतर गिन्नी (यानी बेहतर एयूसी) है लेकिन मॉडल दो में एक बेहतर लॉगलॉस है। मेरा प्रश्न यह है कि मुझे कौन-सा विकल्प चुनना है, जो यह सवाल महसूस करता है कि निर्णय मीट्रिक के रूप में गिन्नी (एयूसी) या लॉगलॉस का उपयोग करने के क्या फायदे / नुकसान हैं।