मुझे पता है कि इसकी चर्चा शायद कहीं और की गई है, लेकिन मुझे इसका स्पष्ट उत्तर नहीं मिल पाया है। मैं सूत्र का उपयोग करने की कोशिश कर रहा हूं आउट-ऑफ-सैंपल की गणना करने के लिए एक रेखीय प्रतिगमन मॉडल का, जहां चुकता अवशिष्टों का योग है और वर्गों का कुल योग है। प्रशिक्षण सेट के लिए, यह स्पष्ट है कि
परीक्षण सेट के बारे में क्या? क्या मुझे प्रयोग करते रहना चाहिए? नमूने के लिए बाहर , या उपयोग बजाय?
मैंने पाया कि अगर मैं उपयोग करता हूं , जिसके परिणामस्वरूप कभी-कभी नकारात्मक हो सकता है। यह स्केलेर के r2_score()
फ़ंक्शन के विवरण के अनुरूप है, जहां उन्होंने उपयोग किया था(जो score()
नमूनों के परीक्षण के लिए उनके रैखिक_मॉडल के कार्य द्वारा भी उपयोग किया जाता है )। वे कहते हैं कि "एक स्थिर मॉडल जो हमेशा y के अपेक्षित मूल्य की भविष्यवाणी करता है, इनपुट सुविधाओं की अवहेलना करता है, उसे R ^ 0.0 का 2 अंक मिलेगा।"
हालांकि, अन्य जगहों पर लोगों ने इस्तेमाल किया है यहाँ और यहाँ की तरह (dmi3kno द्वारा दूसरा उत्तर)। तो मैं सोच रहा था जो अधिक समझ में आता है? किसी भी टिप्पणी की बहुत सराहना की जाएगी!