मान लीजिए मैंने एक डेटासेट (मॉडल बिल्डिंग डेटासेट) में किसी विशेष बीमारी की घटना के लिए एक भविष्यवाणी मॉडल का निर्माण किया है और अब यह जांचना चाहता हूं कि मॉडल एक नए डेटासेट (सत्यापन डेटासेट) में कितनी अच्छी तरह काम करता है। लॉजिस्टिक रिग्रेशन के साथ बनाए गए मॉडल के लिए, मैं मॉडल बिल्डिंग डेटासेट से प्राप्त मॉडल गुणांक के आधार पर सत्यापन डेटासेट में प्रत्येक व्यक्ति के लिए अनुमानित संभावना की गणना करेगा और फिर, कुछ कटऑफ मूल्य पर उन संभावनाओं को विचलित करने के बाद, मैं एक 2x2 तालिका का निर्माण कर सकता हूं इससे मुझे वास्तविक सकारात्मक दर (संवेदनशीलता) और वास्तविक नकारात्मक दर (विशिष्टता) की गणना करने की अनुमति मिलती है। इसके अलावा, मैं कटऑफ को अलग करके पूरे आरओसी वक्र का निर्माण कर सकता हूं और फिर आरओसी ग्राफ के लिए एयूसी प्राप्त कर सकता हूं।
अब मान लीजिए कि मेरे पास वास्तव में उत्तरजीविता डेटा है। इसलिए, मैंने मॉडल बिल्डिंग डेटासेट में एक कॉक्स आनुपातिक खतरों के मॉडल का उपयोग किया और अब जांचना चाहता हूं कि मॉडल सत्यापन डेटासेट में कितनी अच्छी तरह काम करता है। चूंकि आधारभूत जोखिम कॉक्स मॉडल में एक पैरामीट्रिक फ़ंक्शन नहीं है, इसलिए मैं यह नहीं देखता कि मॉडल बिल्डिंग डेटासेट में प्राप्त मॉडल गुणांक के आधार पर सत्यापन डेटासेट में मैं प्रत्येक व्यक्ति के लिए अनुमानित अस्तित्व की संभावना कैसे प्राप्त कर सकता हूं। तो, मैं जाँच के बारे में कैसे जा सकता हूँ कि मॉडल सत्यापन डेटासेट में कितनी अच्छी तरह काम करता है? क्या ऐसा करने के लिए स्थापित तरीके हैं? और यदि हाँ, तो क्या वे किसी भी सॉफ्टवेयर में लागू किए गए हैं? किसी सुझाव के लिए अग्रिम धन्यवाद!