मैं यह समझने की कोशिश कर रहा हूं कि मैं एक वैरिएबल को कैसे मॉडल कर सकता हूं जहां समय के साथ मैंने तेजी से विस्तृत भविष्यवाणियां प्राप्त की हैं। उदाहरण के लिए, डिफ़ॉल्ट ऋणों पर मॉडलिंग रिकवरी दरों पर विचार करें। मान लीजिए कि हमारे पास 20 वर्षों के डेटा के साथ एक डेटासेट है, और उन वर्षों के पहले 15 में हम केवल यह जानते हैं कि ऋण संपार्श्विक किया गया था या नहीं, लेकिन उस संपार्श्विक की विशेषताओं के बारे में कुछ भी नहीं। पिछले पांच वर्षों के लिए, हालांकि, हम संपार्श्विक को श्रेणियों की एक श्रेणी में तोड़ सकते हैं, जो कि वसूली दर का एक अच्छा भविष्यवक्ता होने की उम्मीद है।
इस सेटअप को देखते हुए मैं डेटा के लिए एक मॉडल को फिट करना चाहता हूं, भविष्यवाणियों के सांख्यिकीय महत्व जैसे उपायों को निर्धारित करता हूं, और फिर मॉडल के साथ पूर्वानुमान करता हूं।
क्या लापता डेटा फ्रेम में फिट बैठता है? क्या इस तथ्य से संबंधित कोई विशेष विचार हैं कि अधिक विस्तृत व्याख्यात्मक चर केवल दिए गए बिंदु के बाद ही उपलब्ध हो जाते हैं, जैसा कि पूरे ऐतिहासिक नमूने में बिखरे हुए हैं?