मैं आर में अधिक हालिया टिप्पणियों के लिए अधिक वजन कैसे निर्दिष्ट करूं?
मैं इसे आम तौर पर पूछे जाने वाले प्रश्न या इच्छा के रूप में मानता हूं, लेकिन मुझे यह पता लगाने में कठिन समय है कि इसे कैसे लागू किया जाए। मैंने इसके लिए बहुत कुछ खोजने की कोशिश की है लेकिन मैं एक अच्छा व्यावहारिक उदाहरण नहीं खोज पा रहा हूं।
मेरे उदाहरण में मेरे पास समय के साथ एक बड़ा डेटासेट होगा। मैं कहना चाहता हूं कि डेटा की पंक्तियों के कुछ प्रकार के घातीय भार को लागू करें जो हाल ही में अधिक हैं। इसलिए मेरे पास कुछ प्रकार के घातीय कार्य होंगे जिसमें कहा गया था कि 2015 में टिप्पणियों ___ 2012 में टिप्पणियों की तुलना में मॉडल को प्रशिक्षित करने के लिए अधिक महत्वपूर्ण हैं।
मेरे डेटासेट चर में श्रेणीबद्ध और संख्यात्मक मानों का मिश्रण होता है और मेरा लक्ष्य एक संख्यात्मक मान है - यदि यह मायने रखता है।
मैं आदर्श रूप से CARET पैकेज में GBM / रैंडम फ़ॉरेस्ट जैसे मॉडलों का उपयोग करके इसका परीक्षण / परीक्षण करना चाहता हूँ।
अद्यतन-सवाल
मैं नीचे दी गई प्रतिक्रिया की सराहना करता हूं कि कैसे दो बिंदुओं के बीच की तारीख की दूरी से वजन का तेजी से क्षय होता है।
हालांकि, जब इस मॉडल को कैरेट में प्रशिक्षित करने की बात आती है, तो वास्तव में वजन कारक कैसे होता है? प्रशिक्षण पंक्तियों में से प्रत्येक में वजन मूल्य भविष्य में कुछ बिंदु के बीच की दूरी है और जब वह बिंदु ऐतिहासिक रूप से कम हो जाता है।
क्या भविष्यवाणी के दौरान वजन केवल खेल में आता है? क्योंकि अगर वे प्रशिक्षण के दौरान खेलने आते हैं, तो इससे सभी तरह की समस्याएं नहीं होंगी क्योंकि विभिन्न क्रॉस-फोल्ड में अलग-अलग वजन होंगे, जो कुछ भविष्यवाणी करने की कोशिश कर रहे होंगे जो वास्तव में समय से पहले एक बिंदु पर हो सकते हैं?