मैं एसएएस का उपयोग करके कुछ समय श्रृंखला डेटा पोइसन सामान्य एडिटिव मॉडल का उपयोग कर रहा हूं PROC GAM
। आम तौर पर बोलते हुए, मुझे लगता है कि यह बिलकुल सामान्यीकृत क्रॉस-वैलिडेशन प्रक्रिया है, जो मेरी एकल पंक्ति के लिए कम से कम एक सभ्य "शुरुआती बिंदु" उत्पन्न करता है, जो कि एक एकल पैरामीट्रिक शब्द (एक मैं) के साथ समय का एक गैर-रैखिक कार्य है। वास्तव में दिलचस्पी है)।
अब तक, यह मेरे एक डेटा सेट के अपवाद के साथ, बल्कि तैरकर काम किया है। उस डेटा सेट में 132 अवलोकन हैं, और GCV स्वतंत्रता की 128 डिग्री की एक सीमा का सुझाव देता है। ऐसा लगता है ... गलत। बहुत गलत। इससे भी महत्वपूर्ण बात यह है कि यह बिल्कुल भी स्थिर नहीं है। मैंने एक दूसरे दृष्टिकोण की कोशिश की, स्वतंत्रता की डिग्री जोड़ने से रोकने के लिए "एस्टीमेट में बदलाव" मानदंड का उपयोग करते हुए जब पैरामीट्रिक शब्द का अनुमान बदलना बंद हो जाता है क्योंकि कुछ भी अलग नहीं होने पर नियंत्रण क्यों जोड़ना जारी रहता है?
समस्या यह है कि अनुमान बिल्कुल स्थिर नहीं है। मैंने स्वतंत्रता की निम्न डिग्री की कोशिश की, और जैसा कि आप देख सकते हैं, पैरामीट्रिक शब्द बेतहाशा उछलता है:
DF: Parametric Estimate:
1 -0.76903
2 -0.56308
3 -0.47103
4 -0.43631
5 -0.33108
6 -0.1495
7 0.0743
8 0.33459
9 0.62413
10 0.92161
15 1.88763
20 1.98869
30 2.5223
40-60 had convergence issues
70 7.5497
80 7.22267
90 6.71618
100 5.83808
110 4.61436
128 1.32347
मुझे इस बात की बिल्कुल भी जानकारी नहीं है कि इस विशेष बिट डेटा के लिए df के संदर्भ में मुझे क्या उपयोग करना चाहिए। डीएफ कैसे चुनें के लिए कोई अन्य विचार? क्या मुझे तख़्ती के महत्व को देखना चाहिए?
Df = 10 और df = 15 के बीच कुछ और तलाश करना, ऐसा लगता है जैसे df = 12 निकटतम है जो आप 128 द्वारा उत्पन्न अनुमान के पास आ सकते हैं और फिर भी "स्वतंत्रता की उचित डिग्री" श्रेणी में हो सकते हैं। रैखिक शब्द, अवरोधन और एकल पैरामीट्रिक शब्द के साथ, यह एक बहुत भारी संतृप्त मॉडल की तरह लगता है। क्या सिर्फ 12 के साथ जाना उचित है?
एक दूसरे अद्यतन के रूप में, से समरेखण को बदलने spline(t)
के लिए loess(t)
मैं सिर्फ लेस समरेखण करने के लिए स्विच करना चाहिए - और अधिक अनुमान df अच्छी तरह से व्यवहार में जिसके परिणामस्वरूप है?