मैंने इस साइट पर अनगिनत पोस्ट पढ़ी हैं जो अविश्वसनीय रूप से किसी भी प्रकार के मानदंड का उपयोग करके चर के चयन के खिलाफ हैं चाहे वह पी-मान आधारित हो, एआईसी, बीआईसी, आदि।
मैं समझता हूं कि ये प्रक्रियाएं सामान्य क्यों हैं, चर के चयन के लिए काफी खराब हैं। गंग की संभवतः प्रसिद्ध पोस्ट यहाँ स्पष्ट रूप से बताती है कि क्यों; अंततः हम उसी डेटासेट पर एक परिकल्पना की पुष्टि कर रहे हैं जिसका उपयोग हम परिकल्पना के साथ करते थे, जो कि केवल डेटा ड्रेजिंग है। इसके अलावा, पी-वैल्यू मात्रा से प्रभावित होते हैं जैसे कि कोलीनियरिटी और आउटलेर, जो भारी तिरछा परिणाम, आदि।
हालाँकि, मैं हाल ही में थोड़ा सा पूर्वानुमान लगाते हुए टाइम सीरीज़ का अध्ययन कर रहा हूं और Hyndman की अच्छी तरह से सम्मानित पाठ्यपुस्तक में आया हूं, जिसमें उन्होंने विशेष रूप से ARIMA मॉडल के इष्टतम क्रम को खोजने के लिए यहां स्टेप वाइज चयन का उपयोग करने का उल्लेख किया है । वास्तव में, forecastआर में पैकेज में auto.arimaडिफ़ॉल्ट रूप से जाना जाने वाला एल्गोरिथ्म स्टेपवाइज़ चयन (एआईसी के साथ, पी-मान नहीं) का उपयोग करता है। वह पी-मूल्य आधारित सुविधा चयन की भी आलोचना करता है जो इस वेबसाइट पर कई पदों के साथ अच्छी तरह से संरेखित करता है।
अंत में, हमें हमेशा किसी तरह से सत्यापन को पार करना चाहिए यदि लक्ष्य पूर्वानुमान / भविष्यवाणी के लिए अच्छे मॉडल विकसित करना है। हालांकि, निश्चित रूप से यह यहाँ कुछ असहमति है जब यह पी-मान के अलावा मूल्यांकन मैट्रिक्स के लिए प्रक्रिया की बात आती है।
क्या कोई इस संदर्भ में सौतेला एआईसी के उपयोग पर कोई राय रखता है, लेकिन इस संदर्भ में सामान्य रूप से भी? मुझे यह मानने के लिए सिखाया गया है कि किसी भी कदम का चयन खराब है, लेकिन ईमानदार होना, auto.arima(stepwise = TRUE)मुझे नमूना परिणामों से बेहतर दे रहा है, auto.arima(stepwise = FALSE)लेकिन शायद यह केवल संयोग है।