मैंने इस साइट पर अनगिनत पोस्ट पढ़ी हैं जो अविश्वसनीय रूप से किसी भी प्रकार के मानदंड का उपयोग करके चर के चयन के खिलाफ हैं चाहे वह पी-मान आधारित हो, एआईसी, बीआईसी, आदि।
मैं समझता हूं कि ये प्रक्रियाएं सामान्य क्यों हैं, चर के चयन के लिए काफी खराब हैं। गंग की संभवतः प्रसिद्ध पोस्ट यहाँ स्पष्ट रूप से बताती है कि क्यों; अंततः हम उसी डेटासेट पर एक परिकल्पना की पुष्टि कर रहे हैं जिसका उपयोग हम परिकल्पना के साथ करते थे, जो कि केवल डेटा ड्रेजिंग है। इसके अलावा, पी-वैल्यू मात्रा से प्रभावित होते हैं जैसे कि कोलीनियरिटी और आउटलेर, जो भारी तिरछा परिणाम, आदि।
हालाँकि, मैं हाल ही में थोड़ा सा पूर्वानुमान लगाते हुए टाइम सीरीज़ का अध्ययन कर रहा हूं और Hyndman की अच्छी तरह से सम्मानित पाठ्यपुस्तक में आया हूं, जिसमें उन्होंने विशेष रूप से ARIMA मॉडल के इष्टतम क्रम को खोजने के लिए यहां स्टेप वाइज चयन का उपयोग करने का उल्लेख किया है । वास्तव में, forecast
आर में पैकेज में auto.arima
डिफ़ॉल्ट रूप से जाना जाने वाला एल्गोरिथ्म स्टेपवाइज़ चयन (एआईसी के साथ, पी-मान नहीं) का उपयोग करता है। वह पी-मूल्य आधारित सुविधा चयन की भी आलोचना करता है जो इस वेबसाइट पर कई पदों के साथ अच्छी तरह से संरेखित करता है।
अंत में, हमें हमेशा किसी तरह से सत्यापन को पार करना चाहिए यदि लक्ष्य पूर्वानुमान / भविष्यवाणी के लिए अच्छे मॉडल विकसित करना है। हालांकि, निश्चित रूप से यह यहाँ कुछ असहमति है जब यह पी-मान के अलावा मूल्यांकन मैट्रिक्स के लिए प्रक्रिया की बात आती है।
क्या कोई इस संदर्भ में सौतेला एआईसी के उपयोग पर कोई राय रखता है, लेकिन इस संदर्भ में सामान्य रूप से भी? मुझे यह मानने के लिए सिखाया गया है कि किसी भी कदम का चयन खराब है, लेकिन ईमानदार होना, auto.arima(stepwise = TRUE)
मुझे नमूना परिणामों से बेहतर दे रहा है, auto.arima(stepwise = FALSE)
लेकिन शायद यह केवल संयोग है।