समय श्रृंखला के मॉडल में आर-स्क्वेर का उपयोग करने में क्या समस्या है?


12

मैंने पढ़ा है कि समय श्रृंखला के लिए आर-स्क्वेर का उपयोग करना उचित नहीं है क्योंकि एक समय श्रृंखला के संदर्भ में (मुझे पता है कि अन्य संदर्भ हैं) आर-स्क्वायर्ड अब अद्वितीय नहीं है। ऐसा क्यों है? मैंने इसे देखने की कोशिश की, लेकिन मुझे कुछ नहीं मिला। आमतौर पर मैं अपने मॉडल का मूल्यांकन करते समय आर-स्क्वेर (या एडजस्टेड आर-स्क्वेर) में बहुत अधिक मूल्य नहीं रखता, लेकिन मेरे बहुत से सहकर्मी (यानी बिजनेस मैजर्स) आर-स्क्वेर के साथ पूरी तरह से प्यार करते हैं और मैं सक्षम होना चाहता हूं उन्हें समझाइए कि समय श्रृंखला के संदर्भ में आर-स्क्वेर्ड उपयुक्त क्यों नहीं हैं।


3
Google खोज: "अर्थमिति में सहज प्रतिगमन"। या ग्रेंजर और न्यूबॉल्ड के पेपर देखें । अन्य लोग उत्तर में अधिक विवरण प्रदान कर सकते हैं।
ग्रीम वाल्श

@ रिचर्ड हार्डी क्या आप कृपया विस्तार से बता सकते हैं "यदि हम इसकी आबादी के समकक्ष के रूप में नमूना आर 2 लेते हैं, तो यह एकीकृत समय श्रृंखला के तहत टूट जाता है।"
सिद्धार्थ कृष्णमूर्ति

जवाबों:


18

मुद्दे के कुछ पहलू:

अगर कोई हमें नंबर का सदिश देता है और नंबर का एक कंवर्टेबल मैट्रिक्स होता है , तो हमें यह जानने की जरूरत नहीं है कि कुछ अनुमान बीजगणित को अंजाम देने के लिए उनके बीच क्या संबंध है, को आश्रित चर मानते हैं । बीजगणित परिणाम देगा, चाहे ये संख्याएँ क्रॉस-सेक्शनल या टाइम सीरीज़ या पैनल डेटा का प्रतिनिधित्व करती हैं, या फिर मैट्रिक्स में आदि के लैग्ड मान शामिल हैं । yएक्सyएक्सy

निर्धारण के गुणांक की मूलभूत परिभाषा हैआर2

आर2=1-एसएसआररोंएसएसटीटी

जहाँ कुछ अनुमान प्रक्रिया से वर्ग के अवशेषों का योग है, और इसके नमूने माध्य से आश्रित चर के वर्ग विचलन का योग है।एसएसआररोंएसएसटीटी

संयोजन, हमेशा विशिष्ट गणना के लिए होगा, एक विशिष्ट डेटा नमूने के लिए, चर के बीच संबंध का एक विशिष्ट सूत्रीकरण, और एक विशिष्ट अनुमान प्रक्रिया, केवल इस शर्त के अधीन है कि अनुमान प्रक्रिया ऐसी है कि यह बिंदु अनुमान प्रदान करती है शामिल अज्ञात मात्रा में (और इसलिए आश्रित चर के बिंदु अनुमान, और इसलिए अवशिष्ट के बिंदु अनुमान)। यदि इन तीन पहलुओं में से कोई भी परिवर्तन होता है, तो का अंकगणितीय मान सामान्य परिवर्तन में होगा-लेकिन यह किसी भी प्रकार के डेटा के लिए होता है, न कि केवल समय-श्रृंखला के लिए।आर2आर2

तो और टाइम-सीरीज़ के साथ मुद्दा यह नहीं है कि यह "अद्वितीय" है या नहीं (चूंकि समय-श्रृंखला डेटा के लिए अधिकांश अनुमान प्रक्रियाएं बिंदु अनुमान प्रदान करती हैं)। मुद्दा यह है कि क्या "सामान्य" समय श्रृंखला विनिर्देश ढांचा लिए तकनीकी रूप से अनुकूल है , और क्या कुछ उपयोगी जानकारी प्रदान करता है। आर2आर2आर2

की व्याख्या "निर्भर चर चर के अनुपात" के रूप में व्याख्या की गई है, जो अवशिष्ट पर गंभीर रूप से शून्य तक जोड़ता है। रैखिक प्रतिगमन (जो भी प्रकार के डेटा पर), और साधारण जानवर वर्गों के अनुमान के संदर्भ में, यह केवल तभी सुनिश्चित किया जाता है यदि विनिर्देश में रजिस्ट्रर मैट्रिक्स में एक निरंतर शब्द (समय-श्रृंखला शब्दावली में एक "बहाव") शामिल है। ऑटोरेग्रेसिव टाइम-सीरीज मॉडल में, एक बहाव कई मामलों में शामिल नहीं है। आर2

आम तौर पर, जब हम समय-श्रृंखला डेटा के साथ सामना करते हैं, "स्वचालित रूप से" हम यह सोचना शुरू करते हैं कि भविष्य में समय-श्रृंखला कैसे विकसित होगी। इसलिए हम एक टाइम-सीरीज़ मॉडल का मूल्यांकन करते हैं, जो इस बात पर आधारित है कि यह भविष्य के मूल्यों की कितनी अच्छी भविष्यवाणी करता है , यह अतीत के मूल्यों को कितनी अच्छी तरह फिट करता है । लेकिन मुख्य रूप से उत्तरार्द्ध को दर्शाता है, पूर्व नहीं। सुप्रसिद्ध तथ्य यह है कि रजिस्टरों की संख्या में कमी नहीं है, इसका मतलब है कि हम रजिस्टरों ( किसी भी रेजिस्टर, यानी किसी भी श्रृंखला की संख्या), संभवतः आश्रित चर के लिए पूरी तरह से असंबंधित जोड़कर एक सही फिट प्राप्त कर सकते हैं ) । अनुभव से पता चलता है कि इस तरह से प्राप्त एक पूर्ण फिट, भी रसातल देगाआर2आर2 नमूने के बाहर की भविष्यवाणी।

सहज रूप से, यह शायद प्रति-सहज व्यापार-बंद होता है क्योंकि एक अनुमानित समीकरण में निर्भर चर की संपूर्ण परिवर्तनशीलता को कैप्चर करके, हम सिस्टमैटिक एक में व्यवस्थित परिवर्तनशीलता को बदल देते हैं, जैसा कि भविष्यवाणी के संबंध में है (यहां, "अनस्टैमैटिक" को हमारे ज्ञान के सापेक्ष समझा जाना चाहिए। -एक विशुद्ध रूप से नियतात्मक दार्शनिक दृष्टिकोण से, "असंतृप्त परिवर्तनशीलता" जैसी कोई चीज नहीं है। लेकिन इस हद तक कि हमारा सीमित ज्ञान हमें कुछ परिवर्तनशीलता को "प्रणालीगत" के रूप में व्यवहार करने के लिए मजबूर करता है, फिर इसे व्यवस्थित रूप में बदलने की कोशिश। घटक, भविष्यवाणी आपदा लाता है)।

वास्तव में, यह शायद किसी को दिखाने का सबसे ठोस तरीका है कि समय श्रृंखला से निपटने के दौरान मुख्य नैदानिक ​​/ मूल्यांकन उपकरण क्यों नहीं होना चाहिए: एक बिंदु तक रजिस्टरों की संख्या बढ़ाएं जहां । फिर अनुमानित समीकरण लें और आश्रित चर के भविष्य के मूल्यों की भविष्यवाणी करने का प्रयास करें।आर2आर21


अच्छी व्याख्या लेकिन फिर इसे सांख्यिकीय पैकेज में सॉफ्टवेयर के मानक आउटपुट के रूप में क्यों जोड़ा गया है

@ बृजेश रिग्रेशन-परंपरा, मैं कहूंगा।
एलेकोस पापाडोपोल्स

बहुत बढ़िया जवाब! हालांकि, इसमें बहुत कम जानकारी होती है जो विशेष रूप से समय श्रृंखला के लिए होती है। भविष्यवाणी बनाम इन-सैंपल फिट अन्य डेटा प्रकारों पर लागू होता है जो संभवतः समय श्रृंखला के लिए अधिक है। दूसरी ओर, एक प्रमुख पहलू जो विशेष रूप से समय श्रृंखला के लिए गायब है। मेरा मतलब है कि इंटीग्रेटेड वैरिएबल को फिर से पाना। यदि हम नमूना को उसके जनसंख्या समकक्ष के एक उपाय के रूप में लेते हैं , तो यह एकीकृत समय श्रृंखला के तहत टूट जाता है। (मैं इसे एक उत्तर के रूप में लिख सकता हूं लेकिन अभी इसके पास समय नहीं है।)आर2
रिचर्ड हार्डी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.