क्या यह एक प्रतिगमन में दिनांक चर का उपयोग करने के लिए समझ में आता है?


17

मैं आर में दिनांक प्रारूप में चर का उपयोग करने के लिए उपयोग नहीं कर रहा हूं। मैं बस सोच रहा हूं कि क्या रेखीय प्रतिगमन मॉडल में व्याख्यात्मक चर के रूप में दिनांक चर जोड़ना संभव है। यदि यह संभव है, तो हम गुणांक की व्याख्या कैसे कर सकते हैं? क्या यह परिणाम चर पर एक दिन का प्रभाव है?

मेरे जिस्ट को एक उदाहरण से देखें कि मैं क्या करने की कोशिश कर रहा हूं।


3
एक तारीख को एक नंबर में बदला जा सकता है।

मेरी धारणा है कि R यह स्वचालित रूप से करता है
PAC

3
लेकिन परिणामी संख्या अक्सर विशाल होती है, जिससे समस्याएं हो सकती हैं। माप की शुरुआत के बाद से, अपने आप को परिवर्तित करने के लिए बेहतर है, उदाहरण के लिए समय कदम (घंटे या दिन या ...)। इससे इंटरसेप्ट की व्याख्या करना भी आसान हो जाता है।
रोलैंड

3
कारक में परिवर्तित करें (दिन निश्चित प्रभाव प्राप्त करने के लिए) या संख्यात्मक और पुनर्विक्रय में परिवर्तित करें, इसलिए मूल के बाद से दिनों का रैखिक प्रभाव प्राप्त करने के लिए पहले दिन का मूल्य 0 है।
थॉमस

1
यह एक अच्छा प्रश्न है। मुझे लगता है कि यह एक सांख्यिकीय प्रश्न और एक प्रोग्रामिंग प्रश्न है। प्रोग्रामिंग सवाल यह है कि जब हम प्रतिगमन मॉडल में व्याख्यात्मक चर के रूप में दिनांक डालते हैं तो आर तिथियों से कैसे निपटता है और सांख्यिकीय प्रश्न गुणांक की सटीक व्याख्या के बारे में है।
PAC

जवाबों:


17

स्टैक ओवरफ्लो पर पहले की टिप्पणियों पर निर्माण:

हाँ, यह समझ में आता है। यहां मैं सामान्य प्रश्न को संबोधित करता हूं और आर विशेषज्ञों को महत्वपूर्ण विवरण भरने के लिए खुश हूं। मेरे विचार में, जैसा कि यह अब क्रॉस-वैलिडेट पर है, हमें पोस्टर के पसंदीदा सॉफ़्टवेयर पर बहुत संकीर्ण रूप से ध्यान केंद्रित नहीं करना चाहिए, हालांकि यह महत्वपूर्ण है कि समान विचारधारा वाले लोगों के लिए।

किसी भी सॉफ्टवेयर में तिथियां अगर संख्यात्मक नहीं हैं, तो उसे कुछ वर्षों के मूल दिनों से, वर्षों, दिनों, मिलीसेकंड या जो कुछ भी कहा जाता है, में संख्यात्मक चर में परिवर्तित किया जा सकता है। प्रत्येक तिथि के साथ जुड़े गुणांक में भाजक इकाइयाँ होती हैं जो कि तिथि की इकाइयाँ होती हैं। अंश इकाइयाँ प्रतिक्रिया या आश्रित चर के उन पर निर्भर करती हैं। (गैर-पहचान लिंक कार्य स्वाभाविक रूप से इसे जटिल बनाते हैं।)

हालांकि, यह आमतौर पर सबसे अधिक समझ में आता है जब तिथियों को एक मूल में स्थानांतरित कर दिया जाता है जो अध्ययन के लिए समझ में आता है। आमतौर पर, लेकिन जरूरी नहीं कि मूल अध्ययन की समय अवधि के भीतर की तारीख हो या इसके बहुत करीब हो।

शायद सबसे सरल मामला वर्षों में दिनांक चर पर रैखिक प्रतिगमन है। यहाँ 2000 या 2010 जैसी तारीखों के रूप में व्यक्त कुछ responseपर एक प्रतिगमन का dateतात्पर्य एक अवरोधन से है जो responseवर्ष 0. का मान है । कैलेंड्रिकल विवरण को अलग करते हुए कि ऐसा कोई वर्ष नहीं था, इस तरह का एक अवरोधन अक्सर बेतुका बड़ा सकारात्मक या नकारात्मक होता है, जो तार्किक लेकिन व्याख्या और प्रस्तुति में एक व्याकुलता (यहां तक ​​कि अच्छी तरह से सूचित दर्शकों के लिए)।

स्नातक छात्रों के साथ काम करने से एक वास्तविक उदाहरण में, एक निश्चित क्षेत्र में प्रति वर्ष चक्रवातों की संख्या तारीख के साथ थोड़ा बढ़ रही थी और एक रेखीय प्रवृत्ति एक उचित पहला छुरा देखा। प्रतिगमन से अवरोधन एक बड़ी नकारात्मक संख्या थी, जो तब तक बहुत पहेली बन गई थी जब तक यह महसूस नहीं किया गया था कि यह हमेशा की तरह, वर्ष के लिए एक अतिरिक्तकरण 0. मूल को 2000 में स्थानांतरित करने से बेहतर परिणाम आए। (वास्तव में, सकारात्मक भविष्यवाणी सुनिश्चित करने वाला एक पॉइसन रिग्रेशन बेहतर था, लेकिन यह एक अलग कहानी है।)

पर regressing date - 2000या जो कुछ भी इस तरह एक अच्छा विचार है। एक अध्ययन के मूल विवरण अक्सर एक अच्छी आधार तिथि, अर्थात एक नई उत्पत्ति का संकेत देते हैं।

अन्य मॉडलों और / या अन्य भविष्यवक्ताओं का उपयोग इस सिद्धांत को कमजोर नहीं करता है; यह सिर्फ इसे अस्पष्ट करता है।

जिन तिथियों के बारे में सोचना सबसे आसान है, उनका उपयोग करके परिणामों को ग्राफ करना भी एक अच्छा विचार है। ये मूल तिथियां हो सकती हैं; यह एक विरोधाभास नहीं है, क्योंकि यह जो कुछ भी सोचने में सबसे आसान है उसका उपयोग करने का सिर्फ एक ही सिद्धांत है।

थोड़ा विचार से पता चलता है कि सिद्धांत बहुत अधिक सामान्य है। हम अक्सर उम्र (0 - 20) या कुछ ऐसे के साथ बेहतर होते हैं, ताकि उम्र 0 के लिए तार्किक लेकिन अजीब भविष्यवाणियों से बचा जा सके।

ईडीआईटी 21 मार्च 2019 (मूल 29 जुलाई 2013): कॉक्स, एनजे 2015 में इन तर्कों पर चर्चा की गई है। मूल की प्रजाति। स्टाटा जर्नल 15: 574-587 यहां देखें

EDIT 2 भी 4 दिसंबर 2015 @ टिप्पणियों में @ संख्या संख्यात्मक परिशुद्धता का महत्वपूर्ण मुद्दा भी उठाती है। अक्सर समय इकाइयाँ ठीक होती हैं और परिणामी तारीखें या तिथि-समय बहुत बड़ा हो सकता है, वर्गों के योग के लिए महत्वपूर्ण मुद्दे उठाते हैं, और इसी तरह आगे भी। वह R से एक उदाहरण उठाता है। इसके लिए हम यह कह सकते हैं कि (जैसे) स्टाटा में तारीख-बार 1960 की शुरुआत से मिलीसेकंड हैं। यह समस्या तारीखों के लिए बिल्कुल भी विशिष्ट नहीं है, क्योंकि यह आम तौर पर संख्याओं के साथ उत्पन्न हो सकती है जो बहुत बड़ी हैं या बहुत छोटा है, लेकिन यह भी झंडा लगाने लायक है।


1
इकोनोमेट्रिकलली बात करें तो, तारीख को अक्सर एक अस्थिर चर के लिए एक प्रॉक्सी के रूप में उपयोग किया जाता है, या बस डेटा जिसे आप आसानी से प्राप्त नहीं कर सकते हैं। ब्रांड मान्यता बढ़ने के साथ समय के साथ एक नई कंपनी के एक निश्चित उत्पाद की बढ़ी हुई बिक्री दर में यह देखा जा सकता है। चूँकि आपके पास ब्रांड पहचान के लिए सबसे अधिक मीट्रिक नहीं है, इसलिए दिनांक को प्रॉक्सी के रूप में उपयोग किया जा सकता है। यह अपने अन्य regressors "अधिक यथार्थवादी" गुणांकों टी एल देना होगा **: डॉ ** आप क्या अनापा कारकों की तारीख है कि साथ सहसंबद्ध किया जा सकता है अपने स्वतंत्र चर को प्रभावित करती है के बारे में सोच के बिना अपने प्रतिगमन में दिनांक का उपयोग कर सावधान रहना चाहिए।
स्कॉट

1
अच्छी सलाह। मैं अनुमान लगाता हूं कि (कैलेंडर की) एक समारोह की तारीख आम तौर पर समय में कुछ प्रक्रिया के लिए एक प्रॉक्सी है जो अन्यथा कैप्चर करना मुश्किल है, इसलिए यह बिंदु अर्थमिति से परे है।
निक कॉक्स

1
मैं किसी के रूप में साइन और कॉज़नेस का शौकीन हूं, लेकिन विषयों में समस्याओं का नमूना लेने से क्या निर्णय होता है?
निक कॉक्स

1
यदि रुचि सीता पर मेरे कुछ काम के लिंक के लिए stata-journal.com/sjsearch.html?choice=keyword&q=season देखें ।
निक कॉक्स

3
R1

5

जैसा कि ऊपर कहा गया है, उपयुक्त स्केलिंग के साथ, तिथियां महान रेजिस्टर हैं। समय प्रभाव कम होने की संभावना भी विशिष्ट कोवरिएट्स की तुलना में रैखिक है, इसलिए मैं समय में लगभग हमेशा प्रतिगमन विभाजन का उपयोग करता हूं। कुछ जटिल समय के रुझानों को फिट होने के लिए कई समुद्री मील (जैसे, 7 या अधिक) की आवश्यकता होती है। प्रतिबंधित क्यूबिक स्प्लिन (प्राकृतिक स्प्लिन) मनाया समय के अंत से परे सुरक्षित रेखीय एक्सट्रपलेशन प्रदान करते हैं, हालांकि एक्सट्रपलेशन पूरी तरह से सुरक्षित है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.