स्टैक ओवरफ्लो पर पहले की टिप्पणियों पर निर्माण:
हाँ, यह समझ में आता है। यहां मैं सामान्य प्रश्न को संबोधित करता हूं और आर विशेषज्ञों को महत्वपूर्ण विवरण भरने के लिए खुश हूं। मेरे विचार में, जैसा कि यह अब क्रॉस-वैलिडेट पर है, हमें पोस्टर के पसंदीदा सॉफ़्टवेयर पर बहुत संकीर्ण रूप से ध्यान केंद्रित नहीं करना चाहिए, हालांकि यह महत्वपूर्ण है कि समान विचारधारा वाले लोगों के लिए।
किसी भी सॉफ्टवेयर में तिथियां अगर संख्यात्मक नहीं हैं, तो उसे कुछ वर्षों के मूल दिनों से, वर्षों, दिनों, मिलीसेकंड या जो कुछ भी कहा जाता है, में संख्यात्मक चर में परिवर्तित किया जा सकता है। प्रत्येक तिथि के साथ जुड़े गुणांक में भाजक इकाइयाँ होती हैं जो कि तिथि की इकाइयाँ होती हैं। अंश इकाइयाँ प्रतिक्रिया या आश्रित चर के उन पर निर्भर करती हैं। (गैर-पहचान लिंक कार्य स्वाभाविक रूप से इसे जटिल बनाते हैं।)
हालांकि, यह आमतौर पर सबसे अधिक समझ में आता है जब तिथियों को एक मूल में स्थानांतरित कर दिया जाता है जो अध्ययन के लिए समझ में आता है। आमतौर पर, लेकिन जरूरी नहीं कि मूल अध्ययन की समय अवधि के भीतर की तारीख हो या इसके बहुत करीब हो।
शायद सबसे सरल मामला वर्षों में दिनांक चर पर रैखिक प्रतिगमन है। यहाँ 2000 या 2010 जैसी तारीखों के रूप में व्यक्त कुछ response
पर एक प्रतिगमन का date
तात्पर्य एक अवरोधन से है जो response
वर्ष 0. का मान है । कैलेंड्रिकल विवरण को अलग करते हुए कि ऐसा कोई वर्ष नहीं था, इस तरह का एक अवरोधन अक्सर बेतुका बड़ा सकारात्मक या नकारात्मक होता है, जो तार्किक लेकिन व्याख्या और प्रस्तुति में एक व्याकुलता (यहां तक कि अच्छी तरह से सूचित दर्शकों के लिए)।
स्नातक छात्रों के साथ काम करने से एक वास्तविक उदाहरण में, एक निश्चित क्षेत्र में प्रति वर्ष चक्रवातों की संख्या तारीख के साथ थोड़ा बढ़ रही थी और एक रेखीय प्रवृत्ति एक उचित पहला छुरा देखा। प्रतिगमन से अवरोधन एक बड़ी नकारात्मक संख्या थी, जो तब तक बहुत पहेली बन गई थी जब तक यह महसूस नहीं किया गया था कि यह हमेशा की तरह, वर्ष के लिए एक अतिरिक्तकरण 0. मूल को 2000 में स्थानांतरित करने से बेहतर परिणाम आए। (वास्तव में, सकारात्मक भविष्यवाणी सुनिश्चित करने वाला एक पॉइसन रिग्रेशन बेहतर था, लेकिन यह एक अलग कहानी है।)
पर regressing date - 2000
या जो कुछ भी इस तरह एक अच्छा विचार है। एक अध्ययन के मूल विवरण अक्सर एक अच्छी आधार तिथि, अर्थात एक नई उत्पत्ति का संकेत देते हैं।
अन्य मॉडलों और / या अन्य भविष्यवक्ताओं का उपयोग इस सिद्धांत को कमजोर नहीं करता है; यह सिर्फ इसे अस्पष्ट करता है।
जिन तिथियों के बारे में सोचना सबसे आसान है, उनका उपयोग करके परिणामों को ग्राफ करना भी एक अच्छा विचार है। ये मूल तिथियां हो सकती हैं; यह एक विरोधाभास नहीं है, क्योंकि यह जो कुछ भी सोचने में सबसे आसान है उसका उपयोग करने का सिर्फ एक ही सिद्धांत है।
थोड़ा विचार से पता चलता है कि सिद्धांत बहुत अधिक सामान्य है। हम अक्सर उम्र (0 - 20) या कुछ ऐसे के साथ बेहतर होते हैं, ताकि उम्र 0 के लिए तार्किक लेकिन अजीब भविष्यवाणियों से बचा जा सके।
ईडीआईटी 21 मार्च 2019 (मूल 29 जुलाई 2013): कॉक्स, एनजे 2015 में इन तर्कों पर चर्चा की गई है। मूल की प्रजाति। स्टाटा जर्नल 15: 574-587
यहां देखें
EDIT 2 भी 4 दिसंबर 2015 @ टिप्पणियों में @ संख्या संख्यात्मक परिशुद्धता का महत्वपूर्ण मुद्दा भी उठाती है। अक्सर समय इकाइयाँ ठीक होती हैं और परिणामी तारीखें या तिथि-समय बहुत बड़ा हो सकता है, वर्गों के योग के लिए महत्वपूर्ण मुद्दे उठाते हैं, और इसी तरह आगे भी। वह R से एक उदाहरण उठाता है। इसके लिए हम यह कह सकते हैं कि (जैसे) स्टाटा में तारीख-बार 1960 की शुरुआत से मिलीसेकंड हैं। यह समस्या तारीखों के लिए बिल्कुल भी विशिष्ट नहीं है, क्योंकि यह आम तौर पर संख्याओं के साथ उत्पन्न हो सकती है जो बहुत बड़ी हैं या बहुत छोटा है, लेकिन यह भी झंडा लगाने लायक है।