"समय श्रृंखला विश्लेषण" और "अनुदैर्ध्य डेटा विश्लेषण" शब्दों के बीच क्या अंतर हैं


17

जब अनुदैर्ध्य डेटा के बारे में बात करते हैं, तो हम एक ही विषय / अध्ययन इकाई से बार-बार एकत्र किए गए डेटा को संदर्भित कर सकते हैं, इस प्रकार एक ही विषय के भीतर टिप्पणियों के लिए सहसंबंध होते हैं, अर्थात, विषय-समान समानता।

जब समय-श्रृंखला डेटा के बारे में बात की जाती है, तो हम समय की एक श्रृंखला में एकत्र किए गए डेटा का भी उल्लेख करते हैं और यह ऊपर वर्णित अनुदैर्ध्य सेटिंग के समान लगता है।

मैं सोच रहा हूं कि क्या कोई इन दोनों शब्दों के बीच स्पष्ट स्पष्टीकरण दे सकता है, क्या संबंध है और क्या अंतर हैं?


1
यह एक सर्वेक्षण में बदल सकता है ... मैंने दोनों प्रकार के डेटा पर काम किया है, और एक महत्वपूर्ण अंतर यह है कि अनुदैर्ध्य डेटा का उपयोग अक्सर कारण विश्लेषण में किया जाता है , हस्तक्षेप या उपचार के प्रभाव को समझने के लिए, जबकि समय श्रृंखला अक्सर उपयोग की जाती है में पूर्वानुमान । बेशक, अंतर स्पष्ट नहीं है (आपको पूर्वानुमान के लिए अंतर्निहित ड्राइवरों को समझने की आवश्यकता है, और आईएमओ ने आपको ड्राइवरों को तब तक नहीं समझा है जब तक कि आप अच्छी तरह से पूर्वानुमान नहीं लगा सकते हैं)। लेकिन समय श्रृंखला में सिग्नल का पता लगाने वाले लोग अक्सर पूर्वानुमान के बारे में इतना ध्यान नहीं देते हैं, इसलिए वे शायद मेरे भेद को खारिज कर देंगे।
Stephan Kolassa

आपकी टिप्पणियों के लिए आभार। लेकिन मुझे लगता है कि शब्द "कारण" यहां उपयुक्त नहीं हो सकता है बल्कि "संघ" शब्द बेहतर होना चाहिए? डेटा विश्लेषण के उद्देश्य के संदर्भ में, मुझे लगता है कि आपकी टिप्पणियों ने मेरे लिए कुछ मायने रखे। लेकिन क्या हम पूर्वानुमान करने के लिए अनुदैर्ध्य डेटा का उपयोग नहीं कर सकते हैं? चूंकि यह समय श्रृंखला डेटा का भी प्रकार है।
पूछ रहा हूँ

1
आपके पास एक बिंदु पुनः "कारण" बनाम "संघ" है, और निश्चित रूप से अनुदैर्ध्य डेटा का उपयोग पूर्वानुमान के लिए किया जा सकता है - यह सिर्फ इतना है कि मैं अक्सर दो अवधारणाओं को एक साथ नहीं देखता हूं। पूर्वानुमानकर्ता आमतौर पर समय श्रृंखला के बारे में बात करते हैं। इसके अलावा, मैं इसे @gung से बेहतर नहीं लगा सकता।
स्टीफन कोलास्सा

3
एक संभव के ठेठ (पारिभाषिक नहीं) मतभेद उस समय श्रृंखला में आप देख सकते हैं और मॉडल समय है पर निर्भर के रूप में प्रतिक्रिया टी - 1 राज्य; यह कैरीओवर इफेक्ट है। अनुदैर्ध्य समय विश्लेषण में आप आमतौर पर समय को स्थायी , विकासवादी पृष्ठभूमि कारक मानते हैं । tt1
ttnphns 16

4
अन्य थ्रेड्स भी देखें, उदाहरण के लिए आँकड़े ।stackexchange.com
निक कॉक्स

जवाबों:


19

मुझे संदेह है कि डेटा विश्लेषकों की एक विस्तृत श्रृंखला पर सख्त, औपचारिक परिभाषाएं हैं।

हालांकि, सामान्य रूप से, समय श्रृंखला नियमित अंतराल पर एक एकल अध्ययन इकाई को दर्शाती है, जो बहुत लंबे समय तक चलती है। एक प्रोटोटाइप उदाहरण दशकों में एक देश की वार्षिक जीडीपी वृद्धि या सौ वर्षों से भी अधिक होगा। एक निजी कंपनी के लिए काम करने वाले विश्लेषक के लिए, यह कंपनी के जीवन पर मासिक बिक्री राजस्व हो सकता है। क्योंकि बहुत सारे अवलोकन हैं, डेटा का महान विस्तार से विश्लेषण किया जाता है, विभिन्न अवधियों पर मौसम की तरह की चीजों की तलाश की जाती है (जैसे, मासिक: एक महीने की शुरुआत में अधिक बिक्री लोगों को भुगतान किए जाने के बाद; वार्षिक: नवंबर में अधिक बिक्री; दिसंबर, जब लोग क्रिसमस के मौसम के लिए खरीदारी कर रहे हैं), और संभवत: शासन में बदलाव। @StephanKolassa नोट के रूप में पूर्वानुमान अक्सर बहुत महत्वपूर्ण होता है।

अनुदैर्ध्य आमतौर पर बड़ी संख्या में अध्ययन इकाइयों पर कम माप को संदर्भित करता है। एक प्रोटोटाइप उदाहरण एक दवा परीक्षण हो सकता है, जहां बेसलाइन पर (उपचार से पहले), और अगले 3 महीनों के लिए मासिक रूप से सैकड़ों रोगियों को मापा जाता है। इस उदाहरण में प्रत्येक इकाई के सिर्फ 4 अवलोकनों के साथ, यह देखने की कोशिश नहीं की जा सकती है कि श्रृंखला के विश्लेषकों ने किस प्रकार की विशेषताओं का पता लगाया है। आज़ादी को संबोधित किया गया है। जैसा कि पता चलता है, अक्सर गैर-स्वतंत्रता को ब्याज की प्राथमिक विशेषता के बजाय लगभग एक उपद्रव माना जाता है।


8

लगभग तीन प्रकार के डेटासेट हैं:

  • क्रॉस सेक्शन: एक ही समय में विभिन्न विषय; इसे विभिन्न विषयों के अनुरूप कई स्तंभों वाली एक पंक्ति के रूप में सोचें;
  • समय श्रृंखला: अलग-अलग समय पर एक ही विषय; इसे अलग-अलग समय बिंदुओं के अनुरूप पंक्तियों वाला एक स्तंभ मानें;
  • पैनल (अनुदैर्ध्य): कई विषय अलग-अलग समय पर, आपके पास अलग-अलग समय पर एक ही विषय होते हैं, और आपके पास एक ही समय में कई विषय होते हैं; इसे एक तालिका के रूप में सोचें जहां पंक्तियाँ समय बिंदु हैं, और कॉलम विषय हैं।

2
आपकी टिप्पणियों के आधार पर, ऐसा लगता है कि अनुदैर्ध्य डेटा विभिन्न विषयों से एकत्रित कई समय श्रृंखला डेटा का एक सेट है?
15:11 पर

1
आम तौर पर, हाँ, आप प्रत्येक विषय को समय श्रृंखला के रूप में देख सकते हैं। हालांकि व्यवहार में, अनुदैर्ध्य डेटा में अक्सर प्रत्येक विषय के लिए बहुत कम समय होते हैं। वे समय बिंदु तरंगों को कहते हैं । उदाहरण के लिए, यह चिकित्सीय अध्ययन हो सकता है जहां प्रत्येक रोगी की मासिक अंतराल पर 4-5 टिप्पणियां होती हैं, और सैकड़ों रोगियों में वर्षों से। इस तरह से पैनल डेटा सेट अक्सर असंतुलित होते हैं (बहुत विरल तालिका के बारे में सोचते हैं), इसलिए इससे निपटने के लिए अनुदैर्ध्य अध्ययन के अपने पसंदीदा तरीके हैं।
अक्कल

यह प्रश्न दिया गया सहायक है, लेकिन कई अन्य प्रकार के डेटासेट हैं जो इन शीर्षकों में से किसी के अंतर्गत नहीं आते हैं। हालांकि, वे इस सवाल के लिए प्रासंगिक नहीं लगते हैं, और हर संभव तरह के डेटासेट को वर्गीकृत करने की कोशिश करना यहाँ व्यर्थ होगा। उदाहरण: कोई भी डेटासेट जहां मूल संरचना विषय x विषय है; कोई भी डेटासेट जो द्वि-आयामी नहीं है।
निक कॉक्स

@NickCox, सच है, लेकिन मैं अर्थमिति में हूँ, और इन तीन विकसित सिद्धांतों के साथ होते हैं, और हमारे क्षेत्र में ज्यादातर इस्तेमाल किया
Aksakal

2
इसमें कोई संदेह नहीं है, लेकिन प्रश्न में कुछ भी नहीं है या यहां तक ​​कि एक संकीर्ण अर्थमितीय दृष्टिकोण को प्रोत्साहित करता है, और न ही आपके विशिष्ट दृष्टिकोण को स्पष्ट किया गया था।
निक कॉक्स

3

हो सकता है कि ये दोनों शब्द ओपी के मानने के तरीके से संबंधित न हों - यानी, मुझे नहीं लगता कि वे विश्लेषण के प्रतिस्पर्धी तरीके हैं।

इसके बजाय समय-श्रृंखला विश्लेषण निम्न-स्तरीय तकनीकों के एक सेट का वर्णन करता है जो एक अनुदैर्ध्य अध्ययन में डेटा का विश्लेषण करने के लिए उपयोगी हो सकता है।

समय श्रृंखला विश्लेषण में अध्ययन का उद्देश्य कुछ समय-निर्भर संकेत है।

इन समय-निर्भर संकेतों का विश्लेषण और मॉडल / भविष्यवाणी करने के लिए अधिकांश तकनीकों का निर्माण इस आधार पर किया जाता है कि ये संकेत विभिन्न घटकों में विघटित होते हैं। दो सबसे महत्वपूर्ण हैं:

  • चक्रीय घटक (जैसे, दैनिक, साप्ताहिक, मासिक, मौसमी); तथा

  • प्रवृत्ति

दूसरे शब्दों में, समय श्रृंखला विश्लेषण एक अंतर्निहित संकेत निकालने के लिए समय-निर्भर सिग्नल के चक्रीय प्रकृति का शोषण करने पर आधारित है।


0

इसे सरल बनाने के लिए मैं व्यक्तियों का अध्ययन मानूंगा, लेकिन यह विश्लेषण की किसी भी इकाई पर लागू होता है। यह जटिल नहीं है, समय श्रृंखला समय के साथ एकत्रित डेटा है, आमतौर पर समान माप से अलग-अलग समय अंतराल पर एक ही माप लागू किया जाता है - या निरंतर एकत्र किया जाता है लेकिन समयबद्ध अंतराल पर विश्लेषण किया जाता है।
अनुदैर्ध्य डेटा गुंजाइश में बहुत व्यापक है। समतुल्य जनसंख्या को समान जनसंख्या से बदल दिया जाता है, इसलिए व्यक्तिगत डेटा को समय के साथ जोड़ा या जोड़ा जा सकता है। अनुदैर्ध्य डेटा को अध्ययन के लक्ष्य के आधार पर दोहराया जा सकता है या नहीं। जब अनुदैर्ध्य डेटा एक समय श्रृंखला की तरह दिखता है जब हम समय के साथ एक ही चीज को मापते हैं। बड़ा अंतर यह है कि एक समय श्रृंखला में हम समय के साथ (या समूह द्वारा) माप में समग्र परिवर्तन को माप सकते हैं जबकि अनुदैर्ध्य विश्लेषण में आपके पास वास्तव में व्यक्तिगत स्तर पर परिवर्तन का माप होता है। तो आपके पास विश्लेषण के लिए बहुत अधिक संभावनाएं हैं और परिवर्तन का माप त्रुटि के बिना है यदि नमूना शामिल है, तो एक अनुदैर्ध्य अध्ययन अधिक सटीक और जानकारीपूर्ण हो सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.