कई बार श्रृंखलाओं के संयोजन के लिए मुझे क्या समस्याएं देखनी चाहिए?


10

मान लें कि मेरे पास कई समय की श्रृंखला है, उदाहरण के लिए एक क्षेत्र के विभिन्न स्टेशनों से कई तापमान रिकॉर्ड। मैं पूरे क्षेत्र के लिए एक एकल तापमान रिकॉर्ड प्राप्त करना चाहता हूं जिसके साथ मैं क्षेत्रीय जलवायु के पहलुओं का वर्णन कर सकता हूं। सहज ज्ञान युक्त दृष्टिकोण बस प्रत्येक टाइमस्टेप पर सभी स्टेशनों का औसत ले सकता है, लेकिन मेरा सांख्यिकीय मकड़ी-बोध (जो मैं निश्चित रूप से अभी तक संपर्क में नहीं हूं) मुझे बताता है कि यह इतना आसान नहीं हो सकता है। विशेष रूप से, मुझे लगता है कि पूरे क्षेत्र में औसतन कुछ दिलचस्प तापमान चरम सीमा को हटा देगा, और मुझे नजदीकी स्टेशनों के बीच निर्भरता की समस्या हो सकती है।

यदि मैंने इस तरह की रणनीति की कोशिश की, तो मुझे और किन समस्याओं का सामना करना पड़ सकता है, और क्या उन्हें दूर करने के तरीके हैं, या इस तरह के डेटा के संयोजन के अधिक समझदार तरीके हैं?

नोट: मेरे द्वारा दिए गए स्थानिक उदाहरण से उत्तर अधिक सामान्य हो सकते हैं।


1
समस्या आपके "पूरे क्षेत्र के लिए एक एकल तापमान रिकॉर्ड" और इंट्रा-क्षेत्र भिन्नता में आपके किसी भी हित के बीच संघर्ष में हो सकती है। एक समाधान में इन दो मुद्दों को समेटने का कोई तरीका शामिल हो सकता है जैसे कि विचरण को अंतर और अंतर-क्षेत्रीय घटकों में विभाजित करना।
पीटर एलिस

@PeterEllis, हाँ, मैं उस के बारे में अस्पष्ट सोच रहा था। प्रश्न के प्रयोजनों के लिए, आइए मान लें कि मैं अंतर्गर्भाशयी स्थानिक परिवर्तनशीलता के बारे में परवाह नहीं करता हूं।
n

उस स्थिति में, मुझे लगता है कि आपको मुख्य बात यह है कि करीबी स्टेशनों के बीच निर्भरता है। प्रेक्षणों को वेट करने का एक तरीका खोजें जो अगले दरवाजे को प्रभावी ढंग से डुप्लिकेट करता है, और आपको ठीक होना चाहिए।
पीटर एलिस

@PeterEllis: ठीक है, लेकिन ऐसा करने के लिए एक उचित भौतिक तरीका नहीं हो सकता है - स्टेशनों के बंद होने का मतलब यह नहीं है कि वे अधिक निर्भर हैं - यानी। एक पर्वत श्रृंखला के विपरीत किनारों पर दो करीबी स्टेशन एक व्यापक मैदान पर दो दूर के स्टेशनों के समान कम हो सकते हैं। क्या सांख्यिकीय रूप से निर्भरता को परिभाषित करने का एक विश्वसनीय तरीका है? कोवरियनस, मुझे लगता है ... परिणामी श्रृंखला में अभी भी कम चोटियां होने की संभावना है (मुझे लगता है कि हालांकि, भौतिक स्थिति को दर्शाता है - एक व्यापक क्षेत्र में अस्थायी परिवर्तन एक ही स्थान पर धीमी और स्थिर होने की संभावना है)।
n

@ प्रश्नावली, आपके प्रश्न के स्थानिक पहलू के बारे में, आपके क्षेत्र कैसे परिभाषित हैं? अपनी टिप्पणी में, आप उल्लेख करते हैं कि एक पहाड़ के विपरीत किनारों पर दो करीबी स्टेशन एक व्यापक मैदान पर दो दूर के स्टेशनों से अलग हो सकते हैं। क्या आपने अपने विश्लेषण के लिए निकटता और समानता के आधार पर स्टेशन क्षेत्रों को फिर से परिभाषित करने पर विचार किया है? जरूरी नहीं कि वे पारंपरिक क्षेत्रीय सीमाओं से मेल खाते हों। इसके बजाय वे एक विश्लेषणात्मक ओवरले बन सकते हैं जिसे पारंपरिक मानचित्र पर चित्रित किया जा सकता है।
डेव

जवाबों:


1

पहले, मैं यह कहना चाहूंगा कि मैं एक टिप्पणी जोड़ूंगा, लेकिन मैं अभी तक (प्रतिनिधि) ऐसा नहीं कर सकता, लेकिन मुझे सवाल पसंद है और मैं भाग लेना चाहता हूं, इसलिए यहां "उत्तर" है। इसके अलावा, मैं देख रहा हूं कि यह पुराना है, लेकिन यह दिलचस्प है।

पहले, क्या पीसी श्रृंखला की तरह आयाम-कमी तकनीक का उपयोग करना संभव होगा, समय श्रृंखला को संघनित करने के लिए? यदि पहला आइगेनवैल्यू बड़ा है, तो शायद इसका मतलब है कि आइजनवेक्टर का आपका उपयोग अधिकांश गतिशीलता का प्रतिनिधित्व करेगा।

दूसरा, और अधिक आम तौर पर, समय श्रृंखला का आपका वांछित उपयोग क्या है? बहुत कुछ नहीं जानते हुए, मुझे लगता है कि तापमान काफी भिन्न हो सकता है। उदाहरण के लिए, यदि कुछ तापमान रिकॉर्ड शहरों के पास हैं, तो आप "हीट आइलैंड" प्रकार का प्रभाव प्राप्त कर सकते हैं। या शायद पार्श्व दूरी में एक छोटा सा परिवर्तन ऊर्ध्वाधर दूरी में एक बड़े बदलाव को जन्म देता है --- एक स्थान समुद्र तल पर और ठीक समुद्र पर हो सकता है, और दूसरा "बहुत दूर नहीं", लेकिन ऊंचाई में एक किलोमीटर पर। उन निश्चित रूप से अलग तापमान होगा!

ये सिर्फ कुछ विचार हैं। हो सकता है कि कोई और इसमें कूद सकता है और बेहतर जवाब दे सकता है।


1
अच्छी बात। सच कहूं तो, मुझे याद नहीं है कि इस प्रश्न के आसपास का संदर्भ क्या था, और मुझे लगता है कि मेरी टिप्पणी भ्रामक थी। मैं विशेष रूप से सभी स्टेशनों के लिए परिवर्तनशीलता नहीं खोने में रुचि रखता था, लेकिन चरण से बाहर। एक महाद्वीप और एक ठंडे मोर्चे के पार स्टेशनों के बारे में सोचें। एक साधारण स्थानिक औसत मूल रूप से ठंडे मोर्चे को हटा सकता है, जो वास्तव में अच्छी बात नहीं है, क्योंकि प्रत्येक स्टेशन इसे दृढ़ता से प्रदर्शित करेगा, लेकिन अलग-अलग समय पर। संभवतः प्रत्येक स्टेशन पर किसी प्रकार का पीसीए चल रहा है और फिर किसी भी तरह से परिणाम प्राप्त करने का एक तरीका हो सकता है।
n

हे वाह, ठीक है, इसलिए यदि आप क्षेत्र में समय श्रृंखला में प्रवृत्ति को चिह्नित करने की कोशिश कर रहे हैं, तो शायद आपको समय श्रृंखला को स्थिर बनाना चाहिए, और प्रत्येक का मतलब 0. के साथ हो सकता है। आप दैनिक चक्र को हटाने का भी प्रयास कर सकते हैं। हर एक (या सिर्फ दैनिक औसत लेते हैं)। तब आपको तापमान में कम-आवृत्ति परिवर्तन के साथ छोड़ दिया जाएगा, प्रत्येक का मतलब लगभग 0. होता है। एक बार जब आपके पास ऐसा हो जाता है, तो शायद आप पीसीए जैसे कुछ आयाम में कमी तकनीक का उपयोग करके केंद्रित + स्थिर समय श्रृंखला को संघनित कर सकते हैं। मुझे खुशी है कि आपने प्रश्न के संदर्भ के बारे में थोड़ी बात की, बी / सी जो वास्तव में मदद करता है। अच्छी चीज़!
rbatt
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.