Google रुझान साप्ताहिक डेटा लौटाता है इसलिए मुझे अपने दैनिक / मासिक डेटा के साथ उन्हें मर्ज करने का एक तरीका खोजना होगा।
मैंने अभी तक जो भी किया है वह प्रत्येक सीरी को दैनिक डेटा में तोड़ना है, उदाहरण के लिए:
से:
2013-03-03 - 2013-03-09 37
सेवा:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
लेकिन यह मेरी समस्या में बहुत अधिक जटिलता जोड़ रहा है। मैं पिछले 6 महीनों के मूल्यों या मासिक डेटा में 6 मानों से Google खोज की भविष्यवाणी करने की कोशिश कर रहा था। दैनिक डेटा 180 अतीत के मूल्यों पर एक काम होगा। (मेरे पास 10 साल का डेटा है इसलिए मासिक डेटा में 120 अंक / साप्ताहिक डेटा में 500+ / दैनिक डेटा में 3500+)
अन्य दृष्टिकोण साप्ताहिक / मासिक डेटा में दैनिक डेटा "मर्ज" करना होगा। लेकिन इस प्रक्रिया से कुछ सवाल उठते हैं। कुछ डेटा को औसत किया जा सकता है क्योंकि उनकी राशि कुछ का प्रतिनिधित्व करती है। उदाहरण के लिए, किसी दिए गए सप्ताह में बारिश की मात्रा प्रत्येक सप्ताह के लिए राशियों की राशि होगी जो सप्ताह की रचना करती है।
मेरे मामले में मैं कीमतों, वित्तीय दरों और अन्य चीजों के साथ काम कर रहा हूं। कीमतों के लिए मेरे क्षेत्र में आम तौर पर एक्सचेंज किए गए वॉल्यूम को लेना आम है, इसलिए साप्ताहिक डेटा एक औसत भार होगा। वित्तीय दरों के लिए यह कुछ अधिक जटिल है, कुछ सूत्र दैनिक दरों से साप्ताहिक दरों का निर्माण करने के लिए शामिल हैं। अन्य बातों के लिए मुझे अंतर्निहित गुणों का पता नहीं है। मुझे लगता है कि अर्थहीन संकेतक से बचने के लिए वे गुण महत्वपूर्ण हैं (औसतन औसत दर एक गैर-उदाहरण के लिए होगा)।
तो तीन सवाल:
ज्ञात और अज्ञात गुणों के लिए, मुझे दैनिक से साप्ताहिक / मासिक डेटा पर जाने के लिए कैसे आगे बढ़ना चाहिए?
मुझे लगता है कि साप्ताहिक / मासिक डेटा को दैनिक डेटा में तोड़ देना जैसे मैंने किया है, कुछ हद तक गलत है क्योंकि मैं उन राशियों का परिचय दे रहा हूं जिनका वास्तविक जीवन में कोई मतलब नहीं है। तो लगभग एक ही सवाल:
ज्ञात और अज्ञात गुणों के लिए, मुझे साप्ताहिक / मासिक से दैनिक डेटा तक जाने के लिए कैसे आगे बढ़ना चाहिए?
अंतिम लेकिन कम से कम: जब अलग-अलग समय चरणों के साथ दो समय श्रृंखला दी जाए, तो क्या बेहतर है: सबसे कम या सबसे बड़े समय कदम का उपयोग करना? मुझे लगता है कि यह डेटा की संख्या और मॉडल की जटिलता के बीच एक समझौता है, लेकिन मैं उन विकल्पों के बीच चयन करने के लिए कोई मजबूत तर्क नहीं देख सकता।
संपादित करें: यदि आप आसानी से करने के लिए एक उपकरण (आर पायथन यहां तक कि एक्सेल में) जानते हैं तो यह बहुत सराहनीय होगा।