क्या फेसबुक से पैगंबर एक रेखीय प्रतिगमन से अलग है?


11

इसलिए मैंने फेसबुक के नबी के बारे में जो पढ़ा है, वह यह है कि यह मूल रूप से टाइम सीरीज़ को ट्रेंड और सीज़न में तोड़ता है। उदाहरण के लिए, एक योजक मॉडल के रूप में लिखा जाएगा:

y(टी)=जी(टी)+रों(टी)+(टी)+टी

साथ में

  • टी टाइम
  • जी(टी) प्रवृत्ति (यह रैखिक या उपस्कर हो सकता है)
  • s(t) मौसमी (दैनिक, साप्ताहिक, वार्षिक ...)
  • h(t) छुट्टियां
  • eटी त्रुटि

मेरे सवाल हैं: यह एक साधारण रेखीय प्रतिगमन के साथ नहीं किया जा सकता है? यदि हम उनकी तुलना करते हैं और क्यों, तो परिणामों की अवधि में क्या अंतर होगा?


हाँ, आप एक रेखीय मॉडल के साथ ऐसा कर सकते हैं। मैं पैगंबर नहीं जानता, लेकिन अगर यह सब यह कर रहा है तो कोई अंतर नहीं है।
user2974951

जवाबों:


13

यहाँ मुद्दा एक समीकरण को प्राप्त करने का है जो अवलोकन और शोर के लिए देखे गए डेटा को पार्स करता है। यदि आपका डेटा सरल है, तो आपका प्रतिगमन दृष्टिकोण काम कर सकता है। पैगंबर के साथ जो कुछ धारणाएं बना रहे हैं, उन्हें समझने के लिए ध्यान रखा जाना चाहिए। आपको बेहतर समझना चाहिए कि पैगंबर क्या करते हैं, क्योंकि यह सिर्फ एक साधारण मॉडल के लिए फिट नहीं है, लेकिन कुछ संरचना को जोड़ने का प्रयास करता है।

उदाहरण के लिए, उनके द्वारा लिखे गए परिचय को पढ़ने के बाद मैंने जो कुछ प्रतिबिंब बनाए, वे आपके मूल्यांकन में आपकी मदद कर सकते हैं। मैं अग्रिम में माफी मांगता हूं अगर मैंने उनके दृष्टिकोण को गलत समझा है, और यदि ऐसा है तो इसे ठीक किया जाएगा।

1) उनके प्रमुख उदाहरण में प्रवृत्ति में दो ब्रेक-पॉइंट हैं लेकिन उन्होंने केवल सबसे स्पष्ट एक पर कब्जा कर लिया।

2) वे किसी भी और सभी ARIMA संरचना को अनदेखा करते हैं जो पूर्वानुमानित स्टोकैस्टिक श्रृंखला या पूर्वानुमान का मार्गदर्शन करने के लिए Y के ऐतिहासिक मूल्यों का उपयोग करने के मूल्य को दर्शाता है।

3) वे उपयोगकर्ता द्वारा सुझाए गए स्टोचस्टिक और नियतात्मक श्रृंखला के किसी भी संभावित गतिशीलता (लीड और लैग प्रभाव) को अनदेखा करते हैं। पैगंबर के कारण प्रतिगमन प्रभाव केवल समकालीन हैं।

4) श्रृंखला या मौसमी दालों में चरण / स्तर की शिफ्टों की पहचान करने के लिए कोई प्रयास नहीं किया जाता है। उदाहरण के लिए कुछ अज्ञात बाहरी घटना के कारण समय के साथ आधे रास्ते में बदलाव। पैगंबर वैकल्पिक संभावनाओं की जांच करके इसे सत्यापित करने के बजाय "सरल रैखिक विकास 'को मानते हैं। इसके संभावित उदाहरण के लिए, फेसबुक पैगंबर और आर का उपयोग करके ऑनलाइन सदस्यता व्यवसाय के लिए आवर्ती आदेशों को देखें।

5) सीन्स और कोजाइन मौसमी प्रभाव से निपटने का एक अपारदर्शी तरीका है, जबकि मौसमी प्रभाव जैसे सप्ताह के दिन, दिन के महीने, सप्ताह के महीने, साल के महीने जैसे होते हैं। एन्थ्रोपोजेनिक (मनुष्यों के साथ व्यवहार!) प्रभाव से निपटने के दौरान बहुत अधिक प्रभावी / जानकारीपूर्ण।

वार्षिक पैटर्न के लिए 365.25 की आवृत्तियों का सुझाव देना बहुत कम समझ में आता है क्योंकि हम पिछले वर्ष की तरह ठीक उसी दिन कार्रवाई नहीं करते हैं, जबकि मासिक गतिविधि बहुत अधिक है, लेकिन पैगंबर 11 मासिक संकेतकों की पेशकश नहीं करते हैं विकल्प। 52 की साप्ताहिक आवृत्तियों से बहुत कम फायदा होता है क्योंकि हमारे पास प्रत्येक और प्रत्येक वर्ष में 52 सप्ताह नहीं होते हैं।

6) गॉसियन होने की त्रुटि प्रक्रियाओं को मान्य करने का कोई प्रयास नहीं किया जाता है, इसलिए महत्व के सार्थक परीक्षण किए जा सकते हैं।

7) मॉडल त्रुटि भिन्नता के लिए कोई चिंता नहीं सजातीय होने के लिए, यानी, समय पर विशेष रूप से निश्चित रूप से नहीं बदलकर भारित कम से कम वर्गों का सुझाव। एक्सपेक्टेड वैल्यू के आनुपातिक होने के लिए एरर वैरिएशन को डील करने के लिए एक इष्टतम पॉवर ट्रांसफॉर्मेशन खोजने की कोई चिंता नहीं है (और क्यों) आपको एक डिस्ट्रीब्यूशन (संख्याओं का) लॉग लेना चाहिए?

8) उपयोगकर्ता को घटनाओं / छुट्टियों के आसपास सभी संभावित लीड और अंतराल प्रभावों को पूर्व-निर्दिष्ट करना होगा। उदाहरण के लिए, नवंबर के अंत में दैनिक बिक्री अक्सर बढ़ना शुरू हो जाती है, जो क्रिसमस के दीर्घकालिक प्रभाव को दर्शाती है।

9) कोई चिंता नहीं कि परिणामी त्रुटियां संरचना से मुक्त हैं जो पर्याप्तता के लिए नैदानिक ​​जाँच के माध्यम से मॉडल को बेहतर बनाने के तरीके सुझाती हैं।

10) स्पष्ट रूप से गैर-महत्वपूर्ण संरचना को हटाकर मॉडल में सुधार के साथ कोई चिंता नहीं है।

11) नकली पूर्वानुमानों के एक परिवार को प्राप्त करने के लिए कोई सुविधा नहीं है जहां आत्मविश्वास की सीमाएं आवश्यक विसंगतियों के भत्ते के साथ मॉडल की त्रुटियों को बूटस्ट्रैपिंग के माध्यम से सममित नहीं हो सकती हैं।

12) उपयोगकर्ता को रुझानों के बारे में धारणा बनाने (ट्रेंड ब्रेकप्वाइंट के # और वास्तविक ब्रेकपॉइंट) बड़े पैमाने पर विश्लेषण के चेहरे में अवांछित / अनुपयोगी लचीलेपन की अनुमति देता है, जिसके द्वारा यह नाम हाथों से मुक्त बड़े पैमाने पर अनुप्रयोगों के लिए डिज़ाइन किया गया है।


सहमत हूं, लेकिन मैं कहूंगा कि वे चीजें "सुविधाओं के लिए अच्छा" के करीब हैं, फिर "होना चाहिए"। आपके पास उच्च गुणवत्ता वाले पूर्वानुमान वाले मॉडल हो सकते हैं जिनमें से कुछ का अभाव है। लेकिन, जैसा कि मैंने कहा, अच्छे अंक और अच्छी समीक्षा।
टिम

आप अपने प्रतिबिंब में काफी सही हैं ... "डेटा" की अंतर्निहित जटिलता सत्तारूढ़ मुद्दा है। सरल डेटा .. सरल समाधान .. जटिल डेटा बताता है कि "अच्छा है" "बन सकता है" की आवश्यकता है। केवल आपका डेटा निश्चित रूप से जानता है!
ओकेम

@Tim stats.stackexchange.com/questions/417908/... धागा पता चलता है कुछ विशेषताएं है कि "करना अच्छा" कर रहे हैं वास्तव में होना चाहिए कि "जरूरी है की" इस तरह के "सरल रैखिक रुझान" के रूप में अनुचित मान्यताओं को विफल करने के लिए।
आयरिशस्टैट

10

मैंने इसका उपयोग नहीं किया है, लेकिन यह उनके पूर्ववर्ती सार (जोर मेरा) है:

पूर्वानुमान एक सामान्य डेटा विज्ञान कार्य है जो संगठनों को क्षमता नियोजन, लक्ष्य निर्धारण और विसंगति का पता लगाने में मदद करता है। इसके महत्व के बावजूद, विश्वसनीय और उच्च गुणवत्ता वाले पूर्वानुमानों के उत्पादन से जुड़ी गंभीर चुनौतियां हैं - खासकर जब समय श्रृंखला की एक किस्म है और समय श्रृंखला मॉडलिंग में विशेषज्ञता वाले विश्लेषक अपेक्षाकृत दुर्लभ हैं । इन चुनौतियों का समाधान करने के लिए, हम "पैमाने पर" पूर्वानुमान के लिए एक व्यावहारिक दृष्टिकोण का वर्णन करते हैं जो विश्लेषक-इन-लूप प्रदर्शन विश्लेषण के साथ विन्यास योग्य मॉडल को जोड़ती है।। हम व्याख्यात्मक मापदंडों के साथ एक मॉड्यूलर प्रतिगमन मॉडल का प्रस्ताव करते हैं जो समय श्रृंखला के बारे में डोमेन ज्ञान के साथ विश्लेषकों द्वारा सहजता से समायोजित किया जा सकता है। हम पूर्वानुमान प्रक्रियाओं की तुलना और मूल्यांकन करने के लिए प्रदर्शन विश्लेषण का वर्णन करते हैं, और मैन्युअल समीक्षा और समायोजन के लिए स्वचालित रूप से झंडा पूर्वानुमान करते हैं। उपकरण जो विश्लेषकों को अपनी विशेषज्ञता का उपयोग करने में मदद करते हैं, व्यवसाय के समय श्रृंखला के विश्वसनीय, व्यावहारिक पूर्वानुमान को प्रभावी ढंग से सक्षम करते हैं।

परिचय में:

हमने व्यापार पूर्वानुमान बनाने के अभ्यास में दो मुख्य विषयों का अवलोकन किया है। सबसे पहले, पूरी तरह से स्वचालित पूर्वानुमान तकनीक कठिन हो सकती है और अक्सर उपयोगी मान्यताओं या अनुमानों को शामिल करने के लिए बहुत अधिक अनम्य होती है। दूसरा, पूरे संगठन में डेटा विज्ञान कार्यों के लिए जिम्मेदार विश्लेषकों के पास आमतौर पर उन विशिष्ट उत्पादों या सेवाओं के बारे में गहन डोमेन विशेषज्ञता होती है, जिनका वे समर्थन करते हैं, लेकिन अक्सर समय श्रृंखला पूर्वानुमान का प्रशिक्षण नहीं होता है।

इसलिए यह मुझे प्रतीत होता है कि वे यहां पर्याप्त सांख्यिकीय उन्नति करने का दावा नहीं कर रहे हैं (हालांकि यह आपके द्वारा बताए गए सरल मॉडल की तुलना में कहीं अधिक सक्षम है)। इसके बजाय, वे दावा करते हैं कि उनका सिस्टम अपनी स्वयं की डोमेन विशेषज्ञता और सिस्टम-विशिष्ट बाधाओं को लागू करते हुए पूर्वानुमान उत्पन्न करने के लिए समय श्रृंखला विश्लेषण में विशेषज्ञता के बिना बड़ी संख्या में लोगों के लिए संभव बनाता है।

यदि आपके पास पहले से ही श्रृंखला विश्लेषण और कोडिंग जटिल मॉडल दोनों में विशेषज्ञता है, तो यह आपके लिए बहुत उपयोगी नहीं हो सकता है। लेकिन अगर उनके दावे सच हैं, तो यह बेहद उपयोगी हो सकता है! विज्ञान (और वाणिज्य) न केवल नए विचारों के कारण, बल्कि नए उपकरणों और उनके प्रसार के कारण भी है ( विषय और इस प्रतिक्रिया के बारे में इस लघु फ्रीमैन डायसन के टुकड़े को देखें )।

खुद आँकड़ों से एक उदाहरण लेने के लिए: Rएक सांख्यिकीय अग्रिम का प्रतिनिधित्व नहीं किया, लेकिन यह व्यापक रूप से प्रभावशाली रहा है क्योंकि इसने बहुत से लोगों के लिए सांख्यिकीय विश्लेषण करना आसान बना दिया। यह मचान है जिस पर सांख्यिकीय समझ का एक बड़ा सौदा बनाया गया है। यदि हम भाग्यशाली हैं, तो पैगंबर एक समान भूमिका निभा सकते हैं।

डायसन, फ्रीमैन जे। "क्या विज्ञान ज्यादातर विचारों या उपकरणों के द्वारा संचालित है?" विज्ञान 338, नहीं। 6113 (2012): 1426-1427।


0

आप परिवर्तन बिंदुओं को याद कर रहे हैं, टुकड़े-टुकड़े रैखिक विभाजन, जिसे रैखिक मॉडल में लागू किया जा सकता है।

आप सही हैं कि कम से कम सीमित मामले में यह एक रेखीय नियमित प्रतिगमन (L1 और L2 नियमितिकरण) है।

ध्यान दें कि एक अलग पैगंबर मॉडल है, लॉजिस्टिक विकास।

आप यह भी मान रहे हैं कि मौसमी कारक योगात्मक हैं, लेकिन वे गुणक मौसमी प्रभावों का भी समर्थन करते हैं, जो कम से कम विकास मॉडलिंग के लिए अधिक स्वाभाविक लगता है।


पैगंबर लेने की भविष्यवाणी इस मूल्यवान चर्चा के चेहरे पर मक्खियों ... आँकड़े . stackexchange.com/questions/18844/… जहाँ सत्ता परिवर्तन उचित मूल्य और मॉडल त्रुटि विचरण या एक विशिष्ट के बीच एक अनुभवजन्य संबंध के आधार पर उचित हैं डोमेन ज्ञान पर गैर-रेखीय अनुमान आधार।
आयरिशस्टैट

@IrishStat उस बिंदु के लिए धन्यवाद (मैंने क्षमा किया था कि वे गुणात्मक मौसम को लागू करने के लिए परिवर्तन लॉग करते हैं, वे STAN का उपयोग करते हैं, इसलिए मेरा मानना ​​है कि वे लॉग लेने के बजाय एक nonlinear मॉडल का उपयोग कर सकते थे)। क्या आप
बहुसांस्कृतिक सीज़न

यदि आप @ व्हिबर के उत्तर आँकड़े देखें ।stackexchange.com/questions/298/ ... वह "जब वैज्ञानिक सिद्धांत इंगित करता है" रूपांतरों का सुझाव देता है जो डोमेन ज्ञान के आधार पर एक संभव गैर-रेखीय धारणा होगी। अनुभवजन्य विद्युत परिवर्तन उपयोगी होते हैं जब त्रुटियों का विचरण अपेक्षित मूल्य के आनुपातिक पाया जाता है अन्यथा यह केवल "विंडो ड्रेसिंग" हो सकती है।
आयरिशस्टैट

0

एक साधारण रेखीय प्रतिगमन के साथ बहुत कुछ किया जा सकता है लेकिन पैगंबर जो नहीं करता है। केवल एक उदाहरण, आप अपने स्वयं के परिवर्तन बिंदु उम्मीदवार को एक प्रवृत्ति के लिए निर्दिष्ट कर सकते हैं, और पैगंबर इसे पूर्व के रूप में उपयोग करेंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.