Auto.arima बनाम ऑटोबॉक्स क्या वे अलग हैं?


16

इस साइट पर पोस्ट पढ़ने से मुझे पता है कि एक आर फ़ंक्शन auto.arima ( forecast पैकेज में ) है। मुझे यह भी पता है कि IrishStat , इस साइट की के एक सदस्य वाणिज्यिक पैकेज बनाया autobox 1980 के दशक में। जैसा कि ये दोनों पैकेज आज भी मौजूद हैं और स्वचालित रूप से दिए गए डेटा सेट के लिए अरिमा मॉडल का चयन करते हैं, वे अलग-अलग क्या करते हैं? क्या वे संभवतः एक ही डेटा सेट के लिए अलग-अलग मॉडल का उत्पादन करेंगे?


@Wayne के संपादन के लिए धन्यवाद। मैं आर फोरकास्ट पैकेज के साथ नहीं हूं, लेकिन मुझे यकीन है कि ऑटोबॉक्स के साथ तुलना करने का मेरा मतलब है।
माइकल आर। चेर्निक

(मैंने बस "ऑटो-एरीमा" का "ऑटो.रिमा" में दूसरा थोड़ा बदलाव किया है।) auto.arimaअन्य पैकेज में अन्य कार्य हो सकते हैं, लेकिन निश्चित रूप से एक ऐसा है forecast, जिसका विवरण है: "सर्वश्रेष्ठ ARIMA मॉडल के अनुसार रिटर्न या तो एआईसी, एआईसीसी या बीआईसी मूल्य के लिए। फ़ंक्शन प्रदान किए गए आदेशों की सीमाओं के भीतर संभावित मॉडल पर एक खोज का आयोजन करता है। "
वेन

1
AUTOBOX वास्तव में अनुमान लगाकर स्वचालित पहचान के आधार पर एक समग्र तरीके से स्वचालित पहचान का इलाज करता है और फिर एक मॉडल को प्रस्तुत करने के लिए नैदानिक ​​चरण-अप और चरण-डाउन प्रक्रियाएं करता है जिसमें केवल एक त्रुटि प्रक्रिया होने के दौरान सांख्यिकीय रूप से महत्वपूर्ण पैरामीटर होते हैं जो पहचानने योग्य संरचना से मुक्त होते हैं .इस तरह यह पुनरावृति की लिपि का अनुसरण करता है। AUTOBOX लगभग 1975 के शुरुआती संस्करणों में "एक सांख्यिकीय दृष्टिकोण" का उपयोग करने की कोशिश की गई थी, लेकिन यह पाया गया कि वांछित मॉडल के रूप में वांछित या मूर्खतापूर्ण संरचना (उदाहरण के लिए 5,1,2) या स्पष्ट अपर्याप्त संरचना थी।
आयरिशस्टैट

1
@IrishStat यह एक अच्छे दृष्टिकोण की तरह लगता है। यदि आप दो प्रतिस्पर्धी मॉडल पाते हैं जो आपकी आवश्यकताओं को पूरा करते हैं तो आप क्या करते हैं? यह कब्ज़दार लगता है। क्या आप विशिष्ट मानदंडों के आधार पर "इष्टतम" मॉडल की सिफारिश करते हैं? मुझे लगता है कि केवल "सांख्यिकीय महत्वपूर्ण मापदंडों" के साथ एक मॉडल के चयन के लिए पार्सिमनी का पक्ष लिया जा सकता है, लेकिन एक कम पैरा एआर प्रक्रिया और एक अन्य निम्न क्रम AEMA मॉडल होना संभव नहीं है जहां सभी पैरामीटर सांख्यिकीय रूप से महत्वपूर्ण हैं और अवशेष सफेद की तरह दिखते हैं शोर?
माइकल आर। चेर्निक

1
@IriehStat। मैं आपसे सहमत हुँ। अंत में आप उपयोगकर्ता के लिए क्या करते हैं। क्या आप सिर्फ एक मॉडल प्रदान करते हैं या आप प्रतिस्पर्धी स्वीकार्य मॉडलों की एक आदेशित सूची दे सकते हैं? यदि बाद वाला नहीं तो शायद यह जोड़ने का एक अच्छा विकल्प होगा कि आप सूची को एक छोटी संख्या में सीमित करें।
बजे माइकल आर। चेरिक

जवाबों:


9

माइकल / वेन

AUTOBOX निश्चित रूप से एक अलग मॉडल वितरित / पहचान करेगा यदि निम्न में से एक या अधिक शर्तें पूरी होती हैं

1) डेटा में दालों हैं

2) डेटा में 1 या अधिक स्तर / चरण बदलाव है

3) यदि डेटा में मौसमी दालें हैं

4) डेटा में 1 या अधिक स्थानीय समय के रुझान हैं जो केवल रीमेडेड नहीं हैं

5) यदि मॉडल के पैरामीटर समय के साथ बदलते हैं

6) यदि त्रुटियों का विचरण समय के साथ बदलता है और कोई शक्ति परिवर्तन पर्याप्त नहीं है।

एक विशिष्ट उदाहरण के संदर्भ में, मेरा सुझाव है कि आप दोनों एक समय श्रृंखला का चयन करें / करें और दोनों को वेब पर पोस्ट करें। मैं नायाब मोड में डेटा का विश्लेषण करने के लिए AUTOBOX का उपयोग करूंगा और मॉडल को सूची में पोस्ट करूंगा। फिर आप R प्रोग्राम चलाते हैं और फिर आप में से प्रत्येक दोनों परिणामों का एक अलग उद्देश्य विश्लेषण करते हैं, समानताओं और भिन्नताओं को इंगित करते हैं। उन सभी दो मॉडल को सभी उपलब्ध सहायक सामग्री के साथ पूरा करें, जिनमें से अंतिम त्रुटि शब्द मेरे टिप्पणियों के लिए हैं। इन परिणामों को सूची में सारांशित करें और प्रस्तुत करें और फिर सूची के पाठकों को VOTE से पूछें कि उन्हें कौन सी प्रक्रिया सबसे अच्छी लगती है।


क्या आप इस तरह एक प्रतियोगिता का मतलब है ?
whuber

@ शुभकर्ता हाँ। शायद यहां तक ​​कि कुछ "अज्ञात / कोडित पाठ्य पुस्तक उदाहरण" का उपयोग करते हुए जो एक पृष्ठभूमि के रूप में इस्तेमाल किया जा सकता है।
आयरिशस्टैट

22

वे दो समान लेकिन अलग-अलग समस्याओं के लिए दो अलग-अलग तरीकों का प्रतिनिधित्व करते हैं। मैंने लिखा था auto.arimaऔर @IrishStat के लेखक हैं Autobox

auto.arima()फिट (मौसमी) ARIMA मॉडल जिसमें बहाव की शर्तें शामिल हैं। Autoboxस्तर की पारियों और आउटलेर को संभालने के लिए स्थानांतरण फ़ंक्शन मॉडल को फिट करता है। एक ARIMA मॉडल ट्रांसफर फ़ंक्शन मॉडल का एक विशेष मामला है।

यहां तक ​​कि अगर आप स्तर की शिफ्टों को बंद कर देते हैं और अंदर से बाहर का पता लगा Autoboxलेते हैं, तो आपको auto.arima()एआरआईएमए मापदंडों की पहचान करने के तरीके में अलग-अलग विकल्पों के कारण एक अलग एआरआईएमए मॉडल मिलेगा ।

एम 3 और एम-प्रतियोगिता डेटा पर मेरे परीक्षण में, इन आंकड़ों की auto.arima()तुलना में अधिक सटीक पूर्वानुमान पैदा करता है Autobox। हालांकि, Autoboxबड़े आउटलेर्स और लेवल शिफ्ट वाले डेटा के साथ बेहतर करेंगे।


3
मेरा मानना ​​है कि आप कई साल पहले से कई AUTOBOX के एक संस्करण का जिक्र कर रहे थे। AUTOBOX ने इन कई वर्षों में साइन इन किया है। अगर मैं गलत नहीं हूँ, तो आपने केवल 1 मूल से सटीकता की तुलना की है, जो मुझे यकीन है कि आप सहमत होंगे कि 1. नमूना है 1. सटीकता की संख्या के मूल से मूल्यांकन करने की आवश्यकता है।
आयरिशस्टैट

15
मैं हजारों श्रृंखलाओं में प्रकाशित तुलनाओं की बात कर रहा हूं। पूर्वानुमान के अंतर्राष्ट्रीय जर्नल के प्रधान संपादक के रूप में, मुझे लगता है कि मुझे पूर्वानुमानों का मूल्यांकन करने के बारे में कुछ विचार है।
रोब हंडमैन

2
मैंने इस सवाल का इरादा नहीं किया कि कौन सबसे अच्छा पूर्वानुमान एल्गोरिदम है, इसके बारे में तर्क देने के लिए। मुझे लगता है कि ऑटोबॉक्स और ऑटो.रिमा दोनों बहुत अच्छे पैकेज हैं। सिर से सिर की तुलना कई कारणों से उचित नहीं हो सकती है। 1) उपयोगकर्ता यह जानने के लिए पर्याप्त विशेषज्ञ नहीं हो सकता है कि उन्हें कैसे जज किया जाए। 2) एक समय श्रृंखला पर पूर्वानुमान सटीकता एक बकवास शॉट है। भविष्यवाणी में एक निम्न माध्य वर्ग त्रुटि हो सकती है, लेकिन जब भी यादृच्छिकता शामिल होती है, तो इसे ध्यान में रखा जाना चाहिए। आपको कई श्रृंखलाओं को देखने की आवश्यकता है और जैसा कि आयरिशस्टैट आपको सुझाव देता है कि आपको विभिन्न शुरुआती बिंदुओं को देखना चाहिए।
माइकल आर। चेरिक जूल

इसके अलावा पूर्वानुमान शुरू करने के लिए विभिन्न बिंदु उपयोगी होंगे। 3) ARIMA दुनिया में एक ही समय श्रृंखला के मॉडल के लिए कई अभ्यावेदन हैं, परिमित AR प्रक्रियाओं में अनंत चलती औसत निरूपण हैं और इसके विपरीत। तो एक निम्न क्रम AR एक उच्च क्रम चलती औसत या ARMA के समान लगभग हो सकता है। बॉक्स ने हमेशा पारसीमोनी के सिद्धांत का पालन करने का सुझाव दिया। लेकिन अगर आपके पास बहुत अधिक डेटा है तो आप मापदंडों के अच्छे अनुमान प्राप्त कर सकते हैं और उच्च क्रम वाला मॉडल पार्सिमोनियस के समान पूर्वानुमान उत्पन्न कर सकता है। 4) दो पैकेज के अलग-अलग उद्देश्य हैं।
माइकल आर। चेरनिक

3
समय के साथ विधि विकसित हुई है। डेव रेली इस साइट पर आयरिशस्टैट के रूप में बहुत सक्रिय है और वह यह समझाने के बारे में बहुत खुला है कि यह सामान्य शब्दों में कैसे काम करता है। व्यापार रहस्य और मालिकाना एल्गोरिदम होना व्यापार का एक अनिवार्य पहलू है। अपने दृष्टिकोण से आर अपने व्यवसाय को उसी तरह से चोट पहुंचा रहा है जैसे कि स्प्लस के लिए है। लेकिन वह कड़वाहट नहीं दिखाता है और अपने सॉफ्टवेयर को प्रदर्शित करने के लिए बहुत इच्छुक है जैसा कि आप देख सकते हैं कि उसने आज किया। वह प्रतियोगियों के खिलाफ परीक्षण चलाने के लिए भी तैयार है और मेरा मानना ​​है कि उसने समय श्रृंखला पूर्वानुमान प्रतियोगिताओं में प्रवेश किया है।
बजे माइकल आर। चेरिक जूल

11

संपादित करें: आपकी टिप्पणी के अनुसार, मेरा मानना ​​है कि यदि आप कई autoboxविकल्पों को बंद कर देते हैं, तो आपको संभवतः इसी तरह का उत्तर मिलेगा auto.arima। लेकिन अगर आप नहीं करते हैं, और आउटलेर की उपस्थिति में निश्चित रूप से अंतर होगा: auto.arimaआउटलेयर के बारे में परवाह नहीं करता है, जबकि autoboxउन्हें पता चलेगा और उन्हें उचित रूप से संभाल लेगा, जो एक बेहतर मॉडल देगा। वहाँ अन्य मतभेद भी हो सकते हैं, और मुझे यकीन है कि आयरिशस्टैट उन का वर्णन कर सकता है।


मेरा मानना ​​है कि autoboxकेवल सर्वश्रेष्ठ एआर, आई और एमए गुणांकों की खोज से परे आउटलेर्स और अन्य चीजों का पता चलता है। यदि यह सही है, तो इसे और अधिक विश्लेषण की आवश्यकता होगी और इसी तरह की कार्यक्षमता के लिए कुछ अन्य आर फ़ंक्शनों की आवश्यकता होगी। और आयरिशस्टैट्स इस समुदाय का एक मूल्यवान सदस्य है, और काफी अनुकूल है।

बेशक, आर नि: शुल्क है और एआरआईएमए से परे एक बिलियन चीजें कर सकता है।

X13-ARIMA SEATSअमेरिकी जनगणना ब्यूरो से अर्थशास्त्र-शैली ARIMA के लिए एक और विकल्प है , जो खुला स्रोत है। विंडोज और लिनक्स के लिए बायनेरिज़ हैं, लेकिन यह सीधे मेरे मैक पर संकलित किया गया है, यह देखते हुए कि मैं पहले से ही ग्नू के गुर्रानेर कंपाइलर को लोड कर रहा हूं। यह X12-ARIMAविकास और परीक्षण के वर्षों के बाद, पिछले कुछ दिनों में जारी किया गया था। (यह X12 को अपडेट करता है और SEATS / TRAMO फीचर्स में भी जोड़ता है। X12 आधिकारिक यूएस टूल है, जबकि SEATS / TRAMO बैंक ऑफ स्पेन से है और "यूरोपीय टूल" है।)

मैं वास्तव में X12 (और अब X13) को बहुत पसंद करता हूं। यदि आप उचित मात्रा में डायग्नोस्टिक्स का उत्पादन करते हैं और उनके माध्यम से पढ़ते हैं और सीखते हैं कि उनका क्या मतलब है, तो वे वास्तव में एआरआईएमए और समय श्रृंखला में एक अच्छी शिक्षा हैं। मैंने अपना वर्कफ़्लो विकसित कर लिया है, लेकिन आर के x12भीतर से अधिकांश काम करने के लिए एक आर पैकेज है (आपको अभी भी X12 के लिए इनपुट मॉडल (".spc") फ़ाइल बनानी होगी)।

मैं कहता हूं कि X12 "अर्थशास्त्र शैली" ARIMA में 3 साल से अधिक डेटा के साथ मासिक डेटा का मतलब है। (आपको कुछ नैदानिक ​​सुविधाओं का उपयोग करने के लिए 5+ वर्ष के डेटा की आवश्यकता होती है।) इसकी एक विशिष्ट पहचान विशेषता है, सभी प्रकार के बाह्य विनिर्देशों को संभाल सकती है, और छुट्टियों, अस्थायी अवकाशों, व्यापारिक दिनों के प्रभावों और आर्थिक चीजों की मेजबानी कर सकती है। यह वह उपकरण है जिसका उपयोग अमेरिकी सरकार मौसम-समायोजित डेटा बनाने के लिए करती है।


मेरे प्रश्न को वास्तव में एक डेटा सेट दिया गया था कि दो एल्गोरिदम संभवतः अलग-अलग मॉडल चयन का उत्पादन करेंगे। यह वास्तव में स्वत: संप्रदाय है कि मुझे इसमें कोई दिलचस्पी नहीं है और न ही अन्य नैदानिक ​​विशेषताएं हैं जो एक hve कर सकती हैं कि दूसरा नहीं करता है। यह ज्ञात है कि ARMA मॉडल और परिवार में दो मॉडल एक ही मॉडल के सटीक या लगभग सटीक वैकल्पिक निरूपण हो सकते हैं। इसलिए अगर चयन के मसलों में मामूली अंतर है तो मुझे लगता है कि वे अलग-अलग मॉडल विकल्प दे सकते हैं।
माइकल आर। चेर्निक

3
@MichaelChernick: आह। मेरा अनुमान है कि यदि आप सभी ऑटो-सामान बंद कर देते हैं, तो आपको autoboxएक ही उत्तर मिलेगा। लेकिन उपयोग करने के बिंदुओं में से एक autoboxयह है कि यह आउटलेर्स का पता लगाएगा और उन्हें इस तरह से हैंडल करेगा, इसलिए लौटाए गए मॉडल अलग-अलग होंगे यदि आउटलेयर हैं।
वेन

@ Xay-ARIMA SEATS और SEATS / TRAMO के बारे में अतिरिक्त जानकारी के लिए +1।
ग्रीम वाल्श

@Wayne वैसे, एक और "यूरोपीय उपकरण" DEMETRA + है
ग्रीम वाल्श
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.