उदाहरण के लिए, मेरे पास ऐतिहासिक हानि डेटा है और मैं चरम मात्राओं (मूल्य-पर-जोखिम या संभावित अधिकतम हानि) की गणना कर रहा हूं। प्राप्त परिणाम नुकसान का अनुमान लगाने या उनकी भविष्यवाणी करने के लिए है? कोई रेखा कहां खींच सकता है? मैं उलझन में हूं।
उदाहरण के लिए, मेरे पास ऐतिहासिक हानि डेटा है और मैं चरम मात्राओं (मूल्य-पर-जोखिम या संभावित अधिकतम हानि) की गणना कर रहा हूं। प्राप्त परिणाम नुकसान का अनुमान लगाने या उनकी भविष्यवाणी करने के लिए है? कोई रेखा कहां खींच सकता है? मैं उलझन में हूं।
जवाबों:
"भविष्यवाणी" और "अनुमान" का उपयोग वास्तव में कभी-कभी गैर-तकनीकी लेखन में किया जाता है और वे समान रूप से कार्य करते हैं, लेकिन एक सांख्यिकीय समस्या के मानक मॉडल में उनके बीच एक तेज अंतर है। एक अनुमानक डेटा का उपयोग एक पैरामीटर पर अनुमान लगाने के लिए करता है जबकि एक भविष्यवक्ता डेटा का उपयोग कुछ यादृच्छिक मूल्य पर अनुमान लगाने के लिए करता है जो डेटासेट का हिस्सा नहीं है। जो लोग "पैरामीटर" और "यादृच्छिक मान" से अपरिचित हैं, उनके लिए आंकड़ों में मतलब है, निम्नलिखित एक विस्तृत विवरण प्रदान करता है।
इस मानक मॉडल में, डेटा को एक यादृच्छिक चर एक (संभवतः बहुभिन्नरूपी) अवलोकन के लिए माना जाता है जिसका वितरण केवल संभावित वितरण के निश्चित सेट के भीतर झूठ बोलने के लिए जाना जाता है, "प्रकृति के राज्य"। एक आकलनकर्ता एक गणितीय प्रक्रिया है कि में से प्रत्येक के लिए संभव मूल्य के लिए प्रदान करती है कुछ संपत्ति प्रकृति का एक राज्य के इस तरह अपने मतलब के रूप में, । इस प्रकार एक अनुमान प्रकृति की वास्तविक स्थिति के बारे में एक अनुमान है। हम बता सकता है कि अच्छा एक अनुमान की तुलना द्वारा है करने के लिए । एक्स टी एक्स टी ( एक्स ) θ μ ( θ ) टी ( एक्स ) μ ( θ )
एक भविष्यवक्ता एक और यादृच्छिक चर के स्वतंत्र अवलोकन की चिंता करता है जिसका वितरण प्रकृति की वास्तविक स्थिति से संबंधित है। एक भविष्यवाणी एक और यादृच्छिक मूल्य के बारे में अनुमान है। हम यह बता सकते हैं कि द्वारा प्राप्त मूल्य पर तुलना करके केवल एक विशेष भविष्यवाणी कितनी अच्छी है । हम आशा करते हैं कि औसतन समझौता अच्छा होगा (सभी संभावित परिणामों पर औसत के अर्थ में और साथ ही साथ सभी संभावित मूल्यों पर )।Z p ( x ) Z x Z
साधारणतम वर्ग मानक उदाहरण देता है। डेटा जोड़े से मिलकर बनता है मूल्यों जोड़ मूल्यों के आश्रित चर के स्वतंत्र चर की। प्रकृति की स्थिति तीन मापदंडों , , और द्वारा निर्दिष्ट की गई है : यह कहता है कि प्रत्येक माध्य और मानक विचलन साथ एक सामान्य वितरण से एक स्वतंत्र ड्रा की तरह है । , , और पैरामीटर (संख्या) हैं, जो माना जाता है कि वे निश्चित और अलौकिक हैं। ब्याज पर ध्यान केंद्रित करता हैy मैं एक्स मैं अल्फा बीटा σ y मैं अल्फा + बीटा एक्स मैं σ अल्फा बीटा σ अल्फा बीटा ( अल्फा , बीटा ) अल्फा अल्फा बीटा बीटा अल्फा बीटा (अवरोधन) और (ढलान)। OLS का अनुमान, लिखित , इस अर्थ में अच्छा है कि झुकाव और के करीब हो जाता है करीब , कोई फर्क नहीं पड़ता कि क्या और के सच्चे (लेकिन अज्ञात) मान हो सकते हैं ।
ओएलएस भविष्यवाणी में स्वतंत्र चर के कुछ मान के साथ जुड़े आश्रित चर के एक नए मान का अवलोकन होता है । डेटासेट में बीच हो भी सकता है और नहीं भी ; वह सारहीन है। एक सहज रूप से अच्छी भविष्यवाणी यह है कि इस नए मूल्य के करीब होने की संभावना है । बेहतर भविष्यवाणियों का कहना है कि नया मूल्य कितना करीब हो सकता है (उन्हें पूर्वानुमान अंतराल कहा जाता है )। वे इस तथ्य के लिए जिम्मेदार हैं कि और अनिश्चित हैं (क्योंकि वे यादृच्छिक मूल्यों पर गणितीय रूप से निर्भर हैंएक्स एक्स एक्स मैं अल्फा + बीटा एक्स अल्फा बीटा ( y मैं ) σ वाई ( एक्स ) σ अल्फा + बीटा एक्स ), कि कुछ (और इसलिए के लिए नहीं जाना जाता है अनुमान लगाया जा करने के लिए) है, साथ ही इस धारणा है कि मानक विचलन के साथ एक सामान्य वितरण है और मतलब ( किसी भी टोपी की अनुपस्थिति पर ध्यान दें!)।
ध्यान दें कि इस भविष्यवाणी में अनिश्चितता के दो अलग-अलग स्रोत हैं: डेटा में अनिश्चितता अनुमानित ढलान, अवरोधन और अवशिष्ट मानक विचलन ( ) में अनिश्चितता की ओर जाता है ; इसके अलावा, किस मान में अनिश्चितता होगी। यह अतिरिक्त अनिश्चितता - क्योंकि यादृच्छिक है - पूर्वानुमानों की विशेषता है। एक अनुमान एक अनुमान की तरह लग सकता है (आखिरकार, अनुमान :-) और यहां तक कि बहुत ही गणितीय सूत्र हो सकता है ( कभी-कभी के समान हो सकता हैσ वाई ( एक्स ) वाई ( एक्स ) α + β x α + β एक्स पी ( एक्स ) टी ( एक्स ) ), लेकिन यह अनुमान से अधिक अनिश्चितता की अधिक मात्रा के साथ आएगा।
यहां, फिर, ओएलएस के उदाहरण में, हम स्पष्ट रूप से भेद देखते हैं: एक अनुमान मापदंडों पर अनुमान लगाता है (जो कि निश्चित लेकिन अज्ञात संख्याएं हैं), जबकि एक भविष्यवाणी एक यादृच्छिक मात्रा के मूल्य पर अनुमान लगाती है। संभावित भ्रम का स्रोत यह है कि भविष्यवाणी आमतौर पर अनुमानित मापदंडों पर बनती है और एक अनुमानक के समान सूत्र भी हो सकती है।
व्यवहार में, आप अनुमानकों को दो तरीकों से भविष्यवाणियों से अलग कर सकते हैं:
उद्देश्य : एक अनुमानक प्रकृति की वास्तविक स्थिति की एक संपत्ति जानना चाहता है, जबकि एक भविष्यवाणी एक यादृच्छिक चर के परिणाम का अनुमान लगाना चाहती है; तथा
अनिश्चितता : एक भविष्यवक्ता के पास आम तौर पर संबंधित अनुमानक की तुलना में बड़ी अनिश्चितता होती है, उस यादृच्छिक चर के परिणाम में अतिरिक्त अनिश्चितता के कारण। अच्छी तरह से प्रलेखित और सुव्यवस्थित भविष्यवक्ता आमतौर पर अनिश्चितता बैंड के साथ आते हैं - भविष्यवाणी अंतराल - जो अनुमान लगाने वालों की अनिश्चितता बैंड की तुलना में व्यापक हैं, जिसे आत्मविश्वास अंतराल के रूप में जाना जाता है। भविष्यवाणियों के अंतराल की एक विशेषता यह है कि वे (काल्पनिक रूप से) डेटासेट के बढ़ने पर सिकुड़ सकते हैं, लेकिन वे शून्य चौड़ाई में नहीं सिकुड़ेंगे - यादृच्छिक परिणाम में अनिश्चितता "विडंबना" है - जबकि आत्मविश्वास अंतराल की चौड़ाई बढ़ जाएगी हमारे अंतर्ज्ञान के अनुरूप शून्य में सिकुड़ते हैं, एक अनुमान की सटीकता पर्याप्त मात्रा में डेटा के साथ मनमाने ढंग से अच्छी बन सकती है।
संभावित निवेश हानि का आकलन करने के लिए इसे लागू करने में, पहले इस उद्देश्य पर विचार करें: क्या आप जानना चाहते हैं कि एक निश्चित अवधि के दौरान आप इस निवेश (या निवेश की इस विशेष टोकरी) पर वास्तव में कितना खो सकते हैं, या क्या आप वास्तव में सिर्फ अनुमान लगा रहे हैं कि क्या है अपेक्षित नुकसान (निवेश के एक बड़े ब्रह्मांड पर, शायद)? पूर्व एक भविष्यवाणी है, बाद वाला एक अनुमान है। फिर अनिश्चितता पर विचार करें। यदि आपके पास डेटा इकट्ठा करने और विश्लेषण करने के लिए लगभग अनंत संसाधन हैं तो आपका उत्तर कैसे बदलेगा? यदि यह बहुत सटीक हो जाता है, तो आप शायद निवेश पर अपेक्षित रिटर्न का अनुमान लगा रहे हैं, जबकि यदि आप उत्तर के बारे में अत्यधिक अनिश्चित हैं, तो आप एक भविष्यवाणी कर रहे हैं।
इस प्रकार, यदि आप अभी भी सुनिश्चित नहीं हैं कि आप किस जानवर के साथ काम कर रहे हैं, तो अपने अनुमानक / भविष्यवक्ता से यह पूछें: यह कितना गलत है और क्यों? दोनों मानदंडों (1) और (2) के माध्यम से आपको पता चल जाएगा कि आपके पास क्या है।
अनुमान हमेशा अज्ञात पैरामीटर के लिए होता है जबकि भविष्यवाणी यादृच्छिक चर के लिए होती है।
मॉडलों में कोई अंतर नहीं है। आयोजित कार्रवाई में वास्तव में (मामूली) अंतर है। अनुमान डेटा (एआई शब्दावली में "सीखने") का उपयोग करके अपने संभाव्य मॉडल का अंशांकन है। भविष्यवाणी भविष्य अवलोकन का "अनुमान" है। यह "अनुमान लगाना" पिछले आंकड़ों पर आधारित है- यह अनुमान का मामला हो सकता है; जैसे कि अगले व्यक्ति की ऊँचाई की भविष्यवाणी जो आप आबादी में औसत ऊँचाई के अनुमान का उपयोग करके मिलने वाले हैं । हालांकि, ध्यान दें कि भविष्यवाणी हमेशा अनुमान का उदाहरण नहीं है। जिस अगले व्यक्ति से आप मिलने जा रहे हैं, उसका लिंग शास्त्रीय अर्थ में जनसंख्या का पैरामीटर नहीं है; लिंग की भविष्यवाणी करना, कुछ अनुमान की आवश्यकता हो सकती है, लेकिन इसके लिए कुछ और की आवश्यकता होगी ...
मूल्य-पर-जोखिम के मामले में, भविष्यवाणी और अनुमान आपके अनुमानित नुकसान के बाद से मेल खाता है , नुकसान की अनुमानित प्रत्याशा है।
भविष्यवाणी नमूना प्रतिगमन फ़ंक्शन का उपयोग है जो कि स्वतंत्र चर के कुछ अयोग्य मानों पर निर्भर आश्रित चर के लिए एक मूल्य का अनुमान लगाने के लिए है।
अनुमान एक अज्ञात पैरामीटर या जनसंख्या की मात्रा की गणना करने की प्रक्रिया या तकनीक है।
आमतौर पर "अनुमान" मापदंडों के लिए आरक्षित है और "भविष्यवाणी" मूल्यों के लिए है। हालांकि, कभी-कभी भेद धुंधला हो जाता है, उदाहरण के लिए, आपने "कल के मूल्य का अनुमान लगाने" के बजाय "मूल्य कल" का अनुमान लगाने जैसा कुछ देखा होगा।
मूल्य-पर-जोखिम (VaR) एक दिलचस्प मामला है। VaR एक पैरामीटर नहीं है, लेकिन हम यह नहीं कहते कि "VaR की भविष्यवाणी करें।" हम कहते हैं "वैर का अनुमान लगाएं।" क्यों?
उस VaR में कारण एक यादृच्छिक मात्रा नहीं है यदि आप वितरण जानते हैं, और आपको VaR की गणना करने के लिए वितरण को जानना आवश्यक है। इसलिए, यदि आप पैरामीट्रिक VaR दृष्टिकोण का उपयोग कर रहे हैं, तो आप पहले वितरण के मापदंडों का अनुमान लगाते हैं , फिर VaR की गणना करते हैं। यदि आप nonparametric VaR का उपयोग कर रहे हैं, तो आप सीधे VaR का अनुमान लगाते हैं कि आप मापदंडों का अनुमान कैसे लगाते हैं। इस संबंध में यह मात्रात्मक के समान है।
दूसरी ओर, हानि राशि एक यादृच्छिक मूल्य है। इसलिए, यदि आपको नुकसान का पूर्वानुमान लगाने के लिए कहा जाता है, तो आप उन्हें अनुमान नहीं लगाने की भविष्यवाणी करेंगे। फिर, कभी-कभी हम कहते हैं "अनुमान" नुकसान। इसलिए, लाइन धुंधली है, जैसा कि मैंने पहले लिखा था।
मैं नीचे और अधिक व्याख्यात्मक परिभाषाएँ खोजता हूं:
अनुमान एक परिणाम की गणना अनुमान है। यह परिणाम एक पूर्वानुमान हो सकता है लेकिन जरूरी नहीं है। उदाहरण के लिए, मैं यह अनुमान लगा सकता हूं कि कल शाम 5 बजे गोल्डन गेट ब्रिज पर कारों की संख्या 900 थी, जिससे लग रहा था कि तीन लेनें मारिन की ओर जा रही हैं, प्रत्येक कार में 30 फीट जगह है, और यह पुल 9000 फीट लंबा है ( 9000/30 x 3 = 900)।
एक्सट्रैप्लेशन मानों की ज्ञात सीमा के बाहर एक चर के मूल्य का अनुमान लगाकर अनुमान लगा रहा है कि अनुमानित मूल्य ज्ञात लोगों के कुछ पैटर्न का अनुसरण करता है। एक्सट्रपलेशन का सबसे सरल और सबसे लोकप्रिय रूप ज्ञात डेटा के आधार पर एक रैखिक प्रवृत्ति का अनुमान लगा रहा है। रैखिक एक्सट्रपलेशन के विकल्प में बहुपद और शंक्वाकार एक्सट्रपलेशन शामिल हैं। अनुमान की तरह, एक्सट्रपलेशन का उपयोग पूर्वानुमान के लिए किया जा सकता है लेकिन यह पूर्वानुमान तक सीमित नहीं है।
भविष्यवाणी बस भविष्य के बारे में कुछ कह रही है। भविष्यवाणियों आमतौर पर परिणामों पर ध्यान केंद्रित किया जाता है न कि उन परिणामों के लिए मार्ग। उदाहरण के लिए, मैं यह अनुमान लगा सकता हूं कि 2050 तक सभी वाहनों को इलेक्ट्रिक मोटर्स के साथ यह बताए बिना चलाया जाएगा कि कैसे हमें 2011 में कम अपनाने से 2050 तक पूर्ण गोद लेने की सुविधा मिलती है। जैसा कि आप पिछले उदाहरण से देख सकते हैं, पूर्वानुमान आवश्यक रूप से डेटा पर आधारित नहीं हैं।
पूर्वानुमान एक पूर्वानुमान या भविष्यवाणी करने की प्रक्रिया है। पूर्वानुमानों और पूर्वानुमानों का उपयोग अक्सर एक-दूसरे के लिए किया जाता है लेकिन कभी-कभी पूर्वानुमानों का पूर्वानुमान उस पूर्वानुमान से अलग होता है जो अक्सर पूर्वानुमानों को एक परिणाम के लिए मार्ग का स्पष्टीकरण प्रदान करते हैं। उदाहरण के लिए, एक इलेक्ट्रिक वाहन गोद लेने के पूर्वानुमान में एस-आकार के गोद लेने के पैटर्न के बाद पूर्ण इलेक्ट्रिक वाहन अपनाने का मार्ग शामिल हो सकता है जहां 2025 से पहले कुछ कारें इलेक्ट्रिक होती हैं, 2030 में तीव्र गोद लेने के साथ एक विभक्ति बिंदु होता है, और अधिकांश कारों के बाद इलेक्ट्रिक होता है 2040।
अनुमान, एक्सट्रपलेशन, पूर्वानुमान, और पूर्वानुमान पारस्परिक रूप से संपूर्ण और सामूहिक रूप से संपूर्ण नहीं हैं। जटिल समस्याओं के लिए अच्छे दीर्घकालिक पूर्वानुमान अक्सर प्रशंसनीय परिणाम उत्पन्न करने के लिए एक्सट्रपलेशन के अलावा अन्य तकनीकों का उपयोग करने की आवश्यकता होती है। पूर्वानुमान और पूर्वानुमान किसी भी प्रकार की गणना के अनुमान के बिना भी हो सकते हैं।