यदि आपने लॉग रिटर्न का उपयोग किया है, तो आपने थोड़ी सी पूर्वाग्रह त्रुटि की है लेकिन यदि आपने भविष्य के मूल्य को वर्तमान मूल्य से विभाजित किया है तो आपकी संभावना गलत है। वास्तव में, आपकी संभावना दोनों ही मामलों में गलत है। यह काफी गलत है।
विचार करें कि एक आँकड़ा डेटा का कोई कार्य है। रिटर्न डेटा नहीं हैं, वे डेटा के रूपांतरण हैं। वे वर्तमान मूल्य से विभाजित भविष्य के मूल्य हैं। कीमतें डेटा हैं। कीमतों में वितरण फ़ंक्शन होना चाहिए, लेकिन रिटर्न के लिए वितरण फ़ंक्शन पूरी तरह से कीमतों की प्रकृति पर निर्भर होना चाहिए।
एक दोहरी नीलामी में प्रतिभूतियों के लिए, "विजेता का अभिशाप नहीं है।" तर्कसंगत व्यवहार आपकी अपेक्षा की बोली लगाने के लिए है। कई खरीदारों और कई विक्रेताओं के साथ, सीमा बुक को सामान्य वितरण में परिवर्तित करना चाहिए क्योंकि यह उम्मीदों का वितरण है। इसलिएपीटीसामान्य रूप से वितरित किया जाना चाहिए। भीपीटी + १सामान्य रूप से वितरित किया जाना चाहिए। इसलिए रिटर्न का अनुपात होना चाहिए
पीटी + १पीटी- 1।
आपके प्रतिगमन के लिए संभावना समारोह होना चाहिए था
1πσσ2+ ( Y- β1एक्स1- β2एक्स2⋯ - βnएक्सn- α )2।
ओएलएस अवलोकन किए गए डेटा के लिए सबसे अच्छा फिट है, भले ही वह गलत समाधान हो। Bayesian तरीके संभावना के माध्यम से डेटा जनरेटिंग फ़ंक्शन को खोजने का प्रयास करते हैं। आपके पास संभावना गलत थी, इसलिए यह नहीं मिल सका।
अगर आपको अतिरिक्त जानकारी चाहिए तो मेरे पास इस पर एक पेपर है।
EDIT
मुझे लगता है कि आपने गलत समझा है। यदि आप संभावना को एक घनत्व समारोह में बदल देते हैं और अपेक्षा लेते हैं, तो आप पाएंगे कि यह कोई नहीं है। 1852 में ऑगस्टिन कॉची या शायद 1851 तक सबूत के अनुसार, कम से कम वर्गों के समाधान का कोई भी रूप पूरी तरह से असंभव है। यह हमेशा विफल रहेगा। ऐसा नहीं है कि आपको मानक प्रतिगमन का उपयोग करना चाहिए क्योंकि बायेसियन संभावना के प्रति संवेदनशील है, यह है कि बेयस एकमात्र उपलब्ध समाधान है जो स्वीकार्य है, कुछ असामान्य विशेष मामलों के लिए कुछ विशेष अपवादों के साथ।
इस पर अनुभवजन्य परीक्षण करने में, और इससे पहले कि मैं पर्याप्त गणित पढ़ता, मैंने भोलेपन से सोचा कि बायेसियन और फ़्रीक्वेंटिस्ट समाधान से मेल खाना चाहिए। लगभग, एक प्रमेय है जो कहता है कि जैसा कि नमूना काफी बड़ा हो जाता है, दोनों अभिसरण करेंगे। मैंने इसे परीक्षण करने के लिए 1925-2013 से सीआरएसपी ब्रह्मांड में दिन के अंत के सभी ट्रेडों का उपयोग किया। हालांकि यह नहीं है कि प्रमेय क्या कहता है। मैं नियमों को गलत समझ रहा था।
मैंने लॉग में समस्या का भी प्रयास किया, और यह अभी भी मेल नहीं खाता। इसलिए मैंने कुछ महसूस किया, सभी वितरण आकार हैं, और इसलिए मैंने यह निर्धारित करने के लिए एक ज्यामितीय समाधान का निर्माण किया कि कौन सा समाधान सही था। मैंने यह निर्धारित करने के लिए एक शुद्ध ज्यामिति समस्या के रूप में व्यवहार किया कि किस बीजीय उत्तर ने डेटा का मिलान किया।
बायेसियन एक मिलान किया। इसने मुझे एक बहुत ही गणितीय मार्ग पर ले जाने के लिए प्रेरित किया क्योंकि मैं समझ नहीं पाया कि निष्पक्ष अनुमान लगाने वाला इतना गलत क्यों था। केवल रिकॉर्ड के लिए, 1925-2013 की अवधि में अव्यवस्थित रिटर्न का उपयोग करना और शेल कंपनियों, क्लोज-एंड फंड्स और इसके बाद, स्थान के केंद्र के बीच विसंगति 2% है और जोखिम का माप वार्षिक रिटर्न के 4% द्वारा समझा जाता है। । यह विसंगति लॉग परिवर्तन के तहत है, लेकिन एक अलग कारण से। यह व्यक्तिगत सूचकांकों या डेटा के सबसेट के लिए अलग हो सकता है।
विसंगति का कारण दो गुना है। पहला यह है कि इसमें शामिल वितरणों में पर्याप्त संख्या में कमी है। कुछ प्रकार की समस्याओं के लिए, यह कोई मायने नहीं रखता है। अनुमानित उद्देश्यों के लिए, जैसे कि भविष्यवाणी या आवंटन, हालांकि, वे काफी मायने रखते हैं। दूसरा कारण यह है कि निष्पक्ष अनुमानक हमेशा मतलब का एक संस्करण है, लेकिन वितरण का कोई मतलब नहीं है।
उपरोक्त घनत्व सामान्य या गामा वितरण के रूप में घातीय परिवार का सदस्य नहीं है। पिटमैन-कोपमैन-डॉर्मोइस प्रमेय द्वारा, मापदंडों के लिए कोई पर्याप्त बिंदु सांख्यिकीय मौजूद नहीं है। तात्पर्य यह है कि बिंदु अनुमानक बनाने का कोई भी प्रयास सूचना को फेंक देना चाहिए। यह बायेसियन समाधानों के लिए एक समस्या नहीं है क्योंकि पीछे एक संपूर्ण घनत्व है और यदि आपको एक बिंदु अनुमान की आवश्यकता है, तो आप पूर्वानुमानात्मक घनत्व पा सकते हैं और इसे एक बिंदु पर कम करने के लिए इस पर एक लागत फ़ंक्शन को कम कर सकते हैं। बायेसियन संभावना हमेशा न्यूनतम रूप से पर्याप्त होती है।
उपरोक्त फ़ंक्शन के लिए न्यूनतम विचरण निष्पक्ष अनुमानक डेटा के केंद्रीय 24.6% को रखना है, इसका छंटनी का मतलब ढूंढना है, और शेष डेटा को छोड़ना है। इसका मतलब है कि 75% से अधिक डेटा गिरा दिया गया है, और जानकारी खो गई है। बस एक नोट, यह 24.8% हो सकता है, क्योंकि मैं मेमोरी से काम कर रहा हूं। आप रोथेनबर्ग के कागज पर पा सकते हैं:
रोथेनबर्ग, टीजे और एफएम फिशर, और सीबी टिलनस, ए नोट ऑन काइचिंग फ्रॉम अ कॉची सैंपल, जर्नल ऑफ द अमेरिकन स्टेटिस्टिकल एसोसिएशन, 1964, वॉल्यूम 59 (306), पीपी। 460-463
दूसरा मुद्दा मेरे लिए आश्चर्यजनक था। जब तक मैंने ज्यामिति के माध्यम से काम किया, मुझे पता नहीं था कि इसका कारण क्या था। रिटर्न -100% पर नीचे से बंधे हैं। यह मंझले को 2% से बदलता है और इंटरक्वेर्टाइल रेंज को 4% द्वारा स्थानांतरित किया जाता है, हालांकि आधा द्रव्यमान अभी भी एक ही बिंदु पर है। अर्ध-द्रव्यमान पैमाने का उचित माप है, लेकिन अर्ध-चौड़ाई नहीं है। यदि कोई ट्रंकेशन नहीं था, तो आधा-चौड़ाई और आधा-द्रव्यमान एक ही बिंदु पर होगा। इसी तरह, माध्यिका और मोड एक ही बिंदु पर रहेंगे। माध्य माध्य अभिनेता या कम से कम माध्य व्यापार के लिए वापसी है। जैसे, यह हमेशा MVUE और लॉग माध्य का स्थान है।
प्रमेय की सही समझ यह है कि सभी बायेसियन अनुमानक स्वीकार्य अनुमानक हैं। यदि दो में से एक स्थिति प्राप्त होती है, तो बार-बार मूल्यांकनकर्ता स्वीकार्य अनुमानक होते हैं। पहला यह है कि प्रत्येक नमूने में, फ़्रीक्वेंटिस्ट और बायेसियन समाधान समान हैं। दूसरा यह है कि अगर बायेसियन पद्धति के सीमित समाधान ने फ़्रीक्वेंटिस्ट समाधान का मिलान किया है, तो फ़्रीक्वेंटिस्ट समाधान स्वीकार्य है।
नमूना आकार काफी बड़ा होने पर सभी स्वीकार्य आकलनकर्ता एक ही समाधान में परिवर्तित हो जाते हैं। फ़्रीक्वेंटिस्ट आकलनकर्ता मानता है कि इसका मॉडल सही मॉडल है और डेटा यादृच्छिक है। बायेसियन मानता है कि डेटा सही है, लेकिन मॉडल यादृच्छिक है। यदि आपके पास अनंत मात्रा में डेटा था, तो व्यक्तिपरक मॉडल को वास्तविकता में परिवर्तित करना होगा। यदि आपके पास अनंत मात्रा में डेटा था, लेकिन गलत मॉडल है, तो फ़्रीक्वेंटिस्ट मॉडल संभावना शून्य के साथ वास्तविकता में परिवर्तित हो जाएगा।
इस मामले में, उचित पुजारियों के तहत बायेसियन समाधान, हमेशा ट्रेंकुलेशन और अनुमान बनाने के लिए जानकारी के नुकसान के कारण किसी भी आवृत्तिवादी अनुमानक पर हमेशा ही हावी रहेगा।
लॉग में, संभावना फ़ंक्शन हाइपरबोलिक सेकेंट वितरण है। इसमें एक परिमित विचरण है, लेकिन कोई सहसंयोजक नहीं है। ओएलएस का उपयोग करते हुए पाया जाने वाला सहसंयोजक मैट्रिक्स डेटा की एक विरूपण साक्ष्य है और एक पैरामीटर को इंगित नहीं करता है जो अंतर्निहित डेटा में मौजूद है। कच्चे रूप के साथ, लॉग फॉर्म कोवरियों में कुछ भी नहीं है, लेकिन कुछ भी स्वतंत्र नहीं है। इसके बजाय, एक और अधिक जटिल संबंध मौजूद है जो सह-अस्तित्व की परिभाषा का उल्लंघन करता है, लेकिन जिसमें वे कॉमोव कर सकते हैं।
मार्कोविट्ज़ और उस्मान ने वितरण पर अपने काम में लगभग इसे पाया, लेकिन हाइपरबोलिक सेकेंट वितरण एक पियर्सन परिवार में नहीं है और उन्होंने डेटा को गलत तरीके से नोट किया है कि जब आप कच्चे डेटा से वितरण को लॉग डेटा में बदलते हैं तो आप इसके सांख्यिकीय गुणों को बदल देंगे। । वे मूल रूप से यह पता लगाते हैं लेकिन इसे याद करते हैं क्योंकि उनके पास इसकी तलाश करने का कोई कारण नहीं था और उन्हें लॉग का उपयोग करने के अनपेक्षित परिणामों का एहसास नहीं हुआ।
मेरे पास मार्कोवित्ज़ और उस्मान मेरे पास नहीं हैं, जहां मैं हूं, लेकिन उन्होंने वितरण के कुछ बहुत अच्छे कामों में से एक का अनुमान लगाया जो वहां से हैं।
किसी भी स्थिति में, मैं JAGS का उपयोग नहीं करता। मुझे नहीं पता कि यह कैसे करना है। मैं अपने सभी MCMC काम को हाथ से बताता हूं।
मेरे पास एक पेपर है जो इस विषय पर कहीं अधिक पूर्ण और सटीक है:
हैरिस, DE (2017) डिस्ट्रीब्यूशन ऑफ रिटर्न। गणितीय वित्त की पत्रिका, 7, 769-804।
यह आपको किसी भी संपत्ति या देयता वर्ग के लिए वितरण का निर्माण करने की एक विधि प्रदान करेगा, साथ ही लेखांकन अनुपात भी।
मैं चिंतित था, लेकिन मैं देख सकता था कि आप बेयस और पियर्सन-नेमन तरीकों के बीच संबंध को गलत समझ रहे थे। आपने उन्हें उलट दिया था। बैस हमेशा काम करता है, लेकिन आप एक पूर्व घनत्व के साथ फंस जाते हैं जो आपके समाधान को खराब कर देगा। एक उचित पूर्व के साथ आपको पक्षपाती अनुमानक की गारंटी दी जाती है और इस प्रकार के संभावित कार्य के लिए, मेरा मानना है कि एकता के लिए पूर्णता की गारंटी के लिए आपको एक उचित पूर्व का उपयोग करना चाहिए। फ़्रीक्वेंटिस्ट तरीके तेज़ हैं और आमतौर पर काम करते हैं। वे निष्पक्ष हैं, लेकिन मान्य नहीं हो सकते।