कण फिल्टर को समझने के लिए गणितीय और सांख्यिकीय पूर्वापेक्षाएँ?


10

मैं वर्तमान में वित्त में कण फिल्टर और उनके संभावित उपयोगों को समझने की कोशिश कर रहा हूं और मैं काफी संघर्ष कर रहा हूं। (I) क्वांटिटेटिव फाइनेंस में एक बैकग्राउंड (क्वांटिटेटिव फाइनेंस में बैकग्राउंड से आने वाली) गणितीय और सांख्यिकीय पूर्वापेक्षाएँ हैं, ताकि (i) कण फिल्टर की मूल बातें सुलभ हो सकें, और (ii) बाद में उन्हें अच्छी तरह से समझ सकें? मेरे पास राज्य-अंतरिक्ष मॉडल के अपवाद के साथ स्नातक-स्तरीय समय श्रृंखला अर्थमिति का एक ठोस ज्ञान है, जिसे मैंने अभी तक कवर नहीं किया है।

किसी भी संकेत बहुत सराहना की है!


4
Bayesian आँकड़े (IMHO) विषय के लिए महत्वपूर्ण है। आपको एक गुच्छा जानने की ज़रूरत नहीं है, बस यह सुनिश्चित करें कि आप इससे जुड़ी शर्तों (जैसे कि पूर्व, संभावना, पीछे) को समझ लें और वे मॉडलिंग मान्यताओं से कैसे उत्पन्न होते हैं
यार डॉन

1
मुझे लगता है कि डकेट के कागज पढ़ना एक महान विचार है, वह वास्तव में एक अच्छा लेखक है। अपनी वेबसाइट पर उनके पास स्लाइड / व्याख्यान और वीडियो सहित संसाधनों की एक व्यापक सूची है ! उन्होंने अपने एक सहयोगी से एक और व्यापक सूची भी शामिल की ।
बोडोनोविक

जवाबों:


9

आप बस कुछ बुनियादी अवधारणाओं के साथ चौंकाने वाला दूर हो सकते हैं। संकेतन, चरों का विस्फोट आदि ... चीजें जटिल लग सकती हैं , लेकिन कण छानने का मूल विचार उल्लेखनीय रूप से सरल है।

कुछ बुनियादी संभावना जो आपको (और पहले से ही होने की संभावना है!) समझें:

  • पी(एक्स=एक्स)=Σमैंपी(एक्स=एक्स,Y=yमैं)
  • पी(एक्स|Y)=पी(एक्स,Y)पी(Y)
  • पी(एक्स|Y)=पी(Y|एक्स)पी(एक्स)पी(Y)
  • Bayesian शर्तें: उदाहरण के लिए। पहले, संभावना, बाद में (+1 @ यार डोन, मैं सहमत हूं!)

एक कण फिल्टर के बुनियादी कदम अविश्वसनीय रूप से सरल हैं:

प्रथम:

  • कुछ छिपे हुए राज्य के बारे में कुछ विश्वासों के साथ शुरू करें। उदाहरण के लिए, आप इस विश्वास के साथ शुरू कर सकते हैं कि आपका रॉकेट लॉन्च पैड पर है। (एक कण फ़िल्टर में, छिपे हुए राज्य के बारे में विश्वासों को अंकों के एक बादल के साथ दर्शाया जाएगा, प्रत्येक बिंदु छिपे हुए राज्य के संभावित मूल्य को दर्शाता है। प्रत्येक बिंदु राज्य के वास्तविक राज्य होने की संभावना से भी जुड़ा हुआ है।)

टीटी+1

  1. भविष्यवाणी कदम: गति के कानून के आधार पर अंकों के स्थान को आगे बढ़ाएं । (जैसे। रॉकेट की वर्तमान गति, प्रक्षेपवक्र आदि ... के आधार पर आगे बढ़ने वाले बिंदु)। अनिश्चितता बढ़ने पर यह आमतौर पर अंकों के बादल का विस्तार करेगा।
  2. संभाव्यता अद्यतन चरण: बायस नियम का उपयोग करके बिंदुओं से जुड़ी संभावनाओं को अद्यतन करने के लिए डेटा, सेंसर इनपुट का उपयोग करें। अनिश्चितता कम होने के कारण, यह आमतौर पर बिंदुओं के बादल को पीछे हटा देगा।
  3. कुछ कण फ़िल्टरिंग विशिष्ट चरणों / ट्रिक्स को जोड़ें। उदाहरण के लिए। :
    • कभी-कभी अपने बिंदुओं को फिर से भरें ताकि प्रत्येक बिंदु पर समान संभावना हो।
    • कुछ शोर में मिलाएं, अपने संभाव्यता कदम (2) को अपने अंकों के बादल को बहुत अधिक गिरने से रोकें (कण फ़िल्टरिंग में, यह महत्वपूर्ण है कि आपके वास्तविक स्थान पर सकारात्मक संभावना के साथ कम से कम एक बिंदु हो!)

उदाहरण:

अपने फ़िल्टर को आरम्भिक करें: - अपने स्थान को देखें, जहाँ आप खड़े हैं। अब आंखें बंद कर लें।

फिर पुनरावृति:

  1. अपनी आँखें बंद करके एक कदम आगे बढ़ाएँ।
  2. भविष्यवाणी कदम: जहां आप खड़े थे , उसके बारे में पिछले विश्वासों को देखते हुए, भविष्यवाणी करें कि आप अब कहां खड़े हैं, एक कदम आगे दिया गया है। (ध्यान दें कि अनिश्चितता का विस्तार कैसे होता है क्योंकि आपकी आंखें बंद होने के साथ आपका कदम सुपर सटीक नहीं है!)
  3. अद्यतन चरण: जहाँ आप खड़े हैं, उसके बारे में अपनी मान्यताओं को अद्यतन करने के लिए सेंसर (उदाहरण के चारों ओर महसूस करना, आदि ...) का उपयोग करें।

दोहराएं!

लागू करने के लिए आवश्यक संभाव्यता मशीनरी मूल रूप से सिर्फ मूल संभावना है: बेयस नियम, सीमांत वितरण आदि की गणना ...

अत्यधिक संबंधित विचार जो बड़ी तस्वीर को समझने में मदद कर सकते हैं:

कुछ अर्थों में, चरण (1) और (2) किसी भी Bayesian फ़िल्टरिंग समस्या के लिए आम हैं । संभवतः के बारे में पढ़ने के लिए कुछ अत्यधिक संबंधित अवधारणाएँ:

  • छिपे हुए मार्कोव मॉडल । एक प्रक्रिया मार्कोव है यदि अतीत वर्तमान स्थिति को देखते हुए भविष्य से स्वतंत्र है। लगभग किसी भी समय श्रृंखला को किसी प्रकार की मार्कोव प्रक्रिया के रूप में तैयार किया जाता है। एक हिडन मार्कोव मॉडल वह है जहां राज्य को प्रत्यक्ष रूप से नहीं देखा जाता है (उदाहरण के लिए, आप कभी भी सीधे अपने रॉकेट के सटीक स्थान का निरीक्षण नहीं करते हैं और इसके बजाय यह बायेसियन फ़िल्टर के माध्यम से पता लगाते हैं)।
  • कलमन फ़िल्टर । यह कण फ़िल्टरिंग का एक विकल्प है जो आमतौर पर उपयोग किया जाता है। यह मूल रूप से एक बायेसियन फिल्टर है जहां सब कुछ मल्टीवेरेट गौसियन माना जाता है।

2

आपको आसान-से-कोड स्टेट स्पेस मॉडल और क्लोज-फॉर्म फ़िल्टरिंग के बारे में पहले (यानी कलमन फ़िल्टर, छिपे हुए मार्कोव मॉडल) के बारे में सीखना चाहिए। मैथ्यू गन सही है कि आप सरल अवधारणाओं के साथ आश्चर्यजनक रूप से दूर हो सकते हैं, लेकिन मेरी विनम्र राय में, आपको इसे एक मध्यवर्ती लक्ष्य बनाना चाहिए:

1.) अपेक्षाकृत बोल, राज्य अंतरिक्ष मॉडल में अधिक चलती भागों हैं। जब आप एसएसएम या छिपे हुए मार्कोव मॉडल सीखते हैं, तो बहुत अधिक अंकन होता है। इसका मतलब यह है कि आपके काम करने की याददाश्त को बनाए रखने के लिए और भी चीजें हैं, जब आप चीजों को सत्यापित करते हैं। व्यक्तिगत रूप से, जब मैं पहले कलमन फ़िल्टर और रैखिक-गॉसियन एसएसएम के बारे में सीख रहा था, तो मैं मूल रूप से सोच रहा था "एह यह सब बहुभिन्नरूपी सामान्य वैक्टर के गुण हैं ... मुझे केवल इस बात का ध्यान रखना है कि कौन सा मैट्रिक्स है।" इसके अलावा, यदि आप पुस्तकों के बीच स्विच कर रहे हैं, तो वे अक्सर संकेतन बदलते हैं।

बाद में मैंने इसके बारे में सोचा जैसे "एह, यह हर समय बिंदु पर सिर्फ बेय्स नियम है।" एक बार जब आप इसे इस तरह से समझते हैं तो आप समझते हैं कि संयुग्मित परिवार अच्छे क्यों हैं, जैसे कि कलमन फ़िल्टर के मामले में। जब आप एक छिपी मार्कोव मॉडल को कोड करते हैं, तो उसके असतत राज्य स्थान के साथ, आप देखते हैं कि आपको किसी भी संभावना की गणना करने की आवश्यकता क्यों नहीं है, और फ़िल्टरिंग / चौरसाई करना आसान है। (मुझे लगता है कि मैं यहां कॉन्वेंटल हम्म शब्दजाल से भटक रहा हूं।)

2.) इनमें से बहुत से कोडिंग पर अपने दाँत काटने से आपको एहसास होगा कि राज्य अंतरिक्ष मॉडल की परिभाषा कितनी सामान्य है। बहुत जल्द आप उन मॉडलों को लिखेंगे जिन्हें आप उपयोग करना चाहते हैं, और एक ही समय में यह देखते हुए कि आप क्यों नहीं कर सकते हैं। पहले आप अंततः देखेंगे कि आप इसे केवल इन दो रूपों में से एक में नहीं लिख सकते हैं जिसका आप उपयोग कर रहे हैं। जब आप इसके बारे में थोड़ा और सोचते हैं, तो आप बेयस नियम को लिखते हैं, और समस्या को देखते हैं कि डेटा के लिए किसी प्रकार की संभावना की गणना करने में आपकी असमर्थता है।

तो आप अंततः इन पश्चवर्ती वितरण (राज्यों के वितरण को चौरसाई या फ़िल्टर करने) की गणना करने में सक्षम नहीं होंगे। इस बात का ध्यान रखने के लिए, वहाँ बहुत सारे फ़िल्टरिंग सामान हैं। कण फ़िल्टरिंग उनमें से सिर्फ एक है। कण छानने का मुख्य साधन: आप इन वितरणों से अनुकरण करते हैं क्योंकि आप उनकी गणना नहीं कर सकते हैं।

आप कैसे अनुकरण करते हैं? अधिकांश एल्गोरिदम महत्व के नमूने के कुछ संस्करण हैं। लेकिन यह यहाँ भी अधिक जटिल है। मैं उस ट्यूटोरियल पेपर को Doucet और Johansen ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf ) द्वारा सुझाता हूं । यदि आपको मिलता है कि कैसे बंद फॉर्म फ़िल्टरिंग कार्य करता है, तो वे महत्व नमूने के सामान्य विचार का परिचय देते हैं, फिर मोंटे कार्लो विधि का सामान्य विचार, और फिर आपको दिखाते हैं कि एक अच्छी वित्तीय समय श्रृंखला उदाहरण के साथ आरंभ करने के लिए इन दो चीजों का उपयोग कैसे करें। IMHO, यह कण फ़िल्टरिंग का सबसे अच्छा ट्यूटोरियल है जो मैं भर में आया हूं।

मिक्स (महत्व नमूना और मोंटे कार्लो विधि) में दो नए विचारों को जोड़ने के अलावा, अब और अधिक अंकन है। कुछ घनत्व आप अभी से नमूना ले रहे हैं; कुछ आप मूल्यांकन कर रहे हैं, और जब आप उनका मूल्यांकन करते हैं, तो आप नमूनों पर मूल्यांकन कर रहे हैं। परिणाम, आपके द्वारा यह सब कोड करने के बाद, भारित नमूने, डीम्ड कण हैं। वे हर नए अवलोकन के बाद बदलते हैं। एक बार में यह सब उठाना बहुत कठिन होगा। मुझे लगता है कि यह एक प्रक्रिया है।

अगर मैं क्रिप्टोकरंसी या हैंडवॉवी के रूप में आ रहा हूं तो मैं माफी मांगता हूं। यह विषय के साथ मेरी व्यक्तिगत परिचितता के लिए सिर्फ समयरेखा है। मैथ्यू गन की पोस्ट शायद आपके सवाल का सीधे जवाब देती है। मुझे लगा कि मैं इस प्रतिक्रिया को टॉस करूंगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.