क्या पहले बायेसियन मॉडल को फिट करना ठीक है, फिर पुजारियों को कमजोर करना शुरू करें?


10

लगातार आंकड़े देते समय, बड़े नो-नग की एक लंबी सूची होती है, जैसे अधिक डेटा एकत्र करने का निर्णय लेने से पहले सांख्यिकीय परीक्षणों के परिणामों को देखना। मैं आम तौर पर सोच रहा था कि क्या बायेसियन आँकड़ों में शामिल कार्यप्रणाली के लिए नो-नोस की एक समान सूची है, और विशेष रूप से यह है कि निम्नलिखित उनमें से एक है।

मैंने हाल ही में महसूस किया है कि जिन कुछ मॉडलों के लिए मैं फिटिंग कर रहा हूं, मेरी प्रक्रिया पहले मॉडल को जानकारीपूर्ण पुजारियों के साथ फिट करने के लिए है, यह देखने के लिए कि क्या यह काम करता है या उड़ा देता है, और फिर या तो अनजाने या कमजोर रूप से जानकारीपूर्ण के लिए याजकों को कमजोर करता है और मॉडल को परिष्कृत करें।

इसके लिए मेरी प्रेरणा वास्तव में इस तथ्य के साथ है कि मैं इन मॉडलों को जेएजीएस / स्टेन में लिख रहा हूं, और मेरे दिमाग में मैं इसे एक सांख्यिकीय की तुलना में प्रोग्रामिंग कार्य की तरह अधिक व्यवहार कर रहा हूं। इसलिए, मैं एक पहला रन करता हूं, यह सूचनात्मक पुजारियों का उपयोग करके जल्दी से अभिसरण करने के लिए इसे हेराफेरी करने के लिए, मैंने जो मॉडल लिखा है उसमें त्रुटियों को पकड़ना आसान बनाता है। फिर, मॉडल को डीबग करने के बाद, मैं इसे अनइंफॉर्मेटिव, या कमजोर रूप से सूचनात्मक पुजारियों के साथ परिष्कृत करता हूं।

मेरा सवाल यह है कि मैं इस प्रक्रिया के साथ कुछ गंभीर नियम तोड़ रहा हूं या नहीं। उदाहरण के लिए, मेरे निष्कर्षों के वैध होने के लिए, और शोधकर्ताओं की स्वतंत्रता की डिग्री के दोहन से बचने के लिए, क्या मुझे किसी मॉडल को शुरू करने से पहले विशिष्ट पुजारियों के लिए प्रतिबद्ध होने की आवश्यकता है ?


4
एक हास्य के रूप में एक तरफ (मुझे उम्मीद है) यहाँ एक कविता है जो मैंने लिखी है । (हाँ, मैं जानता हूँ कि यह एक स्तोत्र नहीं है)
पीटर Flom

@PeterFlom, ओह, यह अशुभ है।
जोफ्रवल्ड

जवाबों:


9

सब्जेक्टिव बायेसियन असहमत हो सकते हैं, लेकिन मेरे नजरिए से, मॉडल संभावना की तरह ही एक हिस्सा है। मॉडल व्यवहार के जवाब में पूर्व को बदलना आपके संभावना फ़ंक्शन को बदलने (जैसे विभिन्न त्रुटि वितरण या विभिन्न मॉडल योगों की कोशिश करना) से बेहतर या बुरा नहीं है।

यह खतरनाक हो सकता है अगर यह आपको मछली पकड़ने के अभियान पर जाने देता है, लेकिन विकल्प बदतर हो सकते हैं। उदाहरण के लिए, आपके द्वारा बताए गए मामले में, जहां आपका मॉडल चल रहा है और आपको निरर्थक गुणांक मिलते हैं, तो आपके पास फिर से प्रयास करने के अलावा ज्यादा विकल्प नहीं होते हैं।

इसके अलावा, कुछ कदम हैं जिनसे आप मछली पकड़ने के अभियान के खतरों को कम कर सकते हैं:

  • अग्रिम में निर्णय लेना जो आप अंतिम विश्लेषण में उपयोग करेंगे
  • जब आप प्रकाशित करते हैं या अपनी पूरी प्रक्रिया के बारे में अपने विश्लेषण का वर्णन करते हैं, तो सामने-सामने होना
  • अंतिम विश्लेषण के लिए या तो सिम्युलेटेड डेटा और / या डेटा को होल्ड करना संभव है। इस तरह, आप अपने विश्लेषण को बहुत अधिक दूषित नहीं करेंगे।

4

यदि आप पुजारियों के साथ प्रयोग करते हैं और हाथ में डेटा पर इसके प्रदर्शन के संदर्भ में एक का चयन करते हैं, तो यह अब "पूर्व" नहीं है। न केवल यह डेटा पर निर्भर करता है (जैसा कि एक अनुभवजन्य बेयस विश्लेषण में), लेकिन यह इस बात पर भी निर्भर करता है कि आप क्या देखना चाहते हैं (जो कि बदतर है)। अंत में, आप बायेसियन टूल का उपयोग करते हैं, लेकिन इसे बायेसियन विश्लेषण नहीं कहा जा सकता है।


1
जैसा कि मैं ओपी को समझता हूं, वह एक पूर्व का उपयोग नहीं कर रहा है और परिणामों को देख रहा है और निर्णय ले रहा है कि एक और पूर्व उसे बेहतर परिणाम देगा। वह पहले कृत्रिम का उपयोग कर रहा है यह देखने के लिए कि उसका मॉडल ठीक से कोडित है, फिर विश्लेषण के लिए अपने वास्तविक से पहले स्विच करना। शायद अगर उसने अपने पहले कदम में सिंथेटिक डेटा का भी इस्तेमाल किया है, तो अपने वास्तविक पूर्व और दूसरे चरण में अपने वास्तविक डेटा दोनों को बदल दिया, तो यह अधिक स्वीकार्य होगा?
वेन

3

मुझे लगता है कि आप इस मामले में तीन कारणों से ठीक हैं:

  1. आप वास्तव में अपने परिणामों के जवाब में अपने पुरोहितों को समायोजित नहीं कर रहे हैं। यदि आपने कुछ ऐसा कहा है, "मैं XYZ पुजारी का उपयोग करता हूं और अभिसरण की दर और मेरे डीआईसी परिणामों के आधार पर, मैं तब एबीसी द्वारा अपने पूर्व को संशोधित करता हूं," तो मैं कहूंगा कि आप एक नहीं-नहीं कर रहे थे, लेकिन इस मामले में यह लगता है कि आप वास्तव में ऐसा नहीं कर रहे हैं।

  2. एक बायेसियन संदर्भ में, पादरी स्पष्ट हैं। इसलिए आपके लिए अपने पुजारियों को अनुचित तरीके से जोड़ना संभव है, लेकिन परिणामी पुजारी हमेशा दूसरों के निरीक्षण के लिए दिखाई देंगे जो सवाल कर सकते हैं कि आपके पास उन विशेष पुजारियों के पास क्यों है। शायद मैं यहाँ भोली हूँ, क्योंकि किसी चीज़ को पहले की तरह देखना आसान है और कहते हैं, "हम्म, उचित लगता है" बस इसलिए कि किसी ने इसे पेश किया, लेकिन ...

  3. मुझे लगता है कि आप जो कर रहे हैं वह जेलमैन मॉडल (और अन्य) से संबंधित है, जेएजीएस मॉडल टुकड़ा-दर-टुकड़ा बनाने की सलाह, पहले सिंथेटिक डेटा के साथ काम करना, फिर वास्तविक डेटा, यह सुनिश्चित करने के लिए कि आपके पास विनिर्देशन त्रुटि नहीं है। । यह वास्तव में लगातार कार्यप्रणाली का कारक नहीं है, और यह वास्तव में एक प्रयोगात्मक पद्धति नहीं है।

तो फिर, मैं अभी भी खुद यह सामान सीख रहा हूं।

पुनश्च जब आप कहते हैं कि आप मूल रूप से इसे "सूचनात्मक पादरियों" के साथ जल्दी से अभिसरण करने के लिए रिग करते हैं, तो क्या आपका मतलब वास्तव में जानकारीपूर्ण पादरियों से है जो हाथ में समस्या से प्रेरित हैं, या सिर्फ पुजारी हैं कि मनमाने कारणों के लिए जोरदार धक्का देते हैं / इस गति को बढ़ाने के लिए पीछे हटते हैं। “कुछ मनमानी करने के लिए? यदि यह पहला मामला है, तो आप इन (प्रेरित) पुजारियों से दूर क्यों जा रहे हैं?


1

मुझे लगता है कि यह बायेसियन स्कूल से कोई स्वतंत्र नहीं हो सकता है। जेफ्रीस नॉनफॉर्मेटिव पादरियों का उपयोग करना चाहते हैं। लिंडले चाहते हो सकता है कि आप जानकारीपूर्ण पुजारियों का उपयोग करें। अनुभवजन्य बायेसियन पूछेंगे कि आपने डेटा को पहले से प्रभावित होने दिया। लेकिन मुझे लगता है कि हालांकि प्रत्येक स्कूल पहले की पसंद के बारे में एक अलग सुझाव दे रहा है, लेकिन उन सभी के पास एक दृष्टिकोण है जिसका मतलब यह नहीं है कि आप पूर्व ले सकते हैं और जब तक आप चाहते हैं परिणाम प्राप्त नहीं कर लेते हैं। यह निश्चित रूप से डेटा को देखने और डेटा इकट्ठा करने और परीक्षण करने के लिए जब तक आप जवाब क्या होना चाहिए की अपनी पूर्व धारणा तक नहीं पहुंचते हैं।

बार-बार या बेयसियन यह कोई फर्क नहीं पड़ता कि मुझे नहीं लगता कि कोई भी आपको डेटा (या मालिश) के साथ चाल खेलना चाहता है। शायद यह कुछ ऐसा है जिस पर हम सभी सहमत हो सकते हैं और पीटर की मजेदार कविता वास्तव में एप्रोपो है।


1

मैं कहूंगा कि नहीं, आपको विशिष्ट पुजारियों के लिए प्रतिबद्ध नहीं होना चाहिए। आम तौर पर किसी भी बायेसियन डेटा विश्लेषण के दौरान आपको मॉडल की संवेदनशीलता का विश्लेषण पूर्व में करना चाहिए। इसमें परिणाम देखने के लिए विभिन्न अन्य पुजारियों की कोशिश करना शामिल होगा। इससे पहले बेहतर या अधिक मजबूत का उपयोग किया जा सकता है।

दो स्पष्ट "नहीं-नहीं" हैं: एक बेहतर फिट पाने के लिए पूर्व के साथ बहुत अधिक खेलना, जिसके परिणामस्वरूप अधिक फिट होने के लिए और मॉडल के अन्य मापदंडों को बदलने के लिए। पहले के एक उदाहरण के रूप में: मतलब पर एक प्रारंभिक पूर्व को बदलना ताकि यह नमूना माध्य के करीब हो। दूसरे के लिए: एक बेहतर फिट पाने के लिए एक प्रतिगमन में अपने व्याख्यात्मक चर / सुविधाओं को बदलना। यह प्रतिगमन के किसी भी संस्करण में एक समस्या है और मूल रूप से आपकी स्वतंत्रता की डिग्री को अमान्य करता है।


संवेदनशीलता विश्लेषण का उल्लेख करने के लिए +1। आपको पता होना चाहिए कि आपके परिणाम उपयोग किए जाने वाले पुजारियों पर कितना निर्भर हैं ...
मानोएल गेल्डिनो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.