बेयसियन सांख्यिकी अधिक से अधिक लोकप्रिय शोध विषय क्यों बन रहा है? [बन्द है]


10

शीर्ष 100 अमेरिकी समाचार सांख्यिकी कार्यक्रम के अनुसंधान क्षेत्र के माध्यम से ब्राउज़ करना, उनमें से लगभग सभी बायेसियन आंकड़ों में भारी हैं। हालांकि, अगर मैं निचले स्तर के स्कूल में जाता हूं, तो उनमें से अधिकांश अभी भी शास्त्रीय / लगातार सांख्यिकी अनुसंधान कर रहे हैं। उदाहरण के लिए, मेरे वर्तमान स्कूल (150 से 200 के बीच QS की विश्व रैंकिंग पर आँकड़ों के लिए रैंकिंग तो एक शीर्ष स्तरीय स्कूल नहीं माना जाता है) में केवल एक प्रोफेसर है जो बायेसियन आँकड़ों पर ध्यान केंद्रित कर रहा है और बायेसियन आँकड़ों के प्रति लगभग नाराजगी है। कुछ ग्रेड छात्रों से मैंने बात की, यहां तक ​​कि बायेसियन स्टेटिस्टिशियन इसके लिए बायेसियन स्टैटिस्टिक्स कर रहे हैं, जो कि मैं निश्चित रूप से दृढ़ता से असहमत हूं।

हालांकि, मुझे आश्चर्य है कि ऐसा क्यों है। मैं कई शिक्षित अनुमान लगा रहा हूँ:

(ए) शास्त्रीय / लगातार आँकड़ों की कार्यप्रणाली में प्रगति के लिए पर्याप्त जगह नहीं बची है और शास्त्रीय / क्रमिक आँकड़ों के शोध में एकमात्र व्यवहार्य शोध अनुप्रयोगों पर है जो निम्न स्तरीय स्कूल का मुख्य फोकस होगा क्योंकि शीर्ष स्तरीय स्कूल अधिक होना चाहिए सैद्धांतिक और कार्यप्रणाली अनुसंधान के प्रति झुकाव।

(b) यह भारी क्षेत्र पर निर्भर है। सांख्यिकी की कुछ शाखा बस बायसियन सांख्यिकी के लिए अधिक उपयुक्त है जैसे कि सांख्यिकी पद्धति के कई वैज्ञानिक अनुप्रयोग जबकि अन्य शाखा वित्तीय क्षेत्र जैसे शास्त्रीय आंकड़ों के लिए अधिक उपयुक्त है। (इसे सही करें अगर मैं गलत हूं) इसे देखते हुए, ऐसा लगता है कि शीर्ष स्तरीय स्कूलों में वैज्ञानिक क्षेत्र में आवेदन करने वाले बहुत सारे सांख्यिकी संकाय हैं, जबकि निचले स्तर के स्कूल सांख्यिकी विभाग मुख्य रूप से वित्तीय क्षेत्र में अनुप्रयोगों पर ध्यान केंद्रित कर रहे हैं क्योंकि इससे उन्हें आय उत्पन्न करने में मदद मिलती है। और धन।

(c) बार-बार होने वाले तरीके के साथ बहुत बड़ी समस्याएँ हैं जिनका समाधान नहीं किया जा सकता है उदाहरण के लिए MLE के ओवरफिट होने का खतरा, आदि और बायेसियन एक शानदार समाधान प्रदान करते हैं।

(d) कम्प्यूटेशनल पावर यहाँ है इसलिए बेयसियन कम्प्यूटेशन अब एक अड़चन नहीं है क्योंकि यह 30 साल पहले था।

(() यह मेरे पास सबसे अधिक अनुमानित अनुमान हो सकता है। शास्त्रीय / लगातार सांख्यिकीविद् से एक प्रतिरोध है कि सिर्फ कार्यप्रणाली की एक नई लहर पसंद नहीं है जो संभवतः शास्त्रीय आंकड़ों की भूमिका से आगे निकल सकती है। लेकिन जैसे लैरी वासरमैन ने कहा, यह इस बात पर निर्भर करता है कि हम क्या करने की कोशिश कर रहे हैं और सभी को खुले दिमाग रखना चाहिए, खासकर एक शोधकर्ता के रूप में।


1
जबकि सीवी डेनिजन्स की राय अलग-अलग होगी, और इस तरह की राय को ऑफ-टॉपिक माना जाता है, यह इंगित करने योग्य है कि वास्तव में इस प्रश्न का उत्तर बायेसियन विश्लेषण पर आधुनिक ग्रंथों के परिचयात्मक अध्यायों में दिया गया है। विशेष रूप से, जेलमैन का अध्याय 1, एट अल बायेसियन डेटा विश्लेषण 3 एड। यह "सामान्य ज्ञान" और बी) के लिए उबलता है, अत्यधिक समस्याग्रस्त अक्सर विश्वासवादी अंतराल है कि हम में से 99% मदद नहीं कर सकते हैं लेकिन गलत व्याख्या करते हैं। जिस तरह से हम इसका गलत अर्थ लगाते हैं वह आंतरिक रूप से बायेसियन है, इसलिए हम गेट-गो से बायेसियन विश्लेषण कर सकते हैं।
पीटर लियोपोल्ड

3
@Peter लियोपोल्ड आधा गंभीरता से: 99%? और "हम" कौन है? आँकड़ों के कई भोले उपयोगकर्ताओं को वास्तव में सीआई के बारे में गंभीर गलतफहमी है, लेकिन अगर आप सीवी समुदाय को संबोधित कर रहे हैं, तो मुझे उम्मीद है कि 99% वास्तव में फिट नहीं होंगे। सांख्यिकीय लोग कठिन डेटा के अभाव में नंबर बनाने में किसी और की तरह ही बुरे हो सकते हैं!
निक कॉक्स

@NickCox मैं ओपी को संबोधित कर रहा था, और "हम" का अर्थ समता और समावेशी होना है। उम्मीद है, "99%" को परिमाण अनुमान के एक क्रम के रूप में पहचाना जाता है । यह लोकप्रिय संस्कृति में है / है- ट्रॉप का बड़ा हिस्सा भी है, जहां इस संदर्भ में नोट-ईवेंट का संकेत मिलता है: "मैंने आंकड़े 101 ले लिए, लेकिन मैंने आत्मविश्वास के अंतराल की निरंतरवादी बनाम बायसियन व्याख्या को पूरी तरह से आंतरिक नहीं किया है। बनाम विश्वसनीय अंतराल। " और अब जब आपने मुझे बाहर बुलाया, तो मैं जोर दूंगा: (डी) कि यह उस घटना के लिए मेरा अधिकारी है! स्वाभाविक रूप से, मैं अन्यथा आश्वस्त होने को तैयार हूँ! : डी102
पीटर लियोपोल्ड

जवाबों:


8

व्यक्तिगत रूप से, मैं कुछ अनुमान लगाता हूँ:

(1) बायेसियन आंकड़ों ने पिछले कुछ दशकों में लोकप्रियता में भारी वृद्धि देखी। इसका एक हिस्सा एमसीएमसी में प्रगति और कम्प्यूटेशनल संसाधनों में सुधार के कारण था। बायेसियन आंकड़े सैद्धांतिक रूप से बहुत अच्छे थे, लेकिन केवल खिलौना समस्याओं के लिए एक दृष्टिकोण पर लागू होता है जो अधिक सार्वभौमिक रूप से लागू किया जा सकता है। इसका मतलब यह है कि कई साल पहले, आप बायेसियन आंकड़ों पर काम करते थे, शायद आपने बहुत प्रतिस्पर्धी किराया बनाया था।

अब, मैं कहूंगा कि बायेसियन आँकड़े अभी भी एक प्लस है, लेकिन इसलिए बायेसियन विधियों का उपयोग किए बिना दिलचस्प समस्याओं पर काम कर रहा है। एक कमी बायेसियन सांख्यिकी में पृष्ठ भूमि का निश्चित रूप से सबसे अधिक काम पर रखने समितियों को एक शून्य से होगा, लेकिन बायेसियन तरीकों में पर्याप्त प्रशिक्षण के बिना आंकड़ों में पीएचडी कर बहुत आश्चर्य की बात होगी।

(2) बायेसियन सांख्यिकीविद अपने सीवी पर "बायेसियन" का उल्लेख करेंगे। फ़्रीवोलॉजर्स आमतौर पर अपने सीवी पर "फ़्रीक्वेंटिस्ट" नहीं डालते हैं, लेकिन आम तौर पर वे जिस क्षेत्र में काम करते हैं (यानी, उत्तरजीविता विश्लेषण, भविष्य कहनेवाला मॉडलिंग, पूर्वानुमान आदि)। एक उदाहरण के रूप में, मेरे बहुत सारे काम अनुकूलन एल्गोरिदम लिख रहे हैं, जो मुझे लगता है कि आप कहेंगे कि मेरा मतलब है कि मैं फ़्रीक्वेंटिस्ट काम करता हूं। मैंने बायेसियन एल्गोरिदम का एक अच्छा हिस्सा भी लिखा है, लेकिन यह निश्चित रूप से मेरे काम के अल्पसंख्यक में है। बायसेनियन आँकड़े मेरे सीवी पर हैं, फ़्रीक्वेंटिस्ट आँकड़े नहीं हैं।

(३) एक हद तक, आपने अपने प्रश्न में जो कहा है, वह सत्य भी है। फ्रिक्वेंटिस्ट दायरे की तुलना में कुशल सामान्य बायेसियन अभिकलन में अधिक खुली समस्याएं हैं। उदाहरण के लिए, हैमिल्टनियन मोंटे कार्लो हाल ही में बायेसियन मॉडल से उदारतापूर्वक नमूना लेने के लिए एक बहुत ही रोमांचक एल्गोरिथ्म बन गया है। सामान्य सुधार के लिए बहुत जगह नहीं हैइन दिनों अनुकूलन; न्यूटन रफसन, एल-बीएफजीएस और ईएम एल्गोरिदम बहुत सारे ठिकानों को कवर करते हैं। यदि आप इन तरीकों में सुधार करना चाहते हैं, तो आपको आम तौर पर समस्या के लिए बहुत कुछ करना होगा। इस प्रकार, आप "मैं उच्च-आयामी अधिकतम संभाव्यता अनुमान पर काम करने के बजाय" भू-स्थानिक मॉडल के उच्च-आयामी अनुकूलन पर काम करना पसंद करता हूं। मशीन सीखने की दुनिया इसका एक अपवाद है, क्योंकि नए स्टोचस्टिक अनुकूलन तरीकों (यानी, SGD, एडम, आदि) का पता लगाने में बहुत उत्साह है, लेकिन यह कुछ कारणों से थोड़ा अलग जानवर है।

इसी तरह, वहाँ मॉडल के लिए अच्छे पुजारियों के साथ आने पर काम किया जाना है। फ़्रीक्वेंटिस्ट तरीकों में इसके बराबर होता है (अच्छे दंड के साथ आने वाला, यानी, LASSO, glmnet) लेकिन दंड के लिए याजकों के लिए शायद अधिक उपजाऊ जमीन है।

(4) अंत में, और यह निश्चित रूप से एक व्यक्तिगत राय से अधिक है, बहुत से लोग फ़्रिक्वेंटिस्ट को पी-वैल्यू के साथ जोड़ते हैं। अन्य क्षेत्रों में देखे गए पी-मानों के सामान्य दुरुपयोग को देखते हुए, बहुत से सांख्यिकीविद् पी-मूल्यों के वर्तमान दुरुपयोग से जितना संभव हो सके दूरी तय करना पसंद करेंगे।


3
तो इसका उत्तर क्यों अधिक लोकप्रिय हो गया है (1) इसमें और अधिक लोकप्रिय हो गया है। उस पर हैरान, लेकिन मुझे लगता है कि यह सिर्फ कुछ रिकॉर्डिंग की जरूरत है।
निक कॉक्स

@NickCox: मेरी बात यह है कि है है और अधिक लोकप्रिय, लेकिन यह भी यह की लोकप्रियता कुछ हद तक अतिरंजित किया जा सकता है। यही है, ओपी ने देखा कि बेयरियन सांख्यिकी शीर्ष स्तरीय विश्वविद्यालयों के नमूने में लगभग हर प्रोफेसर के सीवी पर थी। लेकिन इसका मतलब यह नहीं है कि उन प्रोफेसरों में से प्रत्येक केवल बायेसियन आँकड़े करता है। (1) पर एक और बिंदु यह था कि मुझे लगता है कि एक समय था जब बेयसियन आँकड़े कर रहे थे क्योंकि आपका शोध क्षेत्र एक शीर्ष स्तरीय स्थिति प्राप्त करने के लिए बहुत महत्वपूर्ण था। मुझे यकीन नहीं है कि यह अब एक आवश्यकता के रूप में सख्त है, लेकिन आपके द्वारा देखे गए कई प्रोफेसरों को उस समय के दौरान काम पर रखा गया था।
क्लिफ एबी

ओह, मैं आपकी बात देख रहा हूं। मैं "क्या यह इसलिए है क्योंकि शास्त्रीय / लगातार आंकड़ों में उन्नति के लिए पर्याप्त जगह नहीं है?" और "ऐसा क्यों हो रहा है?"
क्लिफ एबी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.