सांख्यिकीय प्रक्रिया नियंत्रण के लिए बायेसियन आँकड़े अधिक लोकप्रिय क्यों नहीं हैं?


18

बार-बार होने वाली बहस के बारे में मेरी समझ यह है कि लगातार आंकड़े:

  • (या होने का दावा) उद्देश्य है
  • या कम से कम निष्पक्ष
  • इसलिए विभिन्न शोधकर्ताओं, विभिन्न मान्यताओं का उपयोग करके अभी भी मात्रात्मक रूप से तुलनीय परिणाम प्राप्त कर सकते हैं

जबकि बायेसियन आँकड़े

  • "बेहतर" भविष्यवाणियां करने का दावा (यानी कम अपेक्षित नुकसान), क्योंकि यह पूर्व ज्ञान (अन्य कारणों के अलावा) का उपयोग कर सकता है
  • कम "तदर्थ" विकल्पों की आवश्यकता है, उन्हें पहले / मॉडल विकल्पों द्वारा प्रतिस्थापित करना जो (कम से कम सिद्धांत रूप में) एक वास्तविक दुनिया की व्याख्या है।

यह देखते हुए, मुझे उम्मीद है कि एसपीसी में बायेसियन आँकड़े बहुत लोकप्रिय होंगे: यदि मैं अपनी प्रक्रिया की गुणवत्ता को नियंत्रित करने के लिए एक कारखाना मालिक था, तो मैं मुख्य रूप से अपेक्षित नुकसान की परवाह करूंगा; अगर मैं इसे कम कर सकता हूं, क्योंकि मुझे अपने प्रतिद्वंद्वियों की तुलना में अधिक / बेहतर पूर्व ज्ञान है, और भी बेहतर।

लेकिन व्यावहारिक रूप से एसपीसी के बारे में मैंने जो कुछ भी पढ़ा है वह दृढ़ता से लगातार प्रतीत होता है (यानी कोई पूर्व वितरण नहीं, सभी मापदंडों का बिंदु अनुमान, नमूना आकार, पी-मान आदि के बारे में कई तदर्थ विकल्प)

ऐसा क्यों है? मैं देख सकता हूं कि 1960 के दशक में, जब एसपीसी कलम और कागज का उपयोग करके किया गया था, तब लगातार आंकड़े क्यों एक बेहतर विकल्प थे। लेकिन तब से किसी ने विभिन्न तरीकों की कोशिश क्यों नहीं की?


2
मुझे लगता है कि बेइज़ियन आँकड़े मेरे डिजिटल एसएलपी कैमरे के रूप में हैं जबकि अक्सर iPhone कैमरा के रूप में। मैंने दोनों को कभी-कभी खरीदा लेकिन मैं DSLR कम 5% तस्वीरों का इस्तेमाल करता हूं जबकि फोन 95% बाकी है। क्योंकि यह आसान, आसान और पॉकेट में है और कई बार गुणवत्ता के अनुसार प्रदान करता है (मेरे DSLR कौशल के आधार पर)। बस पुजारियों को शामिल करने और घास में चेन चलाने की तरह मुझे एपर्चर खोलने की अवधि, लंबाई और अन्य मापदंडों का इष्टतम संतुलन खोजने की आवश्यकता है। लोकप्रिय का Iphone अंत।
राम शर्मा

@ रामशर्मा आपको उत्तर के रूप में पोस्ट करना चाहिए! मुझे यह मेरे शेफ चाकू की उपमा से बेहतर लगता है।
छायाकार

जवाबों:


18

चेतावनी मैंने यह जवाब बहुत पहले लिखा था कि बहुत कम विचार के साथ मैं किस बारे में बात कर रहा था। मैं इसे हटा नहीं सकता क्योंकि इसे स्वीकार कर लिया गया है, लेकिन मैं अधिकांश सामग्री के पीछे नहीं रह सकता।


यह एक बहुत लंबा जवाब है और मुझे उम्मीद है कि यह किसी तरह से मददगार होगा। एसपीसी मेरा क्षेत्र नहीं है, लेकिन मुझे लगता है कि ये टिप्पणियां सामान्य हैं कि वे यहां लागू होते हैं।

मेरा तर्क है कि सबसे अधिक बार-उद्धृत लाभ - पूर्व मान्यताओं को शामिल करने की क्षमता - एक कमजोर लाभ लागू / अनुभवजन्य क्षेत्र है। ऐसा इसलिए है क्योंकि आपको अपने पूर्व की मात्रा निर्धारित करने की आवश्यकता है । यहां तक ​​कि अगर मैं कह सकता हूं "अच्छी तरह से, स्तर z निश्चित रूप से प्रशंसनीय है," मैं मेरे जीवन के लिए नहीं बता सकता कि आपको z के नीचे क्या होना चाहिए। जब तक लेखक अपने कच्चे डेटा को ड्रम में प्रकाशित करना शुरू नहीं करते हैं, तब तक पुजारियों के लिए मेरा सबसे अच्छा अनुमान पिछले काम से लिए गए सशर्त क्षण हैं जो आपके द्वारा सामना की जा रही परिस्थितियों के समान परिस्थितियों में फिट हो सकते हैं या नहीं भी हो सकते हैं।

मूल रूप से, बायेसियन तकनीक (कम से कम एक वैचारिक स्तर पर) उत्कृष्ट हैं जब आपके पास एक मजबूत धारणा / विचार / मॉडल है और इसे डेटा पर ले जाना चाहते हैं, तो देखें कि आप गलत या गलत नहीं हैं। लेकिन अक्सर आप यह देखना नहीं चाहते हैं कि क्या आप अपनी व्यावसायिक प्रक्रिया के लिए किसी विशेष मॉडल के बारे में सही हैं; अधिक संभावना है कि आपके पास नहीं हैमॉडल, और यह देखने के लिए देख रहे हैं कि आपकी प्रक्रिया क्या करने जा रही है। आप अपने निष्कर्षों को चारों ओर नहीं धकेलना चाहते हैं, आप चाहते हैं कि आपका डेटा आपके निष्कर्षों को आगे बढ़ाए। यदि आपके पास पर्याप्त डेटा है, तो वैसे भी क्या होगा, लेकिन उस स्थिति में पहले से परेशान क्यों? शायद यह बहुत संदेहजनक और जोखिम से भरा है, लेकिन मैंने एक आशावादी व्यवसायी के बारे में कभी नहीं सुना है जो सफल भी था। अपनी खुद की मान्यताओं के बारे में अपनी अनिश्चितता को निर्धारित करने का कोई तरीका नहीं है, और आप इसके बजाय गलत चीज़ में अति आत्मविश्वास होने का जोखिम नहीं उठाएंगे । तो आप एक पूर्व सूचनात्मक सेट करते हैं और लाभ गायब हो जाता है।

यह एसपीसी मामले में दिलचस्प है क्योंकि इसके विपरीत, डिजिटल मार्केटिंग, आपकी व्यावसायिक प्रक्रियाएं हमेशा अप्रत्याशित स्थिति में नहीं होती हैं । मेरी धारणा है कि व्यावसायिक प्रक्रियाएँ जानबूझकर और वृद्धिशील रूप से बदल जाती हैं। यही है, आपके पास अच्छा, सुरक्षित पुजारी बनाने के लिए एक लंबा समय है। लेकिन याद रखें कि पुजारी अनिश्चितता के प्रसार के बारे में हैं। एक तरफ विषय के रूप में, बायेसियनवाद का यह लाभ है कि यह गहराई से नेस्टेड डेटा बनाने वाली प्रक्रियाओं में अनिश्चितता का प्रचार करता है। यह, मेरे लिए, वास्तव में क्या बायेसियन आँकड़े अच्छे हैं। और यदि आप अपनी प्रक्रिया की विश्वसनीयता के लिए अच्छी तरह से 1-इन-20 "महत्व" कटऑफ से परे की तलाश कर रहे हैं, तो ऐसा लगता है कि आप जितना संभव हो उतनी अनिश्चितता के लिए जिम्मेदार होंगे।

तो बायेसियन मॉडल कहां हैं? सबसे पहले, उन्हें लागू करना कठिन है। इसे स्पष्ट रूप से कहने के लिए, मैं ओएलएस को एक मैकेनिकल इंजीनियर को 15 मिनट में सिखा सकता हूं और उसे दूसरे 5 में मतलाब में रजिस्ट्रियों और टी-टेस्टों को क्रैंक करने के लिए है। बेयस का उपयोग करने के लिए, मुझे सबसे पहले यह तय करने की आवश्यकता है कि मैं किस तरह का मॉडल फिट कर रहा हूं, और फिर देखें कि क्या मेरी कंपनी में किसी भाषा में इसके लिए तैयार पुस्तकालय है, जो मेरी कंपनी के किसी जानकार को पता है। यदि नहीं, तो मुझे BUGS या Stan का उपयोग करना होगा। और फिर मुझे एक मूल उत्तर प्राप्त करने के लिए सिमुलेशन चलाना होगा, और 8-कोर i7 मशीन पर लगभग 15 मिनट लगते हैं। रैपिड प्रोटोटाइप के लिए बहुत कुछ। और दूसरा, जब तक आपको उत्तर नहीं मिल जाता है, तब तक आपने दो घंटे की कोडिंग और प्रतीक्षा में बिताया है, केवल उसी परिणाम को प्राप्त करने के लिए जैसा कि आप लगातार मानक त्रुटियों के साथ लगातार यादृच्छिक प्रभावों के साथ कर सकते हैं। हो सकता है कि यह सब गलत और गलत हो और मैं एसपीसी को बिल्कुल नहीं समझता।

मैं बेइज़ियनवाद को बहुत ही उच्च गुणवत्ता वाले शेफ चाकू, एक स्टॉकपॉट और एक सॉटी पैन से पसंद करता हूं; बार -बार ऐश-सीन-ऑन-टीवी टूल्स से भरे किचन की तरह है केले के स्लाइसर्स और आसान ड्रेनिंग के लिए ढक्कन में छेद वाले पास्ता पॉट्स । यदि आप रसोई में बहुत सारे अनुभव के साथ एक अभ्यास कर रहे हैं - वास्तव में, अपने स्वयं के रसोई घर में, जो साफ और व्यवस्थित है और आपको पता है कि सब कुछ कहाँ स्थित है - आप अपने छोटे से चयन के साथ अद्भुत चीजें कर सकते हैं सुरुचिपूर्ण, उच्च गुणवत्ता वाले उपकरण। या, आप विभिन्न छोटे एड-हॉक * टूल्स का एक गुच्छा उपयोग कर सकते हैं, जिन्हें उपयोग करने के लिए शून्य कौशल की आवश्यकता होती है, एक भोजन बनाने के लिए जो वास्तव में आधा खराब नहीं होता है, और इसमें कुछ बुनियादी स्वाद होते हैं जो बिंदु को प्राप्त करते हैं। आपको सिर्फ डेटा खानों से घर मिला और आप परिणामों के भूखे हैं; आप कौन से कुक हैं?

* बेज़ सिर्फ तदर्थ के रूप में है, लेकिन कम पारदर्शी रूप से ऐसा है। आपके cou au vin में कितनी शराब जाती है? कोई विचार नहीं है, क्योंकि आप एक समर्थक हैं, आप इसे नेत्रगोलक करते हैं। या, आप पिनोट ग्रिगियो और पिनोट नोयर के बीच का अंतर नहीं बता सकते हैं, लेकिन एपिक्यूरियस की पहली रेसिपी में 2 कप लाल का उपयोग करने के लिए कहा गया है ताकि आप क्या करने जा रहे हैं। कौन सा "एड-हॉक" अधिक है?


1
+1, बढ़िया जवाब। मैं उत्सुक हूं: क्या आप छोटे / अनुकूली नमूना आकारों के बारे में एक पैराग्राफ जोड़ सकते हैं? एसपीसी में, 3-5 के नमूने आकार सामान्य लगते हैं। और अगर एसपीसी सॉफ्टवेयर 2 नमूनों के बाद तकनीशियन को बता सकता है कि क्या उसे वास्तव में 3 और नमूनों की आवश्यकता है या नहीं, तो यह एक बड़ी विशेषता होगी। एक बायेसियन मॉडल के साथ, यह लगभग एक दिमाग नहीं है: माप के लिए एक लागत को परिभाषित करें, झूठी सकारात्मक और -गर्मियों, फिर एक और माप लेने बनाम रोकने की अपेक्षित लागत का अनुमान लगाएं। अक्सर आंकड़ों में, आपको अजीब रोक नियम प्रभावों से निपटना होगा (क्या आप उन्हें 15 मिनट में एक एमई को सिखा सकते हैं?)
nikie

1
नमूना आकार के लिए, समस्या, और मैंने इसका उल्लेख किया होता अगर मुझे पता था कि नमूने छोटे थे, तो यह है कि बहुत कम टिप्पणियों के साथ आपके अनुमान पूर्व की आपकी पसंद के प्रति बहुत संवेदनशील होंगे । आप पत्थर से खून नहीं निकाल सकते हैं, इसलिए यह एक व्यापार बंद है: या तो आप लगातार एक अनुमान लगाने वाले अनुमानक के साथ ओवरफिट करते हैं, लेकिन कुछ मान्यताओं के साथ ऐसा करते हैं, या आप अपने खुद के ज्ञान (या इसके अभाव) को पर्याप्त रूप से अस्पष्ट पूर्व में शामिल करते हैं अनिवार्य रूप से आपके सामने मौजूद डेटा और आपके सिर में मौजूद "डेटा" दोनों के लिए उपयुक्त है । आपको अपने सिर से पहले एक समान रखने की अनुमति है।
छायाकार

1
असल में, बेयस अपने दिमाग को शुरुआत में इस्तेमाल करने के लिए विश्लेषक पर अधिक बोझ डालता है। मुझे व्यक्तिगत रूप से लगता है कि पादरियों को स्थापित करने के विचार से एक संकेत है कि आप या तो a) बहुत आलसी हैं, या b) वास्तव में यह नहीं समझते कि आंकड़े कैसे काम करते हैं (यह एक को जानने के लिए एक लेता है, आदि)। मैंने कहा कि मेरे उत्तर में पुरोहितों को आंकना कठिन था; मैं वास्तव में व्यवहार में इससे सहमत नहीं हूं। एक चीज जो आप हमेशा कर सकते हैं, वह एक पृष्ठ पर एक घंटी वक्र है, और अपने आप से पूछें "क्या मैं अपने डेटा को इस तरह देखने की उम्मीद करूंगा?" यदि नहीं, तो वक्र को मोड़ना शुरू करें। और अगर आप तय नहीं कर सकते हैं कि मोड को कहाँ रखा जाए, तो हाइपरपायर का उपयोग करें।
छायाकार

2
एक सवाल (ब्रेट्टी होने का मतलब नहीं): क्या आप जानते हैं कि पूर्व मान्यताओं को सही (मात्रात्मक) पर एक साहित्य है? जिसमें प्रकाशित मान्यताएं, साक्षात्कार विशेषज्ञ और गैर-विशेषज्ञ विश्वास और आत्म-विश्वास शामिल हैं। मेरे द्वारा पूछे जाने का कारण यह है कि मैंने इस शिकायत को पहले भी सुना है, लेकिन इस तरह की शिकायतों के लेखकों ने सोचा कि उनकी आपत्ति चर्चा का अंत है, बजाय एक जांच की शुरुआत के।
एलेक्सिस

1
@CliffAB दिलचस्प ... मैंने उस साहित्य को गहराई से नहीं पढ़ा है (बर्नार्डो, कास, गर्थवेट ... कई दशकों पहले से) ... लेकिन यह आपके लिए मूल्य-विज्ञान है: अलग-अलग पूर्व धारणाएं सूचित करती हैं कि क्या कोई व्यक्ति लगातार या बायेसियन तरीकों को पसंद करता है। ;)
एलेक्सिस

5

मेरी विनम्र राय में, बायेसियन आँकड़े कुछ कमियों से ग्रस्त हैं जो इसके व्यापक उपयोग (एसपीसी में लेकिन अन्य अनुसंधान क्षेत्रों में भी) के साथ संघर्ष करते हैं:

  1. अनुमानों को प्राप्त करना अधिक कठिन है। इसके लगातार प्रतिपक्ष (आंकड़ों पर कक्षाओं का सबसे व्यापक भाग अक्सरवादी दृष्टिकोण को अपनाते हैं। वैसे, यह जांच करना दिलचस्प होगा कि क्या यह बायेसियन आंकड़ों की सीमित लोकप्रियता का कारण या प्रभाव है। )।

  2. बहुत बार बेयसियन आँकड़े एक ही समस्या से निपटने के विभिन्न तरीकों के बारे में विकल्प लगाते हैं (जैसे, जो सबसे अच्छा पूर्व है?), न केवल क्लिक-एंड-सी (वैसे भी, इस दृष्टिकोण को लगातार ढांचे के तहत प्रोत्साहित नहीं किया जाना चाहिए, या तो)।

  3. बेज़ियन सांख्यिकी में कुछ विषय हैं जिन्हें बहुत अनुभवी सांख्यिकीविदों (जैसे, अनुचित पुजारी ) से कम प्रबंधन करना मुश्किल है ;

  4. इसके लिए संवेदनशीलता विश्लेषण की आवश्यकता होती है (आमतौर पर अक्सरवादी ढांचे के तहत बचा जाता है), और कुछ विषयों के लिए किए गए अपवाद, जैसे कि लापता डेटा विश्लेषण।

  5. इसमें गणना के लिए केवल एक (प्रशंसनीय, मुफ्त डाउनलोड करने योग्य) सॉफ्टवेयर उपलब्ध है।

  6. यह अधिक समय लगता है frequentist उपकरणों के साथ तुलना में बायेसियन के साथ एक स्वायत्त शोधकर्ता किया जाना है।


6
अच्छा जवाब है, लेकिन मैं बिंदु 5 से असहमत हूं: मैं बेयसियन विश्लेषण के लिए कई अलग-अलग (नि: शुल्क) सॉफ़्टवेयर के बारे में सोच सकता हूं: WinBUGS, OpenBUGS, JAGS, स्टेन, PyMC ... और मुझे यकीन है कि और भी हैं। मैं क्या कहूंगा कि इन सभी सॉफ्टवेयरों में एक महत्वपूर्ण सीखने की अवस्था है और इसके लिए एक उचित मात्रा में प्रोग्रामिंग और सांख्यिकीय ज्ञान की आवश्यकता होती है।

COOLSerdash सही है और मैं स्पष्टीकरण और टिप्पणी दोनों का स्वागत करता हूं। बायेसियन विश्लेषण सॉफ्टवेयर्स को सूचीबद्ध करने में मेरी समझ की कमी शायद केवल विनबग्स के साथ मेरी (ढीली) परिचितता से प्रेरित थी।
कार्लो लेज़ारो

@CarloLazzaro मैं # 5 के बारे में COOLSerdash की बात से सहमत हूं, यह भी: 14 संस्करण के रूप में, निजी लाइसेंस प्राप्त अभी तक मुख्यधारा के आँकड़े पैकेज स्टैटा में बेएजियन मॉडल और अनुमान को वेनिला पैकेज में शामिल किया गया है। मुझे लगता है कि बायेसियन कम्प्यूटेशनल उपलब्धता केवल बढ़ेगी। लेकिन आपके अन्य बिंदु महत्वपूर्ण हैं, और बेयसियन समर्थकों के लिए एजेंडा को सूचित करने में मदद करनी चाहिए।
एलेक्सिस

@ एलेक्सिस: स्टाटा उपयोगकर्ता होने के नाते मैं इसके हालिया बायेसियन स्वाद से खुश हूं। एक अधिक सामान्य विचार के रूप में, मैं विश्वविद्यालय में सांख्यिकीय कक्षाओं के दौरान लगातार और बायेसियन दोनों दृष्टिकोणों को सीखना सीखूंगा (शायद संभावनावादी बड़बड़ाना शुरू करते हैं !!)।
कार्लो लाजारो

3

एक कारण यह है कि बायेसियन आँकड़े 1990 तक मुख्यधारा से बाहर हो गए थे। जब मैं 1970 के दशक में आँकड़ों का अध्ययन कर रहा था तो यह लगभग विधर्मी था (हर जगह नहीं, बल्कि अधिकांश स्नातक कार्यक्रमों में)। यह मदद नहीं करता था कि अधिकांश दिलचस्प समस्याएं अचूक थीं। नतीजतन, लगभग हर कोई जो आज आंकड़े सिखा रहा है (और पत्रिकाओं के लिए लेखों की समीक्षा कर रहा है, और पाठ्यक्रम को डिजाइन करना) को एक निरंतरवादी के रूप में प्रशिक्षित किया जाता है। मार्कोव चेन मोंटे कार्लो (MCMC) के तरीकों को लोकप्रिय बनाने के साथ 1990 के आसपास चीजें बदलने लगीं, जो धीरे-धीरे एसएएस और स्टाटा जैसे पैकेजों में अपना रास्ता तलाश रही हैं। व्यक्तिगत रूप से मुझे लगता है कि वे 10 वर्षों में बहुत अधिक सामान्य होंगे, हालांकि विशेष अनुप्रयोगों (एसपीसी) में उन्हें बहुत अधिक फायदा नहीं हो सकता है।

एक समूह जो वोकिंग कर रहा है, बायेसियन विश्लेषण को अधिक व्यापक रूप से उपलब्ध है, वह समूह है जो STAN पैकेज (mc-stan.org) को विकसित कर रहा है।


हमारी साइट पर आपका स्वागत है! बस ध्यान दें कि यह "STATA" के बजाय "स्टाटा" है - मैं स्टाटा उपयोगकर्ताओं के गलत अंत पर रहा हूं जब मैंने इसे स्वयं कैपिटल किया है! (मुझे लगा कि यह एसएएस, एसपीएसएस आदि की तरह था, लेकिन स्पष्ट रूप से नहीं ...)
सिल्वरफ़िश
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.