क्या मुझे पहले बायेसियन या लगातार आंकड़ों को पढ़ाना चाहिए?


32

मैं अपने लड़कों की मदद कर रहा हूं, वर्तमान में हाई स्कूल में है, आंकड़ों को समझ रहा हूं, और मैं कुछ सरल उदाहरणों के साथ शुरुआत कर रहा हूं, जो कुछ झलकियों को सिद्धांत की उपेक्षा किए बिना।

मेरा लक्ष्य उन्हें खरोंच से आंकड़े सीखने के लिए सबसे सहज रूप से अभी तक रचनात्मक रचनात्मक दृष्टिकोण देना होगा, ताकि आगे के आंकड़ों और मात्रात्मक सीखने में उनकी रुचि को प्रोत्साहित किया जा सके।

शुरुआत से पहले, हालांकि, मेरे पास बहुत सामान्य निहितार्थ के साथ एक विशेष प्रश्न है:

क्या हमें बायेसियन या अक्सरवादी ढांचे का उपयोग करके आंकड़े पढ़ाना शुरू करना चाहिए?

आस-पास के शोधों में मैंने देखा है कि एक आम दृष्टिकोण बायिसियन सांख्यिकी (जैसे स्टैंगल ) की गहन चर्चा के बाद लगातार आंकड़ों पर संक्षिप्त परिचय के साथ शुरुआत कर रहा है ।


5
बिना अधिक संदर्भ के आपके प्रश्न का उत्तर देना मुश्किल है। वह क्या है जिसे आप प्राप्त करना चाहते हैं?
Glen_b -Reinstate मोनिका

4
बच्चों को बायेसियन स्टैट्स सिखाना बुरा है, उन्हें वोदका डालना या सिगार जलाना। ध्यान दें कि वोदका और सिगार दोनों वयस्कों के लिए ठीक हैं, जब तक वे उन्हें अपने दम पर नहीं खोजते हैं
अक्षल

2
@ अक्षल मैं वास्तव में वोदका की चुस्की लेते हुए और हवन करते हुए उन्हें बेयस प्रमेय सिखाने की योजना बना रहा था ... ;-)
जो_ 31४

2
यह एक अच्छा तरीका है कि कुछ वर्षों के लिए बच्चे को बायेसियन आंकड़ों से दूर रखा जाए। आप उन्हें बताएं कि सिर्फ बेयस प्रमेय अनुप्रयोग है। प्रमेय लगातार आंकड़ों में ठीक काम करता है
अक्षल

5
नैट सिल्वर की पुस्तक "द सिग्नल एंड द नॉइज़" युवा लोगों को बायेसियन सांख्यिकी सिखाने के लिए एक मामला बनाती है।
लॉयड क्रिसमस

जवाबों:


25

बायेसियन सांख्यिकी और लगातार आंकड़े दोनों संभावना सिद्धांत पर आधारित हैं, लेकिन मैं कहूंगा कि पूर्व शुरू से सिद्धांत पर अधिक निर्भर करता है। दूसरी ओर, निश्चित रूप से एक विश्वसनीय अंतराल की अवधारणा आत्मविश्वास अंतराल की तुलना में अधिक सहज है, एक बार छात्र को संभावना की अवधारणा की अच्छी समझ है। इसलिए, जो कुछ भी आप चुनते हैं, मैं सबसे पहले उन सभी संभावनाओं की संभावना को मजबूत करने की वकालत करता हूं, जो उन सभी उदाहरणों के साथ पासा, कार्ड, रूलेट, मोंटी हॉल विरोधाभास, आदि पर आधारित हैं।

मैं विशुद्ध रूप से उपयोगितावादी दृष्टिकोण के आधार पर एक दृष्टिकोण या दूसरे को चुनूंगा: क्या वे स्कूल में बार-बार अध्ययन करने वाले या बायेसियन सांख्यिकी का अध्ययन करने की अधिक संभावना रखते हैं? मेरे देश में, वे निश्चित रूप से पहले (और अंत में: अक्सर हाई स्कूल के छात्रों को बेयसियन स्टैटिक्स पढ़ाए जाने के बारे में नहीं सुनते हैं, एकमात्र मौका या तो विश्वविद्यालय में या उसके बाद, स्व-अध्ययन द्वारा होता है)। शायद आप में यह अलग है। ध्यान रखें कि यदि उन्हें एनएचएसटी (नल हाइपोथिसिस सिग्नेचर टेस्टिंग) से निपटने की आवश्यकता है, तो यह स्वाभाविक रूप से लगातार आंकड़ों, आईएमओ के संदर्भ में उत्पन्न होता है। बेशक आप बाइसेपियन फ्रेमवर्क में भी परिकल्पना का परीक्षण कर सकते हैं, लेकिन कई प्रमुख बायेसियन सांख्यिकीविद् हैं जो एनएचएसटी का उपयोग करने की वकालत नहीं करते हैं, या तो लगातार या बायसीयन ढांचे के तहत (उदाहरण के लिए, कोलंबिया विश्वविद्यालय के एंड्रयू जेलमैन)।

अंत में, मुझे आपके देश में हाई स्कूल के छात्रों के स्तर के बारे में पता नहीं है, लेकिन खदान में एक छात्र के लिए एक ही समय में सफलतापूर्वक (सिद्धांत) की संभावना सिद्धांत और अभिन्न कलन को सफलतापूर्वक आत्मसात करना मुश्किल होगा। इसलिए, यदि आप बायेसियन आंकड़ों के साथ जाने का फैसला करते हैं, तो मैं वास्तव में निरंतर यादृच्छिक चर मामले से बचूंगा, और यादृच्छिक चर असतत करने के लिए छड़ी करूंगा।


2
मुझे आभास हो रहा था (उनके ब्लॉग को पढ़ने से) कि एंड्रयू गेलमैन बार-बार एनएसएचटी के खिलाफ उतना ही पक्षपात करेगा जितना कि बायेसियन के खिलाफ।
साकार

2
@ अप्सरा हाँ, ज़रूर - मैंने कभी इसके विपरीत नहीं कहा।
डेल्टावी

3
"मेरे देश में, वे निश्चित रूप से सबसे पहले बार-बार होने वाले ढांचे को सीखेंगे" - यह (या पूरी तरह से बाइसियनवाद की चर्चा को छोड़ना) दुनिया भर में पारंपरिक दृष्टिकोण है।
कोडियालॉजिस्ट

1
@Kodiologist मुझे जितना संदेह था। कम से कम, कुछ शैक्षणिक प्रणालियां हो सकती हैं, जहां लगातार ढांचे के बाद, हाई स्कूल में बायेसियन एक भी शुरू किया जाता है। लेकिन यहां ऐसा नहीं है।
डेल्टा ३

22

बायेसियन और अक्सरवादी विभिन्न प्रश्न पूछते हैं। बेयसियन पूछते हैं कि प्रेक्षित डेटा को देखते हुए कौन से पैरामीटर मान विश्वसनीय हैं। बार-बार काल्पनिक काल्पनिक डेटा की संभावना के बारे में पूछता है यदि कुछ काल्पनिक पैरामीटर मान सत्य थे। बार-बार के फैसले त्रुटियों को नियंत्रित करने से प्रेरित होते हैं, बायेसियन के फैसले मॉडल विवरण में अनिश्चितता से प्रेरित होते हैं।

तो आपको पहले कौन सा सिखाना चाहिए? ठीक है, अगर उन सवालों में से एक या दूसरा जो आप पहले पूछना चाहते हैं, वही आपका जवाब है। लेकिन दृष्टिकोण और शिक्षाशास्त्र के संदर्भ में, मुझे लगता है कि बायेसियन को समझना बहुत आसान है और कहीं अधिक सहज है। बेयसियन विश्लेषण का मूल विचार संभावनाओं के पार विश्वसनीयता का पुन: आवंटन है, जैसे कि शर्लक होम्स ने प्रसिद्ध रूप से कहा, और जिसे लाखों पाठकों ने सहज रूप से समझा है। लेकिन निरंतरवादी विश्लेषण का मूल विचार बहुत ही चुनौतीपूर्ण है: डेटा के सभी संभावित सेटों का स्थान, जो किसी विशेष परिकल्पना के सही होने पर हुआ हो सकता है, और उन काल्पनिक डेटा सेटों के अनुपात में सारांश की तुलना में सारांश या अधिक चरम है। सांख्यिकीय जो वास्तव में मनाया गया था।

बायेसियन विचारों के बारे में एक मुक्त परिचयात्मक अध्याय यहाँ है । एक लेख जो लगातार और बायेसियन अवधारणाओं को एक साथ रखता है, यहां है । लेख अक्सरवादी और बेयसियन की परिकल्पना परीक्षण और अनुमान (और अन्य बहुत सारे सामान) के दृष्टिकोण के बारे में बताता है। परिदृश्य का दृश्य प्राप्त करने की कोशिश करने वाले शुरुआती लोगों के लिए लेख का ढांचा विशेष रूप से उपयोगी हो सकता है।


यदि भविष्य में लिंक मृत हो जाते हैं, तो अध्याय के शीर्षक और लेख शामिल करना सहायक हो सकता है।
रिचर्ड हार्डी

8

यह सवाल राय-आधारित होने का जोखिम है, इसलिए मैं अपनी राय के साथ वास्तव में संक्षिप्त होने की कोशिश करूंगा, फिर आपको एक पुस्तक का सुझाव दूंगा। कभी-कभी यह एक विशेष दृष्टिकोण लेने के लायक होता है क्योंकि यह वह दृष्टिकोण है जो एक विशेष रूप से अच्छी पुस्तक लेता है।

मैं इस बात से सहमत हूँ कि बायेसियन आँकड़े अधिक सहज हैं। कॉन्फिडेंस इंटरवल बनाम क्रेडिबल इंटरवल डिस्टिंक्शन बहुत ज्यादा मायने रखता है: लोग स्वाभाविक रूप से कॉन्फिडेंस इंटरवल अप्रोच के बजाय "क्या मौका है ..." के संदर्भ में सोचते हैं। कॉन्फिडेंस इंटरवल अप्रोच बहुत कुछ ऐसा लगता है जैसे यह वही बात कह रहा है जो कि विश्वसनीय इंटरवल के अलावा सामान्य सिद्धांत पर है जो आप अंतिम चरण "95% समय" से "95% मौका" तक नहीं ले सकते, जो बहुत बार-बार लगता है लेकिन आप यह नहीं कर सकते। यह असंगत नहीं है, बस सहज नहीं है।

इस बात को संतुलित करना कि ज्यादातर कॉलेज पाठ्यक्रम जो वे लेंगे, वे कम सहज ज्ञान युक्त दृष्टिकोण का उपयोग करेंगे।

कहा कि मुझे वास्तव में रिचर्ड मैकलारेथ द्वारा आर एंड स्टेन में उदाहरणों के साथ सांख्यिकीय रीथिंकिंग: ए बायेसियन कोर्स पुस्तक पसंद है । यह सस्ता नहीं है, इसलिए कृपया इसके बारे में पढ़ें और खरीदने से पहले अमेज़ॅन पर इसके चारों ओर प्रहार करें। मुझे यह एक विशेष रूप से सहज दृष्टिकोण लगता है जो बेयसियन दृष्टिकोण का लाभ उठाता है, और बहुत हाथों से है। (और चूंकि आर और स्टेन बायेसियन आंकड़ों के लिए उत्कृष्ट उपकरण हैं और वे स्वतंत्र हैं, यह व्यावहारिक शिक्षा है।)

संपादित करें: टिप्पणियों के एक जोड़े ने उल्लेख किया है कि पुस्तक शायद एक उच्च शिक्षक से परे है, यहां तक ​​कि एक अनुभवी ट्यूटर के साथ भी । इसलिए मुझे एक और बड़ा कैवेट रखना होगा: इसकी शुरुआत में एक सरल तरीका है, लेकिन जल्दी से रैंप। यह एक अद्भुत पुस्तक है, लेकिन आप वास्तव में, अमेज़ॅन पर अपनी प्रारंभिक मान्यताओं के लिए एक महसूस करने के लिए और कितनी जल्दी इसे रैंप पर लाने के लिए इसके माध्यम से प्रहार करना होगा। सुंदर उपमाएं, आर में शानदार काम, अविश्वसनीय प्रवाह और संगठन, लेकिन शायद आपके लिए उपयोगी नहीं है।

यह प्रोग्रामिंग और आर (मुक्त सांख्यिकीय पैकेज) के बुनियादी ज्ञान, और संभाव्यता और आंकड़ों की मूल बातें के लिए कुछ जोखिम मानता है। यह यादृच्छिक-अभिगम नहीं है और प्रत्येक अध्याय पूर्व अध्यायों पर बनाता है। यह बहुत सरल शुरू होता है, हालांकि कठिनाई मध्य में रैंप करती है - यह बहु-स्तरीय प्रतिगमन पर समाप्त होती है। तो आप इसे अमेज़ॅन पर कुछ पूर्वावलोकन करना चाह सकते हैं, और यह तय कर सकते हैं कि क्या आप आसानी से मूल बातें कवर कर सकते हैं या यदि यह सड़क से थोड़ा नीचे कूदता है।

EDIT 2: यहां मेरे योगदान की निचली रेखा और इसे शुद्ध राय से बदलने का प्रयास है, एक अच्छी पाठ्यपुस्तक यह तय कर सकती है कि आप किस दृष्टिकोण को अपनाते हैं। मैं एक बायेसियन दृष्टिकोण पसंद करता हूं, और यह पुस्तक अच्छी तरह से करती है, लेकिन शायद बहुत तेज गति से।


2
McElreath की पुस्तक उत्कृष्ट है, लेकिन मैं वास्तव में आश्चर्यचकित रहूंगा यदि हाई स्कूल के छात्र एक प्रतिभाशाली ट्यूटर के साथ भी उपचार के उस स्तर का पालन करने में सक्षम होंगे।
डेल्टावी

2
@ डेल्टिव: अच्छा फीडबैक, मैं अपना उत्तर संपादित करूँगा। मुझे कई बार मूर्ख बनाया गया है कि शुरुआत में यह कितना पठनीय और अनुरूप है। यह लगभग आधे रास्ते में खड़ी सीखने की अवस्था में प्रवेश करता है , और शायद उससे बहुत पहले।
वेन

1
एक और ध्यान दें: मुझे लगता है कि बेयसियन विधियों के बारंबारतावादी तरीकों में फंडामेंटल (यानी, प्रायिकता सिद्धांत) और अनुप्रयोग के बीच एक बड़ा अंतर है। यही है, मुझे स्नातक स्तर की पढ़ाई के बिना, MLE सिद्धांत, CLT के प्रमाण आदि को समझने में किसी की कल्पना करने में परेशानी होती है, जो कि फ्रीक्वेंटिस्ट प्रक्रियाओं के लिए भी सबसे बुनियादी है। एक बार जब आप सशर्त संभाव्यता को जान लेते हैं, तो आप मूल रूप से समझते हैं कि बायेसियन इंजेक्शन कैसे काम करता है। MCMC सिद्धांत थोड़ा मुश्किल है, लेकिन वास्तव में MLE सिद्धांत को समझने की तुलना में ईमानदारी से बहुत सरल है ...
क्लिफ एबी

... और चूंकि बायेसियन फ्रेमवर्क में संभाव्यता और आंकड़ों के अनुप्रयोग के बीच की खाई को पाटना आसान है, इसलिए कम से कम, मुझे लगता है कि इससे चीजें अधिक मानसिक रूप से संतुष्ट होती हैं। मुझे उन पाठ्यक्रमों से टीए-आईएनजी से नफरत है जहां हमें "" और हमें विश्वास करना चाहिए, एमएलई सिद्धांत बड़े नमूनों के साथ काम करता है ", जैसा कि मैंने महसूस किया कि किसी की वैज्ञानिक जिज्ञासा को मारना था, या बहुत बड़ी मानसिक प्रतिबद्धता की आवश्यकता थी।
एबी एबी

... लेकिन एमएलई के पीछे अंतर्ज्ञान स्वाभाविक रूप से पर्याप्त है ... आंकड़े
kjetil b halvorsen

5

मुझे सबसे पहले बार-बार दृष्टिकोण सिखाया गया, फिर बायेसियन। मैं एक पेशेवर सांख्यिकीविद् नहीं हूं।

मुझे स्वीकार करना होगा कि मुझे बायसी दृष्टिकोण के बारे में निर्णायक रूप से उपयोगी होने के लिए लगातार दृष्टिकोण के अपने पूर्व ज्ञान नहीं मिला।

मैं यह कहने की हिम्मत करूंगा कि यह इस बात पर निर्भर करता है कि आप अपने विद्यार्थियों को किन ठोस अनुप्रयोगों के साथ दिखा रहे हैं, और आप उनके लिए कितना समय और प्रयास करेंगे।

यह कहने के बाद, मैं बेयस के साथ शुरुआत करूंगा।


3

बायेसियन ढांचे को कसकर सामान्य महत्वपूर्ण सोच कौशल के लिए युग्मित किया गया है। निम्नलिखित स्थितियों में आपको इसकी आवश्यकता है:

  1. आप प्रतिस्पर्धी नौकरी के लिए आवेदन करने के बारे में सोचते हैं। आपके अंदर आने की संभावना क्या है? आवेदन करने से आप क्या भुगतान करते हैं?
  2. एक शीर्षक बताता है कि मोबाइल फोन लंबे समय में मनुष्यों में कैंसर का कारण बनते हैं। इसके लिए उनके पास कितने सबूत हैं?
  3. यदि आप चाहते हैं कि सबसे बड़ा प्रभाव होने के लिए आपको कौन सा दान करना चाहिए?
  4. कोई आपके पास से $ 0.90 और उनसे $ 1.10 की शर्त के साथ एक सिक्का फ्लिप करने की पेशकश करता है । क्या आप उन्हें पैसे देंगे? क्यों नहीं?
  5. आपने अपनी चाबियाँ (या परमाणु बम) खो दी हैं। आप कहाँ देखना शुरू करते हैं?

इसके अलावा, यह दो नमूना टी-टेस्ट के लिए सूत्र को याद रखने की तुलना में बहुत अधिक दिलचस्प है: पी। जो इस संभावना को बढ़ाता है कि छात्र तेजी से तकनीकी सामग्री के साथ परेशान करने के लिए पर्याप्त रुचि रखेंगे।


3

किसी ने भी संभावना का उल्लेख नहीं किया है, जो कि बायेसियन आंकड़ों के लिए मूलभूत है। पहले बेयस को पढ़ाने के पक्ष में एक तर्क यह है कि संभावना से प्रवाह, संभावना, बायस तक, बहुत सहज है। बे को संभावना से प्रेरित किया जा सकता है यह देखते हुए कि (i) संभावना वितरण फ़ंक्शन की तरह संभावना फ़ंक्शन दिखता है (और कार्य करता है), लेकिन ऐसा नहीं है क्योंकि वक्र के नीचे का क्षेत्र 1.0 नहीं है, और (ii) क्रूड, आमतौर पर इस्तेमाल किया जाने वाला वाल्ड। अंतराल एक संभावना समारोह मान लेते हैं जो एक सामान्य वितरण के लिए आनुपातिक है, लेकिन बायेसियन तरीके आसानी से इस सीमा को पार कर जाते हैं।

पहले बेयस के पक्ष में एक और तर्क यह है कि पी-ए (बी) बनाम पी (बी | ए) के बारे में पी-वैल्यू के बारे में चिंता को आसानी से समझाया जा सकता है, जैसा कि अन्य लोगों द्वारा बताया गया है।

"बेयस फर्स्ट" के पक्ष में एक और तर्क यह है कि यह छात्रों को सशर्त संभाव्यता मॉडल के बारे में अधिक ध्यान से सोचने के लिए मजबूर करता है, जो कहीं और उपयोगी है, जैसे प्रतिगमन विश्लेषण में।

आत्म-प्रचार के लिए क्षमा करें, लेकिन चूंकि यह पूरी तरह से विषय पर है, इसलिए मुझे यह बताते हुए कोई आपत्ति नहीं है कि यह ठीक उसी तरह का दृष्टिकोण है जो किवेन हेनिंग और मैंने अपनी पुस्तक "अंडरस्टैंडिंग एडवांस्ड स्टैटिस्टिकल मैथड्स," ( https: // peterwestfall) में लिया था। wixsite.com/book-1 ) जिनके लक्षित दर्शक गैर-सांख्यिकीविद हैं।


2

क्या आप मस्ती और अंतर्दृष्टि के लिए या व्यावहारिक उपयोग के लिए सिखा रहे हैं? यदि यह शिक्षण और समझ के बारे में है, तो मैं बेयस जाऊंगा। यदि व्यावहारिक उद्देश्यों के लिए, मैं निश्चित रूप से फ़्रिक्वेंटिस्ट जाऊंगा।

कई क्षेत्रों में, और मुझे लगता है कि अधिकांश क्षेत्र प्राकृतिक विज्ञान के हैं, लोगों को पी-मूल्य के साथ अपने पत्र प्रकाशित करने के लिए उपयोग किया जाता है। आपके "लड़कों" को अन्य लोगों के कागजात पढ़ने होंगे, इससे पहले कि वे अपने स्वयं के लेखन में आएं। अन्य लोगों के कागजात को पढ़ने के लिए, कम से कम मेरे क्षेत्र में, उन्हें नी-परिकल्पनाओं को एक पी-मूल्यों को समझने की आवश्यकता है, चाहे वे बेयसियन अध्ययन के बाद कितना भी मूर्ख दिखाई दें। और जब वे अपना पहला पेपर प्रकाशित करने के लिए तैयार होते हैं, तब भी उनके पास टीम का नेतृत्व करने वाले कुछ वरिष्ठ वैज्ञानिक होंगे और संभावनाएं होती हैं, वे फ्रीक्वेंटिज्म पसंद करते हैं।

कहा जा रहा है कि, मैं @Wayne के साथ मिलना चाहूंगा, उस सांख्यिकीय पुनर्विचार में पहले दृष्टिकोण के रूप में बेयसियन आंकड़ों के प्रति बहुत स्पष्ट रास्ता दिखाया गया है और आवृत्तिवाद के बारे में मौजूदा ज्ञान पर आधारित नहीं है। यह बहुत अच्छा है कि यह पुस्तक आपको बेहतर या बदतर आंकड़ों की लड़ाई में समझाने की कोशिश नहीं करती है। बेयस के लिए लेखक का कथित तर्क है (IIRC) कि वह दोनों प्रकार की शिक्षा दे रहा है और बेयस को पढ़ाना आसान था।


2

मैं बायेसियन से दूर रहूंगा, दिग्गजों का अनुसरण करूंगा।

सोवियट्स में माध्यमिक विद्यालय के छात्रों के लिए एक उत्कृष्ट पुस्तक श्रृंखला थी, जिसका मोटे तौर पर अंग्रेजी में "क्वांट 'लिटिल लाइब्रेरी के रूप में अनुवाद किया गया था।" कोलमोगोरोव ने सह-लेखकों के साथ एक पुस्तक का योगदान दिया, जिसका शीर्षक था "एक संभावना सिद्धांत का परिचय।" मुझे यकीन नहीं है कि इसे कभी भी अंग्रेजी में अनुवाद किया गया है, लेकिन यहां इसके रूसी मूल का लिंक है।

वे कॉम्बिनेटरिक्स के माध्यम से संभावनाओं को समझाते हुए दृष्टिकोण करते हैं, जो मुझे लगता है कि शुरू करने का सबसे अच्छा तरीका है। पुस्तक सभ्य गणित के साथ हाई स्कूल के छात्र के लिए बहुत सुलभ है। ध्यान दें, कि सोवियत ने बड़े पैमाने पर गणित पढ़ाया था, इसलिए औसत पश्चिमी हाई स्कूल के छात्रों को तैयार नहीं किया जा सकता है, लेकिन पर्याप्त रुचि और इच्छा शक्ति के साथ अभी भी सामग्री को संभाल सकते हैं, मेरी राय में।

छात्रों के लिए सामग्री बहुत दिलचस्प है, इसमें यादृच्छिक चलता है, वितरण को सीमित करता है, उत्तरजीविता प्रक्रिया, बड़ी संख्या का कानून आदि। यदि आप इस दृष्टिकोण को कंप्यूटर सिमुलेशन के साथ जोड़ते हैं, तो यह और भी मजेदार हो जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.