संशयवादी (लेकिन गणित-विपरीत नहीं) पाठक के लिए इंजेक्शन


14

मैं सिर्फ सांख्यिकीय अनुमान ("अनुपात और साधनों की तुलना") पर एक व्याख्यान देखा, आँकड़ों का एक हिस्सा ऑनलाइन पाठ्यक्रम। मेरे लिए यह सामग्री हमेशा की तरह कम समझ में आती है (अब तक मैंने इस सामान को दर्जनों बार देखा होगा, पिछले तीन दशकों में फैल चुका है)।

मैं "बेसिक स्टैट्स-101" (बिंदु अनुमान, अनुमान आकलन, सांख्यिकीय अनुमान, परिकल्पना परीक्षण, अध्ययन डिजाइन) पर एक किताब की तलाश कर रहा हूं जो एक संशयवादी पाठक को समझाने की समस्या को गंभीरता से लेता है ...

नीचे मैं उस प्रश्न के प्रकार के कुछ उदाहरण देता हूं, जिसे मैं जिस लेखक की खोज कर रहा हूं, वह गंभीरता से लेगा और पता होगा कि कैसे आश्वस्त किया जाए।

लेकिन पहले मुझे एक मिनट का तनाव लेने दो कि इस पोस्ट में मैं ये सवाल नहीं पूछ रहा हूं। कृपया, उन्हें जवाब न दें! मैं उन्हें उदाहरण के रूप में देता हूं, और "लिटमस टेस्ट" के माध्यम से (खोज के लेखक के प्रकार के लिए)।

  1. यदि एक "अनुपात" केवल बूलियन चर का मतलब है (यानी एक जो केवल मान 0 और 1 लेता है), तो "अनुपात" और "साधन" के साथ सांख्यिकीय निष्कर्ष निकालने के लिए विभिन्न प्रक्रियाएं क्यों सिखाई जाती हैं?

  2. यदि सामान्य वितरण इतना मजबूत है कि सामान्यता मानने के मामले में भी अच्छा परिणाम देता है, जब डेटा को सामान्य रूप से वितरित नहीं किया जाता है, और यदि टी-वितरण इतना सामान्य है, तो इसके बजाय टी-वितरण का उपयोग करने के बारे में सभी उपद्रव क्यों? सामान्य?

  3. वास्तव में "स्वतंत्रता की डिग्री" क्या हैं , और हम उनके बारे में चिंता क्यों करते हैं?

  4. एक पैरामीटर के "सही" मान की बात करने का क्या मतलब है, यह देखते हुए कि हम सिर्फ उन वितरणों का उपयोग कर रहे हैं जो डेटा के समान दिखते हैं ?

  5. कैसे "खोजपूर्ण डेटा विश्लेषण" एक अच्छी बात है, जबकि "डेटा स्नूपिंग" एक बुरी चीज है?

जैसा कि मैंने कहा है, मैं इस तरह के सवालों की उपेक्षा के कारण उस रवैये से दूर हूँ । यह "महामारी विज्ञान रुख" नहीं है जो मैं किसी ऐसे व्यक्ति में देखना चाहता हूं जो मुझे कुछ सिखा रहा है। मुझे उन लेखकों की तलाश है जो पाठक की संदेह और तर्कसंगतता का सम्मान करते हैं, और जो उन्हें (बिना जरूरी औपचारिकताओं और तकनीकी के पन्नों में बंद किए) को संबोधित करना जानते हैं।

मुझे लगता है कि यह एक लंबा क्रम है, और शायद इसलिए जब यह आंकड़ों की बात आती है। इसलिए, मुझे उम्मीद नहीं है कि कई लेखक इसमें सफल हुए होंगे। लेकिन इस समय मैं सिर्फ एक को खोजने के साथ ही संतुष्ट रहूंगा ।

मुझे जोड़ने दें कि मैं गणित से प्रभावित नहीं हूं। इसके विपरीत, मुझे गणित से प्यार है। (मैं विश्लेषण [उर्फ "उन्नत पथरी"], रैखिक बीजगणित, संभाव्यता सिद्धांत, यहां तक ​​कि बुनियादी माप सिद्धांत के साथ सहज हूं।)

उस ने कहा, इस समय मेरी रुचि "लागू", "व्यावहारिक", "रोजमर्रा", "वास्तविक दुनिया" के आंकड़ों (सैद्धांतिक रूप से विरोधाभासी के विपरीत) में है। (लेकिन मैं या तो रसोई की किताब नहीं चाहता!)

एफडब्ल्यूआईडब्ल्यू, मैंने गेलमैन और हिल द्वारा प्रतिगमन और बहुस्तरीय / पदानुक्रमित मॉडल का उपयोग करके डेटा विश्लेषण के पहले कुछ अध्याय पढ़े हैं , और मुझे लेखकों के स्वर पसंद हैं। उनका ध्यान व्यावहारिक है, लेकिन जरूरत पड़ने पर सिद्धांत में जाते हैं। वे अक्सर कदम पीछे खींचते हैं, और मानक प्रथाओं का गंभीर रूप से आकलन करते हैं, और स्पष्ट राय पेश करते हैं जो एक संशयवादी पाठक के हंगामे की अपील करते हैं। दुर्भाग्य से, इन लेखकों ने इस विषय पर समर्पित एक पुस्तक नहीं लिखी है जो मैं इस पोस्ट ("आँकड़े 101" सामान के बारे में पूछ रहा हूं, जैसा कि ऊपर वर्णित है)। मुझे यह भी पता है कि इनमें से एक लेखक (गेलमैन) ने बहु-प्रतीक्षित बायेसियन डेटा विश्लेषण के सह-लेखक हैं , लेकिन, फिर से, यह वह नहीं है जो मैं इस समय देख रहा हूं।

संपादित करें:

डिक्रान मार्सुपियल निम्नलिखित आपत्ति उठाता है:

मुझे नहीं लगता कि जरूरी सवालों की उपेक्षा के साथ कुछ भी गलत है, एक बिंदु आता है जहां हर सवाल को संबोधित करते हुए बुनियादी अवधारणाओं के विस्तार से अलग होता है जो अक्सर अधिक महत्वपूर्ण होता है (विशेष रूप से एक आँकड़े 101 पुस्तक में!)।

मैं इस से सहमत हूँ। यह कहना मेरे लिए अधिक सटीक होगा कि मैं "बुनियादी आंकड़ों पर दूसरा नज़र डाल रहा हूं।" वास्तव में, मेरी प्रेरणा के रूप में, मैंने अनुमान (कहना) पर स्नातक पाठ्यक्रमों में उपयोग की जाने वाली पाठ्यपुस्तकों को देखा, और पाया कि उन्होंने उन प्रश्नों की भी उपेक्षा की है, जिन्हें मैंने सूचीबद्ध किया है। यदि कुछ भी हो, तो वे ऐसे सवालों में फंसने के लिए भी कम लग रहे थे (ताकि वे कुछ अभिसरण या इस-या-कि-अन्य ...) के लिए स्थितियों पर ध्यान केंद्रित कर सकें।

समस्या यह है कि अधिक उन्नत पुस्तकों को पाठकों की एक अलग-अलग आबादी के लिए संबोधित किया जाता है , जहां "बाहरी व्यक्ति के संदेह" को बहुत कम कर दिया गया है। IOW, जो स्नातक स्तर के आँकड़े ले रहे हैं वे मुझे परेशान करने वाले प्रश्नों से परेशान होने की बात से परे हैं। वे किसी भी सामान के बारे में संदेह नहीं कर रहे हैं। (वे संदेहवादी कूबड़ से कैसे निकले? शायद पहली बार में कुछ भी बहुत आलोचनात्मक नहीं थे, खासकर अगर उन्होंने अपने आँकड़े काफी पहले सीख लिए थे - मुझे पता है कि मैं खुद एक विशेष रूप से महत्वपूर्ण व्यक्ति नहीं था, उदाहरण के लिए, हालांकि मैं नहीं था इसके बाद आंकड़े लें। दूसरों के पास ऐसे शिक्षक हो सकते हैं, जहां उनकी पाठ्यपुस्तकें कम हो गईं हों। कुछ ऐसे होशियार हो गए हों जो अपने लिए इस तरह के सवालों के जवाब जान सकें।


2
उन सवालों में से अधिकांश - जिनका हम जवाब नहीं दे रहे हैं - सीवी पर पहले से ही यहां अच्छे उत्तर हैं। उन सवालों में से कुछ भी काफी तुच्छ जवाब है। लेकिन किसी भी विषय के दौरान एक हजार सवाल लोगों के सामने आते हैं - आप कभी भी ऐसा स्पष्टीकरण नहीं ढूंढ पाते हैं, जिसमें सभी संभावित प्रश्नों को शामिल किया गया हो, न ही आपको कोई ऐसा मिलेगा, जिसे आप देख रहे हों या जब आप देख रहे हों पढ़ने। ठीक है कि आप एक या दो बार ही मौका पा सकते हैं, लेकिन कुल मिलाकर यह एक असंभव मानक है। उठते ही सवाल क्यों नहीं? एक साइट पर जो सवालों के जवाब देती है?
Glen_b -Reinstate मोनिका

2
मैं कहूंगा कि जब लोग आंकड़े करते हैं (और कुछ किताबें उनमें से कुछ का जवाब देती हैं) तो इसी तरह के प्रश्न सामने आते हैं, लेकिन उनमें से अधिकांश संदेहवाद से संबंधित वास्तविक प्रश्न नहीं हैं - ज्यादातर वे सरल समझने वाले प्रश्न हैं। उदाहरण के लिए "स्वतंत्रता की डिग्री क्या है और हम क्यों परवाह करते हैं" इसमें बिल्कुल भी संदेह नहीं है, यह स्पष्टीकरण और प्रेरणा की स्पष्टता के लिए पूछ रहा है। आँकड़ों के उन्नत उपयोगकर्ताओं के बारे में चिंता करने का कारण यह नहीं है क्योंकि वे पहले से ही समझते हैं कि वे इतने मूल्यवान क्यों हैं।
Glen_b -Reinstate मोनिका

जवाबों:


6

आपको पहले से ही कुछ अच्छे सुझाव मिले हैं। यहाँ कुछ और हैं। सबसे पहले, दो ब्लॉग जिन्हें मैंने छिटपुट रूप से पढ़ा, और जहां आप अपने आप से पूछते हैं जैसे सवालों पर कभी-कभी चर्चा की जाती है। जैसा कि वे ब्लॉग हैं, आप प्रश्न भी पूछ सकते हैं और कुछ बहुत अच्छे उत्तर प्राप्त कर सकते हैं! लो वे आ गए:

http://andrewgelman.com/ (एंड्रयू जेलमैन)

http://errorstatistics.com/ (डेबोरा मेयो)

और कुछ किताबें मुझे लगता है कि आपकी मदद करेगी: बॉक्स, हंटर और हंटर: सांख्यिकी के लिए सांख्यिकी।

जैसा कि शीर्षक कहता है, यह उन लोगों के लिए एक ("पहला" है, लेकिन वास्तव में, वास्तव में ... दूसरा) पाठ्यक्रम है जो अपने स्वयं के प्रयोगों को डिजाइन करना चाहते हैं, और इसलिए उनका विश्लेषण करते हैं। "क्यों" भाग पर बहुत अधिक है।

तब: डीआर कॉक्स: सांख्यिकीय इंजेक्शन के सिद्धांत, "क्यों" नहीं "कैसे" के बारे में एक और बहुत अच्छी किताब।

और, चूंकि आप पूछते हैं कि साधनों और अनुपातों का अलग-अलग तरीके से व्यवहार क्यों किया जाता है, यहाँ एक पुस्तक है जो ऐसा नहीं करती है: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=srn_1_1?s = पुस्तकें और यानी = UTF8 और QID = १३७३३९५११८ और एसआर = 1-1 और कीवर्ड = freedman + आँकड़े

गणित पर कम, सिद्धांतों पर उच्च।


8

मुझे संदेह है कि एक एकल पुस्तक होगी जो आपको सूट करती है क्योंकि अलग-अलग लोगों को अलग-अलग चीजों के बारे में संदेह होता है, और किताबें व्यक्तियों के बजाय लक्षित दर्शकों के लिए लिखी जाती हैं। यह सिर्फ एक किताब के बजाय एक व्यक्ति द्वारा सिखाई जाने वाली अच्छी चीजों में से एक है, जो कि आप जाते ही सवाल पूछ सकते हैं। यह एक रेखीय पाठ में करने के लिए एक बहुत मुश्किल काम है।

मुझे नहीं लगता कि जरूरी सवालों की उपेक्षा के साथ कुछ भी गलत है, एक बिंदु आता है जहां हर सवाल को संबोधित करते हुए बुनियादी अवधारणाओं के विस्तार से अलग होता है जो अक्सर अधिक महत्वपूर्ण होता है (विशेष रूप से एक आँकड़े 101 पुस्तक में!)।

मुझे संदेह है कि एक अच्छी पुस्तक पाने के लिए सबसे अच्छा तरीका है और फिर अनुत्तरित प्रश्नों का उत्तर कहीं और देखना। मुझे मेरे सामने आँकड़ों के ग्रंथों से भरा एक बुकशेल्फ़ मिला है, क्योंकि उनमें से कोई भी अलगाव में नहीं है मुझे वह सब चाहिए, जो मुझे (जेनेस की पुस्तक भी नहीं; ओ) चाहिए।

पूर्ण शुरुआत के लिए, मुझे लगता है कि ग्रांट फोस्टर की पुस्तक "अंडरस्टैंडिंग स्टैटिस्टिक्स" शुरू करने के लिए एक अच्छी जगह है, लेकिन मुझे संदेह है कि यह इस मामले में बहुत बुनियादी है।


1
"मुझे नहीं लगता कि सवालों की उपेक्षा के साथ कुछ गलत है ..." मुझे लगता है कि यह एक निष्पक्ष आपत्ति है; मैंने इसे संबोधित करने के लिए अपनी पोस्ट में EDIT जोड़ा है।
कोजो

7

XΘXΘΘXtXΘ


5
+1 इस बात का एक बड़ा कारण है कि सांख्यिकीय प्रक्रियाएँ संदेहास्पद दिखाई देती हैं, क्योंकि वे प्रति-सहज ज्ञान युक्त होती हैं और आँकड़ों की जिस तरह से समाप्ति होती है, उसकी एक ऐतिहासिक सराहना शायद संशयवादी के लिए एक अच्छा दृष्टिकोण है।
डिक्रान मार्सुपियल

2
@DikranMarsupial: वास्तव में, मैंने स्टिग्लर के "आँकड़ों के इतिहास" को आँकड़े के साथ मेरी कठिनाइयों के निचले भाग में लाने के लिए पढ़ा है। और इसने कुछ मदद की। दुर्भाग्य से, यह अधिकांश फिशर बनाम नेमैन युग को छोड़ देता है, जब (मुझे संदेह है) बहुत अधिक विचित्र विचित्रता पैदा हुई। मैंने हल्द की पुस्तक के लगभग 50 पृष्ठों का प्रयास किया, लेकिन उनकी व्युत्पत्तियों का पालन करना असंभव पाया: उन्हें स्पष्ट रूप से महत्वपूर्ण सांख्यिकीय विशेषज्ञता वाले पाठकों को संबोधित किया गया था ... यह सोचने के लिए आइए, मुझे लगता है कि शिक्षित आम आदमी को संबोधित एक पुस्तक और शीर्षक I क्या आँकड़े इतने अजीब हैं? " अच्छा
बिकेगा

4
IMHO काउंटर-इंटूटीविटी ऑफ द डेट्स फिशर बनाम नेमन युग (हालांकि इंटूटीविटी का अर्थ उपयोगिता या इसके विपरीत नहीं है)। इयान हैकिंग की किताबें एक कोशिश के काबिल हो सकती हैं, मैंने "द इमर्जेंस ऑफ प्रोबेबिलिटी" का आनंद लिया। मैं लगातार आंकड़ों की तुलना में बायसेनियन आंकड़ों को वैचारिक रूप से समझने के लिए बहुत आसान पाता हूं, लेकिन व्यवहार में प्रदर्शन करने के लिए बहुत कठिन है। बायेसियन और अक्सरवादी दृष्टिकोणों के बीच के अंतर को समझने से मुझे लगातार दृष्टिकोण को समझने में बहुत मदद मिली।
डिक्रान मार्सुपियल

1
धन्यवाद, मैं हैकिंग की जाँच करूँगा। मेरी किताबों में लंबे समय तक रहने के बावजूद, मैंने यह सोचकर उसे पढ़ने से रोक दिया कि वह संभावना सिद्धांत (एक ऐसा विषय जो मुझे अपने आप में आकर्षक लगता है) के दर्शन के आसपास केंद्रित था। उस ने कहा, मैं जानता हूं कि कम से कम मेरी कुछ समस्याएं सांख्यिकी की संभावना पर व्याख्या की वजह से हैं, इसलिए हो सकता है कि हैकिंग पढ़ने से कम से कम मेरी कुछ आपत्तियों का ध्यान रखा जाए।
कोजो

2
@kjo मैंने हैकिंग के लॉजिक ऑफ़ स्टैटिस्टिकल इंक्वायरी को पढ़ा और इसे बहुत 'दार्शनिक' पाया - वह 'समर्थन' के रूप में संभावना के विचार पर था और नेमन-पियर्सन पर नीचे था, लेकिन सरल उदाहरणों के साथ रखा - n nance पैरामीटर की चर्चा नहीं की, बहु -परमाणु आक्षेप, या कुछ भी मुश्किल (जब तक मैं भूल नहीं गया)। पढ़ने लायक, निश्चित रूप से, लेकिन मैं इसे शुरू करने की सिफारिश नहीं करूंगा।
Scortchi - को पुनः स्थापित मोनिका

6

एबेल्सन (1995), प्रिंसिपल आर्ग्युमेंट के रूप में सांख्यिकी परिचयात्मक है और कुछ ऐसे सवालों पर दिलचस्प रुख रखता है जो अक्सर शिक्षार्थियों को भ्रमित करते हैं।

लेकिन शायद आपको सिर्फ सैद्धांतिक आँकड़ों पर कुछ किताबें पढ़ने की ज़रूरत है (अभिसरण, मीट्रिक रिक्त स्थान, और ग के बारे में सभी सामग्री को छोड़ देना) और फिर भी यदि वे विशेष रूप से आपके उदाहरणों जैसे प्रश्नों का उत्तर नहीं देते हैं, तो आप अधिकांश का उत्तर देने में सक्षम होंगे। अपने आप को, और @Dikran के अनुसार बाकी को देखें।

मैंने कॉक्स एंड हिंकले, थ्योरेटिकल स्टेटिस्टिक्स या कॉक्स को पढ़ने वाले एक अन्य सूत्र में सुझाव दिया , कैसैला और बर्जर के साथ एक साथ सांख्यिकीय इंजेक्शन के सिद्धांत , सांख्यिकीय निष्कर्ष वहां के विभिन्न दृष्टिकोणों की समझ प्राप्त करने के लिए हैं।


1
मुझे यह दिलचस्प लगा लेकिन मुझे नहीं लगता कि यह ओपी द्वारा अपेक्षित स्तर पर है।
गाला

@Gael आप शायद सही हैं, विशेष रूप से संपादन को देखते हुए।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.