मैं सिर्फ सांख्यिकीय अनुमान ("अनुपात और साधनों की तुलना") पर एक व्याख्यान देखा, आँकड़ों का एक हिस्सा ऑनलाइन पाठ्यक्रम। मेरे लिए यह सामग्री हमेशा की तरह कम समझ में आती है (अब तक मैंने इस सामान को दर्जनों बार देखा होगा, पिछले तीन दशकों में फैल चुका है)।
मैं "बेसिक स्टैट्स-101" (बिंदु अनुमान, अनुमान आकलन, सांख्यिकीय अनुमान, परिकल्पना परीक्षण, अध्ययन डिजाइन) पर एक किताब की तलाश कर रहा हूं जो एक संशयवादी पाठक को समझाने की समस्या को गंभीरता से लेता है ...
नीचे मैं उस प्रश्न के प्रकार के कुछ उदाहरण देता हूं, जिसे मैं जिस लेखक की खोज कर रहा हूं, वह गंभीरता से लेगा और पता होगा कि कैसे आश्वस्त किया जाए।
लेकिन पहले मुझे एक मिनट का तनाव लेने दो कि इस पोस्ट में मैं ये सवाल नहीं पूछ रहा हूं। कृपया, उन्हें जवाब न दें! मैं उन्हें उदाहरण के रूप में देता हूं, और "लिटमस टेस्ट" के माध्यम से (खोज के लेखक के प्रकार के लिए)।
यदि एक "अनुपात" केवल बूलियन चर का मतलब है (यानी एक जो केवल मान 0 और 1 लेता है), तो "अनुपात" और "साधन" के साथ सांख्यिकीय निष्कर्ष निकालने के लिए विभिन्न प्रक्रियाएं क्यों सिखाई जाती हैं?
यदि सामान्य वितरण इतना मजबूत है कि सामान्यता मानने के मामले में भी अच्छा परिणाम देता है, जब डेटा को सामान्य रूप से वितरित नहीं किया जाता है, और यदि टी-वितरण इतना सामान्य है, तो इसके बजाय टी-वितरण का उपयोग करने के बारे में सभी उपद्रव क्यों? सामान्य?
वास्तव में "स्वतंत्रता की डिग्री" क्या हैं , और हम उनके बारे में चिंता क्यों करते हैं?
एक पैरामीटर के "सही" मान की बात करने का क्या मतलब है, यह देखते हुए कि हम सिर्फ उन वितरणों का उपयोग कर रहे हैं जो डेटा के समान दिखते हैं ?
कैसे "खोजपूर्ण डेटा विश्लेषण" एक अच्छी बात है, जबकि "डेटा स्नूपिंग" एक बुरी चीज है?
जैसा कि मैंने कहा है, मैं इस तरह के सवालों की उपेक्षा के कारण उस रवैये से दूर हूँ । यह "महामारी विज्ञान रुख" नहीं है जो मैं किसी ऐसे व्यक्ति में देखना चाहता हूं जो मुझे कुछ सिखा रहा है। मुझे उन लेखकों की तलाश है जो पाठक की संदेह और तर्कसंगतता का सम्मान करते हैं, और जो उन्हें (बिना जरूरी औपचारिकताओं और तकनीकी के पन्नों में बंद किए) को संबोधित करना जानते हैं।
मुझे लगता है कि यह एक लंबा क्रम है, और शायद इसलिए जब यह आंकड़ों की बात आती है। इसलिए, मुझे उम्मीद नहीं है कि कई लेखक इसमें सफल हुए होंगे। लेकिन इस समय मैं सिर्फ एक को खोजने के साथ ही संतुष्ट रहूंगा ।
मुझे जोड़ने दें कि मैं गणित से प्रभावित नहीं हूं। इसके विपरीत, मुझे गणित से प्यार है। (मैं विश्लेषण [उर्फ "उन्नत पथरी"], रैखिक बीजगणित, संभाव्यता सिद्धांत, यहां तक कि बुनियादी माप सिद्धांत के साथ सहज हूं।)
उस ने कहा, इस समय मेरी रुचि "लागू", "व्यावहारिक", "रोजमर्रा", "वास्तविक दुनिया" के आंकड़ों (सैद्धांतिक रूप से विरोधाभासी के विपरीत) में है। (लेकिन मैं या तो रसोई की किताब नहीं चाहता!)
एफडब्ल्यूआईडब्ल्यू, मैंने गेलमैन और हिल द्वारा प्रतिगमन और बहुस्तरीय / पदानुक्रमित मॉडल का उपयोग करके डेटा विश्लेषण के पहले कुछ अध्याय पढ़े हैं , और मुझे लेखकों के स्वर पसंद हैं। उनका ध्यान व्यावहारिक है, लेकिन जरूरत पड़ने पर सिद्धांत में जाते हैं। वे अक्सर कदम पीछे खींचते हैं, और मानक प्रथाओं का गंभीर रूप से आकलन करते हैं, और स्पष्ट राय पेश करते हैं जो एक संशयवादी पाठक के हंगामे की अपील करते हैं। दुर्भाग्य से, इन लेखकों ने इस विषय पर समर्पित एक पुस्तक नहीं लिखी है जो मैं इस पोस्ट ("आँकड़े 101" सामान के बारे में पूछ रहा हूं, जैसा कि ऊपर वर्णित है)। मुझे यह भी पता है कि इनमें से एक लेखक (गेलमैन) ने बहु-प्रतीक्षित बायेसियन डेटा विश्लेषण के सह-लेखक हैं , लेकिन, फिर से, यह वह नहीं है जो मैं इस समय देख रहा हूं।
संपादित करें:
डिक्रान मार्सुपियल निम्नलिखित आपत्ति उठाता है:
मुझे नहीं लगता कि जरूरी सवालों की उपेक्षा के साथ कुछ भी गलत है, एक बिंदु आता है जहां हर सवाल को संबोधित करते हुए बुनियादी अवधारणाओं के विस्तार से अलग होता है जो अक्सर अधिक महत्वपूर्ण होता है (विशेष रूप से एक आँकड़े 101 पुस्तक में!)।
मैं इस से सहमत हूँ। यह कहना मेरे लिए अधिक सटीक होगा कि मैं "बुनियादी आंकड़ों पर दूसरा नज़र डाल रहा हूं।" वास्तव में, मेरी प्रेरणा के रूप में, मैंने अनुमान (कहना) पर स्नातक पाठ्यक्रमों में उपयोग की जाने वाली पाठ्यपुस्तकों को देखा, और पाया कि उन्होंने उन प्रश्नों की भी उपेक्षा की है, जिन्हें मैंने सूचीबद्ध किया है। यदि कुछ भी हो, तो वे ऐसे सवालों में फंसने के लिए भी कम लग रहे थे (ताकि वे कुछ अभिसरण या इस-या-कि-अन्य ...) के लिए स्थितियों पर ध्यान केंद्रित कर सकें।
समस्या यह है कि अधिक उन्नत पुस्तकों को पाठकों की एक अलग-अलग आबादी के लिए संबोधित किया जाता है , जहां "बाहरी व्यक्ति के संदेह" को बहुत कम कर दिया गया है। IOW, जो स्नातक स्तर के आँकड़े ले रहे हैं वे मुझे परेशान करने वाले प्रश्नों से परेशान होने की बात से परे हैं। वे किसी भी सामान के बारे में संदेह नहीं कर रहे हैं। (वे संदेहवादी कूबड़ से कैसे निकले? शायद पहली बार में कुछ भी बहुत आलोचनात्मक नहीं थे, खासकर अगर उन्होंने अपने आँकड़े काफी पहले सीख लिए थे - मुझे पता है कि मैं खुद एक विशेष रूप से महत्वपूर्ण व्यक्ति नहीं था, उदाहरण के लिए, हालांकि मैं नहीं था इसके बाद आंकड़े लें। दूसरों के पास ऐसे शिक्षक हो सकते हैं, जहां उनकी पाठ्यपुस्तकें कम हो गईं हों। कुछ ऐसे होशियार हो गए हों जो अपने लिए इस तरह के सवालों के जवाब जान सकें।