मैं पढ़ रहा हूँ क्यों की पुस्तक यहूदिया पर्ल द्वारा, और यह मेरी त्वचा के नीचे हो रही है 1 । विशेष रूप से, यह मुझे प्रतीत होता है कि वह बिना भूखे आदमी के तर्क को रखकर "शास्त्रीय" आँकड़ों को काट रहा है, क्योंकि आँकड़े कभी भी, कार्य-कारण संबंधों की जांच करने में सक्षम नहीं हैं, कि यह कार्य-कारण संबंधों में कभी दिलचस्पी नहीं लेता है, और यह आँकड़े "एक मॉडल बन गए हैं" -ब्लेंडेड डेटा-रिडक्शन एंटरप्राइज ”। सांख्यिकी उनकी किताब में एक बदसूरत शब्द है।
उदाहरण के लिए:
सांख्यिकीविदों को इस बात पर बहुत भ्रम हो गया है कि चर किसके लिए नियंत्रित होने चाहिए और क्या नहीं, इसलिए हर चीज को मापने के लिए डिफ़ॉल्ट अभ्यास को नियंत्रित किया जाना चाहिए। [...] यह पालन करने के लिए एक सुविधाजनक, सरल प्रक्रिया है, लेकिन यह त्रुटियों के साथ बेकार और कठोर दोनों है। कोशल क्रांति की एक महत्वपूर्ण उपलब्धि इस भ्रम को समाप्त करना है।
इसी समय, सांख्यिकीविद् इस अर्थ में नियंत्रण में रहते हैं कि वे कार्य-कारण के बारे में बात करने के लिए लालायित हैं [...]
हालाँकि, कारण मॉडल हमेशा की तरह आँकड़ों में रहे हैं। मेरा मतलब है, एक प्रतिगमन मॉडल का उपयोग अनिवार्य रूप से एक कारण मॉडल के रूप में किया जा सकता है, क्योंकि हम अनिवार्य रूप से मान रहे हैं कि एक चर कारण है और दूसरा प्रभाव है (इसलिए प्रतिगमन प्रतिगमन मॉडलिंग से अलग दृष्टिकोण है) और परीक्षण करना कि क्या यह कारण संबंध मनाया पैटर्न बताते हैं ।
एक और उद्धरण:
कोई आश्चर्य नहीं कि विशेष रूप से सांख्यिकीविदों को इस पहेली [द मोंटी हॉल समस्या] को समझने में मुश्किल हुई। आरए फिशर (1922) ने इसे "डेटा की कमी" और डेटा-जनरेटिंग प्रक्रिया की अनदेखी के रूप में देखा।
यह मुझे उस उत्तर की याद दिलाता है जो एंड्रयू गेलमैन ने बेइज़ियन और फ़्रीविज़न पर प्रसिद्ध xkcd कार्टून को लिखा था : "फिर भी, मुझे लगता है कि कार्टून पूरी तरह से अनुचित है क्योंकि यह एक समझदार बेइज़ियन की तुलना अक्सर एक सांख्यिकीविद् से करता है जो उथली पाठ्यपुस्तकों की सलाह का आँख बंद करके अनुसरण करता है। । "
एस-शब्द की गलत व्याख्या की मात्रा, जैसा कि मुझे लगता है, यहूदिया मोतियों की किताब में मौजूद है, मुझे आश्चर्य हुआ कि क्या कारण निष्कर्ष (जो कि वैज्ञानिक परिकल्पना 2 के आयोजन और परीक्षण के एक उपयोगी और दिलचस्प तरीके के रूप में माना जाता है ) संदिग्ध है।
प्रश्न: क्या आपको लगता है कि यहूदिया पर्ल आंकड़ों को गलत तरीके से पेश कर रहा है, और यदि हाँ, तो क्यों? सिर्फ कारण निष्कर्ष ध्वनि से बड़ा बनाने के लिए है? क्या आपको लगता है कि कारण निष्कर्ष एक बड़ी आर के साथ एक क्रांति है जो वास्तव में हमारी सभी सोच को बदल देता है?
संपादित करें:
ऊपर दिए गए प्रश्न मेरे मुख्य मुद्दे हैं, लेकिन जब से वे स्वीकार किए जाते हैं, माना जाता है, कृपया इन ठोस सवालों के जवाब दें (1) "कारण क्रांति" का क्या अर्थ है? (२) यह "रूढ़िवादी" आँकड़ों से कैसे भिन्न है?
1. इसके अलावा, क्योंकि वह है इस तरह के एक मामूली आदमी।
2. मैं वैज्ञानिक अर्थ में हूं, सांख्यिकीय अर्थ नहीं।
EDIT : एंड्रयू जेलमैन ने इस ब्लॉग पोस्ट को यहूदिया पर्ल्स बुक पर लिखा और मुझे लगता है कि उन्होंने इस किताब के साथ मेरी समस्याओं को समझाने की तुलना में बहुत बेहतर काम किया। यहाँ दो उद्धरण हैं:
पुस्तक के पृष्ठ 66 पर, पर्ल और मैकेंज़ी लिखते हैं कि आँकड़े "एक मॉडल-अंधा डेटा कटौती उद्यम बन गए हैं।" अरे! ये क्या बात कर रहे हो?? मैं एक सांख्यिकीविद् हूं, मैं 30 साल से आंकड़े दे रहा हूं, राजनीति से लेकर विष विज्ञान तक के क्षेत्रों में काम कर रहा हूं। "मॉडल-अंधा डेटा में कमी"? वह सिर्फ बकवास है। हम हर समय मॉडल का उपयोग करते हैं।
और दूसरा:
देखो। मुझे बहुलतावादी की दुविधा के बारे में पता है। एक तरफ, पर्ल का मानना है कि उनके तरीके पहले से आई हर चीज से बेहतर हैं। ठीक। उसके लिए, और कई अन्य लोगों के लिए, वे कारण निष्कर्ष का अध्ययन करने के लिए सबसे अच्छे उपकरण हैं। उसी समय, एक बहुलवादी, या वैज्ञानिक इतिहास के एक छात्र के रूप में, हम महसूस करते हैं कि केक को सेंकने के कई तरीके हैं। यह उन दृष्टिकोणों के प्रति सम्मान दिखाना चुनौतीपूर्ण है जो आप वास्तव में आपके लिए काम नहीं करते हैं, और कुछ बिंदु पर ऐसा करने का एकमात्र तरीका यह है कि आप कदम बढ़ाएं और महसूस करें कि वास्तविक लोग वास्तविक समस्याओं को हल करने के लिए इन विधियों का उपयोग करते हैं। उदाहरण के लिए, मुझे लगता है कि पी-वैल्यू का उपयोग करके निर्णय लेना एक भयानक और तार्किक रूप से असंगत विचार है जिसके कारण बहुत सी वैज्ञानिक आपदाएँ आई हैं; एक ही समय में, कई वैज्ञानिक सीखने के लिए उपकरण के रूप में पी-मूल्यों का उपयोग करने का प्रबंधन करते हैं। मैं उसे पहचानता हूं। इसी तरह, मेरा सुझाव है कि पर्ल यह पहचानता है कि सांख्यिकी, पदानुक्रमित प्रतिगमन मॉडलिंग, अंतःक्रियात्मकता, पदावनति, मशीन अधिगम इत्यादि के उपकरण वास्तविक कार्य समस्याओं को हल करते हैं। पर्ल के जैसे हमारे तरीके भी गड़बड़ कर सकते हैं- जीजीओ! -और शायद पर्ल का अधिकार है कि हम सभी उनके दृष्टिकोण पर स्विच करने के लिए बेहतर होंगे। लेकिन मुझे नहीं लगता कि यह मदद कर रहा है जब वह हमारे बारे में गलत बयान देता है।