एंड्रयू जेलमैन अपने हाल के ब्लॉग पोस्टों में से एक में कहते हैं:
मुझे नहीं लगता कि सिम्पसन के विरोधाभास के लिए जवाबी कार्रवाई या संभावित परिणाम आवश्यक हैं। मैं यह कहता हूं क्योंकि कोई भी सिम्पसन के विरोधाभास को उन चरों के साथ स्थापित कर सकता है जिन्हें हेरफेर नहीं किया जा सकता है, या जिनके लिए जोड़तोड़ सीधे हित के नहीं हैं।
सिम्पसन का विरोधाभास एक अधिक सामान्य मुद्दे का हिस्सा है जो प्रतिगमन coefs को बदल देता है यदि आप अधिक भविष्यवाणियों को जोड़ते हैं, तो संकेत की फ़्लिपिंग वास्तव में आवश्यक नहीं है।
यहाँ एक उदाहरण है जो मैं अपने शिक्षण में उपयोग करता हूँ जो दोनों बिंदुओं को दिखाता है:
मैं सेक्स और ऊंचाई से आय का अनुमान लगाने वाला एक प्रतिगमन चला सकता हूं। मुझे पता है कि सेक्स का योगफल $ 10,000 है (अर्थात, एक समान ऊंचाई के पुरुष और महिला की तुलना, औसतन पुरुष $ 10,000 अधिक बना देगा ) और ऊंचाई का गुणांक $ 500 है (यानी, दो पुरुषों या दो महिलाओं की तुलना अलग-अलग ऊँचाइयों पर, औसतन लंबा व्यक्ति $ 500 प्रति इंच की ऊँचाई बनाएगा )।
मैं इन coefs की व्याख्या कैसे कर सकता हूं? मुझे लगता है कि ऊँचाई के आघात की व्याख्या करना आसान है (एक ही लिंग के दो लोगों की अलग-अलग ऊँचाइयों पर तुलना करना आसान है), वास्तव में यह किसी भी तरह "गलत" होगा , सेक्स के लिए नियंत्रण के बिना ऊंचाई पर फिर से हासिल करने के लिए, जितना कच्चा पुरुषों और महिलाओं के बीच अंतर होने से छोटे और लंबे लोगों के बीच अंतर "समझाया" जा सकता है। लेकिन ऊपर दिए गए मॉडल में सेक्स की आड़ में व्याख्या करना बहुत मुश्किल लगता है: एक पुरुष और एक महिला की तुलना करना, जो दोनों 66 इंच लंबे हैं, उदाहरण के लिए? यह एक लंबी महिला के साथ एक छोटे आदमी की तुलना होगी। यह सब तर्क अस्पष्ट कारण लगता है, लेकिन मुझे नहीं लगता कि यह संभावित परिणामों का उपयोग करने के बारे में सोचने के लिए समझ में आता है।
मैंने इस पर विचार किया (और यहां तक कि पोस्ट पर टिप्पणी भी की) और लगता है कि कुछ ऐसा है जो यहां अधिक स्पष्टता के साथ समझा जाता है।
लिंग की व्याख्या पर यह ठीक है। लेकिन मैं यह नहीं देखता कि एक छोटे आदमी और एक लंबी महिला की तुलना करने के पीछे क्या समस्या है। यहाँ मेरी बात है: वास्तव में यह और भी अधिक समझ में आता है (इस धारणा को देखते हुए कि पुरुष औसतन लम्बे होते हैं)। आप एक 'छोटे आदमी' और एक 'छोटी' महिला की तुलना एक ही कारण से नहीं कर सकते, कि आय में अंतर को ऊंचाइयों के अंतर से कुछ हिस्से में समझाया गया है। वही लम्बे पुरुषों और लम्बी महिलाओं के लिए जाता है और उससे भी ज्यादा छोटी महिलाओं और लम्बे पुरुषों के लिए (जो आगे सवाल से बाहर है, इसलिए बोलने के लिए)। तो मूल रूप से ऊंचाई का प्रभाव केवल उस स्थिति में समाप्त हो जाता है जब छोटे पुरुषों और लंबी महिलाओं की तुलना की जाती है (और यह लिंग पर गुणांक की व्याख्या करने में मदद करता है)। क्या यह लोकप्रिय मिलान मॉडल के पीछे समान अंतर्निहित अवधारणाओं पर घंटी नहीं बजाता है?
सिम्पसन के विरोधाभास के पीछे विचार यह है कि जनसंख्या प्रभाव उप-समूह वार प्रभाव (एस) से अलग हो सकता है। यह उनके बिंदु 2 से संबंधित कुछ अर्थों में है और यह तथ्य कि वह स्वीकार करते हैं कि ऊंचाई को अकेले के लिए नियंत्रित नहीं किया जाना चाहिए (जिसे हम छोड़े गए चर पूर्वाग्रह कहते हैं)। लेकिन मैं इसे लिंग पर गुणांक के विवाद से संबंधित नहीं कर सका।
शायद आप इसे और अधिक स्पष्ट रूप से व्यक्त करने में सक्षम हो सकते हैं? या मेरी समझ पर टिप्पणी करें?