चर चयन की एक अधिक निश्चित चर्चा


55

पृष्ठभूमि

मैं दवा में नैदानिक ​​अनुसंधान कर रहा हूं और कई सांख्यिकी पाठ्यक्रम ले चुका हूं। मैंने लीनियर / लॉजिस्टिक रिग्रेशन का उपयोग करते हुए कभी कोई पेपर प्रकाशित नहीं किया है और वह चर चयन को सही तरीके से करना चाहता है। व्याख्या करना महत्वपूर्ण है, इसलिए कोई फैंसी मशीन सीखने की तकनीक नहीं। मैंने चर चयन की अपनी समझ को संक्षेप में प्रस्तुत किया है - क्या कोई व्यक्ति किसी गलत धारणा पर प्रकाश डालना चाहेगा? मुझे इसमें से दो (1) समान (2) सीवी पोस्ट मिले, लेकिन उन्होंने मेरी चिंताओं का पूरी तरह से जवाब नहीं दिया। किसी भी विचार की बहुत सराहना की जाएगी! मेरे पास अंत में 3 प्राथमिक प्रश्न हैं।

समस्या और चर्चा

मेरी विशिष्ट प्रतिगमन / वर्गीकरण समस्या में 200-300 अवलोकन, 15% की प्रतिकूल घटना दर (यदि वर्गीकरण) है, और 40 में से 25 चर पर जानकारी है जो कि साहित्य में "सांख्यिकीय रूप से महत्वपूर्ण" प्रभाव होने या प्रशंसनीय बनाने का दावा किया गया है। डोमेन ज्ञान द्वारा समझ।

मैंने उद्धरणों में "सांख्यिकीय रूप से महत्वपूर्ण" लगाया, क्योंकि ऐसा लगता है कि हर कोई और उनकी माँ स्टेप वाइज रिग्रेशन का उपयोग करते हैं, लेकिन हार्ले (3) और फ्लॉम (4) कई अच्छे कारणों से इसे पसंद नहीं करते हैं। यह आगे एक जेलमैन ब्लॉग पोस्ट चर्चा (5) द्वारा समर्थित है । ऐसा लगता है कि एकमात्र वास्तविक समय है जब स्टेप वाइज स्वीकार्य है, अगर यह वास्तव में खोजपूर्ण विश्लेषण है, या किसी को भविष्यवाणी में दिलचस्पी है और इसमें क्रॉस-वैलिडेशन स्कीम शामिल है। खासकर जब से कई चिकित्सा comorbidities collinearity से पीड़ित हैं और अध्ययन छोटे नमूना आकार से पीड़ित हैं, मेरी समझ यह है कि साहित्य में बहुत सारी गलत सकारात्मकताएं होंगी; इससे मुझे संभावित चरों को शामिल करने के लिए साहित्य पर भरोसा करने की भी कम संभावना है।

एक अन्य लोकप्रिय तरीका है, एक प्रारंभिक बिंदु के रूप में भविष्यवक्ताओं और स्वतंत्र चर के बीच एकतरफा रजिस्टरों / संघों की एक श्रृंखला का उपयोग करना। एक विशेष सीमा के नीचे (कहते हैं, पी <0.2)। इस StackExchange पोस्ट (6) में उल्लिखित कारणों के लिए यह गलत या कम से कम भ्रामक लगता है ।

अंत में, एक स्वचालित दृष्टिकोण जो मशीन लर्निंग में लोकप्रिय दिखाई देता है, वह है L1 (Lasso), L2 (रिज) या L1 + L2 कॉम्बो (इलास्टिक नेट) जैसे दंड का उपयोग करना। मेरी समझ यह है कि इनमें ओएलएस या लॉजिस्टिक प्रतिगमन के समान आसान व्याख्याएं नहीं हैं।

गेलमैन + हिल निम्नलिखित प्रस्ताव:

Gelman

अपने स्टैटस कोर्स में, मैं पूर्ण और नेस्टेड मॉडल की तुलना करने के लिए एफ टेस्ट या डीवियनस के विश्लेषण का उपयोग करके भी याद करता हूं कि मॉडल / वेरिएबल सलेक्शन वेरिएबल को वेरिएबल से कर सकता है। यह उचित प्रतीत होता है, लेकिन क्रमिक रूप से नेस्टेड मॉडल को व्यवस्थित रूप से फिट करने के लिए वैरिएबल को खोजने के लिए जो प्रति df में सबसे बड़ी गिरावट का कारण बनता है, ऐसा लगता है कि इसे आसानी से स्वचालित किया जा सकता है (इसलिए मैं थोड़ा चिंतित हूं) और ऐसा भी लगता है कि यह उस क्रम की समस्याओं से ग्रस्त है जिसमें आप चर समावेश का परीक्षण करें। मेरी समझ यह है कि इसे बहुसंख्या और अवशिष्ट भूखंडों (अवशिष्ट बनाम अनुमानित) की जांच करके भी पूरक होना चाहिए।

प्रशन:

  1. क्या गेलमैन सारांश जाने का रास्ता है? आप उसकी प्रस्तावित रणनीति में क्या जोड़ेंगे या बदलेंगे?

  2. संभावित बातचीत और परिवर्तनों के बारे में विशुद्ध रूप से सोचने के अलावा (जो कि बहुत पूर्वाग्रह / त्रुटि / चूक प्रवण लगता है), क्या संभावित लोगों की खोज करने का एक और तरीका है? बहुभिन्नरूपी अनुकूली प्रतिगमन स्पलाइन (MARS) की सिफारिश की गई थी, लेकिन मुझे सूचित किया गया था कि गैर-नियमन / परिवर्तन एक मानक प्रतिगमन मॉडल में एक ही चर में अनुवाद नहीं करते हैं।

  3. मान लीजिए कि मेरा लक्ष्य बहुत सरल है: कहते हैं, "मैं वाई पर एक्स 1 के सहयोग का अनुमान लगाना चाहता हूं, केवल एक्स 2 के लिए लेखांकन"। क्या यह केवल Y ~ X1 + X2 को पुन: प्राप्त करने के लिए पर्याप्त है, परिणाम की रिपोर्ट करें, वास्तविक भविष्य कहनेवाला क्षमता के संदर्भ के बिना (जैसा कि क्रॉस-मान्यता आरएमएसई या सटीकता उपायों द्वारा मापा जा सकता है)? क्या यह घटना दर या नमूना आकार के आधार पर बदलता है या यदि R ^ 2 सुपर कम है (मुझे पता है कि R ^ 2 अच्छा नहीं है क्योंकि आप हमेशा इसे ओवरफिट करके बढ़ा सकते हैं)? मैं आमतौर पर पूर्वानुमानात्मक शक्ति को अनुकूलित करने की तुलना में अनुमान / व्याख्या में अधिक रुचि रखता हूं।

उदाहरण निष्कर्ष:

  1. "X2 के लिए नियंत्रित करना, X1, X1 के संदर्भ स्तर के सापेक्ष Y के साथ सांख्यिकीय रूप से महत्वपूर्ण रूप से जुड़ा नहीं था।" (लॉजिस्टिक रिग्रेशन गुणांक)
  2. "एक्स 1 वाई में सांख्यिकीय रूप से महत्वपूर्ण भविष्यवक्ता नहीं था क्योंकि डिफेन्स में मॉडल ड्रॉप df में बदलाव के सापेक्ष पर्याप्त नहीं था।" (डीवियनस का विश्लेषण)

क्या क्रॉस-वेलिडेशन हमेशा आवश्यक होता है? जिस स्थिति में, कोई व्यक्ति SMOTE, नमूनाकरण, आदि के माध्यम से कक्षाओं का कुछ संतुलन करना भी चाहेगा।



6
कुछ किया जा सकता है या नहीं स्वचालित (वर्तमान में - मजबूत एआई के आगमन से पहले) मुझे एक लाल हेरिंग के रूप में हमला करता है।
गूँग - मोनिका

7
एक बहुत ही विचारशील प्रश्न के लिए +1। आपकी समीक्षा प्रदर्शित करने वाली एक बात यह है कि चर चयन के लिए कोई मानक नुस्खा या कुकबुक नहीं है। हर कोई "सर्वोत्तम" प्रथाओं का एक अलग दृष्टिकोण और सेट है। फिर, सैद्धांतिक रूप से संचालित एक बनाम एक सैद्धांतिक या जनसंख्या मॉडल के बीच बहुत महत्वपूर्ण अंतर है - ये अलग-अलग रूपरेखाएं शायद ही कभी संरेखित करती हैं और उन्हें भ्रमित करना आसान है। "कुछ" गायब होने के बारे में आपकी चिंता निराधार नहीं है, लेकिन वास्तविकता यह है कि एक निर्णायक, अप्रतिम उत्तर बस मौजूद नहीं है। आपके द्वारा समीक्षा किए गए दृष्टिकोण बड़े पैमाने पर प्रलेखित हैं, एक को चुनें
माइक हंटर

4
हरेल, फ्लॉम, और कोलासा; यह तब बस गया।
गंग -

4
रे गेलमैन एंड हिल्स 4 (बी): हैरेल, आरएमएस 1 ईडीएन, पी 60: "चर चयन के साथ एक अंतिम समस्या को इस दृष्टिकोण [एससी स्टेपवाइज] की तुलना करके समझदार तरीके से समझा जाता है कि कई अर्थशास्त्री प्रतिगमन मॉडल विकसित करते हैं। अर्थशास्त्री अक्सर रणनीति का उपयोग करते हैं। केवल उन चरों को हटाना जो महत्वहीन हैं और जिनके प्रतिगमन गुणांकों में एक निरर्थक दिशा है ”। और मुझे याद है कि स्टेयरबर्ग उस पर एक पेपर लिखने जा रहे थे। [रेफ को खोजने की कोशिश करेंगे। जब मुझे मौका मिले।]
स्कॉर्टची - मोनिका

जवाबों:


46

एंड्रयू गैल्मन निश्चित रूप से सांख्यिकीय दुनिया में एक सम्मानित नाम है। उनके सिद्धांत बारीकी से कुछ कारण मॉडलिंग अनुसंधान के साथ संरेखित करते हैं जो क्षेत्र में अन्य "बड़े नामों" द्वारा किया गया है। लेकिन मुझे लगता है कि नैदानिक ​​अनुसंधान में आपकी रुचि को देखते हुए, आपको अन्य स्रोतों से परामर्श करना चाहिए।

मैं "कारण" शब्द का उपयोग शिथिल कर रहा हूं (जैसा कि अन्य करते हैं) क्योंकि एक ठीक रेखा है जिसे हमें अवलोकन डेटा से "कारण निष्कर्ष", और चर के बीच कारण संबंधों को जोड़ने के बीच आकर्षित करना चाहिए। हम सभी सहमत हैं कि आरसीटी कार्य-कारण का आकलन करने का मुख्य तरीका है। हम कुछ अपवादों के साथ इस तरह के परीक्षण के लिए शायद ही कभी समायोजित करते हैं, कुछ अपवादों के साथ ( Senn, 2004 )। अवलोकन संबंधी अध्ययनों का अपना महत्व और उपयोगिता है ( वेइस, 1989 ) और अवलोकन डेटा से निष्कर्ष निकालने के लिए प्रतिसादात्मक आधारित दृष्टिकोण को ऐसा करने के लिए दार्शनिक रूप से ध्वनि दृष्टिकोण के रूप में स्वीकार किया जाता है ( हॉफलर, 2005 )। यह अक्सर आरसीटीएस ( एंगलमेयर, 2014 ) में मापा उपयोग-प्रभावकारिता को बहुत बारीकी से अनुमानित करता है ।

इसलिए, मैं अवलोकन डेटा से अध्ययन पर ध्यान केंद्रित करूंगा। Gelman की सिफारिशों के साथ विवाद का मेरी बात है: सभी एक मॉडल में भविष्यवक्ताओं और उनके मंजूर कारण संबंध ब्याज की एक भी जोखिम और ब्याज की एक भी परिणाम के बीच निर्दिष्ट किया जाना चाहिए apriori । मुख्य निष्कर्षों के एक सेट के बीच अपने रिश्ते के आधार पर कोवरिएट्स को बाहर फेंकना और वास्तव में 'मुनचूसन के सांख्यिकीय ग्रिड' ( मार्टिन, 1984 ) के एक विशेष मामले को प्रेरित करना है । कुछ पत्रिकाओं (और प्रवृत्ति पर पकड़ है) संक्षेप में किसी भी लेख को अस्वीकार कर देंगे जो एक अंतिम मॉडल ( बेबीक, 2004 ) की पहचान करने के लिए स्टेप वाइज रिग्रेशन का उपयोग करता है , और मुझे लगता है कि समस्या यहां समान तरीकों से देखी जाती है।

एक मॉडल में सहसंयोजकों को शामिल करने और बहिष्कृत करने के औचित्य पर चर्चा की जाती है: जुडिया पर्ल का कारण ( पर्ल, 2002 )। यह सांख्यिकीय अनुमान, प्रतिगमन और बहुभिन्नरूपी समायोजन के सिद्धांतों को समझने के लिए संभवतः सबसे अच्छे ग्रंथों में से एक है। इसके अलावा सैंडर्स और ग्रीनलैंड द्वारा व्यावहारिक रूप से कुछ भी प्रकाशित किया जा रहा है, विशेष रूप से भ्रमित करने पर उनकी चर्चा जो कि सिफारिशों की इस सूची से पछतावा है ( ग्रीनलैंड एट अल। 1999))। विशिष्ट कोवरिएट को एक कारण मॉडल के साथ एक ग्राफिकल संबंध के आधार पर लेबल सौंपा जा सकता है। सांख्यिकीय मॉडल में सहसंयोजक के रूप में पदनाम, confounder, या सटीक चर वारंट समावेश जैसे पदनाम। मध्यस्थ, कोलाइडर या कारण मार्ग से परे चर को छोड़ दिया जाना चाहिए। इन शर्तों की परिभाषाओं को Causality में बहुत सारे उदाहरणों के साथ कठोर बनाया गया है।

इस छोटी सी पृष्ठभूमि को देखते हुए मैं एक-एक करके बिंदुओं को संबोधित करूँगा।

  1. यह आम तौर पर एक प्रमुख चेतावनी के साथ एक ध्वनि दृष्टिकोण है: ये चर परिणाम के मध्यस्थ नहीं होने चाहिए। यदि, उदाहरण के लिए, आप धूम्रपान और शारीरिक फिटनेस के बीच संबंध का निरीक्षण कर रहे हैं, और आप फेफड़े के कार्य के लिए समायोजित करते हैं, तो यह धूम्रपान के प्रभाव को दर्शाता है क्योंकि यह फिटनेस पर सीधा प्रभाव पड़ता है जो फेफड़ों के कार्य को कम करता है। यह नहीं होना चाहिएभ्रमित होने के साथ भ्रमित होना जहां तीसरा चर ब्याज की भविष्यवाणी और ब्याज के परिणाम का कारण है। कन्फाउंडर्स को मॉडल में शामिल किया जाना चाहिए। इसके अतिरिक्त, अति-विश्लेषण विश्लेषण में पूर्वाग्रह के कई रूपों का कारण बन सकता है। मध्यस्थों और कन्फ़्यूडर को विश्लेषण में पाए जाने के कारण ऐसा नहीं माना जाता है, लेकिन विषय-विशेषज्ञ (SME) के रूप में आपके द्वारा BELIEVED होने के कारण। यदि आपके पास प्रति चर या कम 20 अवलोकन हैं, या समय-समय पर होने वाली घटना या लॉजिस्टिक विश्लेषण में प्रति घटना 20 अवलोकन हैं, तो आपको इसके बजाय सशर्त तरीकों पर विचार करना चाहिए।

  2. यह एक उत्कृष्ट विद्युत बचत दृष्टिकोण है जो इतना जटिल नहीं है जितना कि प्रॉपर्टीज स्कोर समायोजन या SEM या कारक विश्लेषण। मैं जब भी संभव हो ऐसा करने की सलाह जरूर दूंगा।

  3. मैं तहे दिल से असहमत हूं। विश्लेषणों में अन्य चर के लिए समायोजन की बात यह है कि तुलना करना संभव है। गलत तरीके से भ्रमित करने वाले संबंधों को आम तौर पर अति-विश्लेषण नहीं किया जाता है, इसलिए छोड़ी गई बातचीत की शर्तों से अवशिष्ट भ्रमित करना मेरे अनुभव में है, न कि एक बड़ा मुद्दा। हालाँकि, आप ब्याज और अन्य चर के भविष्यवक्ता के बीच बातचीत की शर्तों के बाद के विश्लेषण के रूप में विचार कर सकते हैं। यह एक परिकल्पना उत्पन्न करने की प्रक्रिया है जो किसी भी संभावित निष्कर्षों को परिष्कृत करने के लिए है (या इसके अभाव में) संभावित रूप से एक उपसमूह या बी से संबंधित है। दो पर्यावरण और / या आनुवांशिक कारकों के बीच एक यंत्रवत बातचीत शामिल है।

  4. मैं भी इस बात से पूरी तरह असहमत हूं। यह प्रतिगमन के लिए पुष्टिकरण विश्लेषण आधारित दृष्टिकोण के साथ मेल नहीं खाता है। आप एसएमई हैं। विश्लेषण को प्रश्न द्वारा सूचित किया जाना चाहिए न कि आंकड़े को। विश्वास के साथ राज्य करें कि आप क्या होने का विश्वास करते हैं, कारण मॉडल के एक चित्रण चित्रण पर आधारित है (पर्ल एट अल से डीएजी और संबंधित सिद्धांतों का उपयोग करके), फिर अपने हित के मॉडल के लिए भविष्यवाणियों का चयन करें, फिट, और चर्चा करें। केवल एक माध्यमिक विश्लेषण के रूप में आपको इस दृष्टिकोण पर विचार करना चाहिए, यहां तक ​​कि बिल्कुल भी।

इस सब में मशीन लर्निंग की भूमिका अत्यधिक बहस योग्य है। सामान्य तौर पर, मशीन लर्निंग भविष्यवाणी पर केंद्रित होती है न कि अनुमान के अनुसार जो डेटा विश्लेषण के लिए अलग-अलग दृष्टिकोण हैं। आप सही हैं कि दंडित प्रतिगमन से प्रभावों की व्याख्या एक ओएलएस से अनुमान के विपरीत, गैर-सांख्यिकीय समुदाय के लिए आसानी से व्याख्या नहीं की जाती है, जहां 95% सीआई और गुणांक अनुमान एसोसिएशन का एक उपाय प्रदान करते हैं।

एक OLS मॉडल Y ~ X से गुणांक की व्याख्या सीधी है: यह एक ढलान है, X में 1 इकाई से भिन्न Y तुलना समूहों में एक अपेक्षित अंतर है। एक बहुभिन्नरूपी समायोजित मॉडल Y ~ X1 + X2 में इसे एक सशर्त के रूप में संशोधित किया गया है। ढलान: यह X में 1 इकाई द्वारा अलग Y तुलना समूहों में एक अपेक्षित अंतर है जो X2 का समान मूल्य है। ज्यामितीय रूप से, X2 के लिए समायोजन करने से तीन स्थानों के अलग-अलग स्ट्रेट या "क्रॉस सेक्शन" होते हैं, जहाँ हम X1 से Y की तुलना करते हैं, फिर हम उन स्ट्रेट्स में से प्रत्येक पर निष्कर्ष निकालते हैं। आर में, coplotऐसे संबंधों की कल्पना करने के लिए फ़ंक्शन बहुत उपयोगी है।


वास्तव में आपकी विस्तृत टिप्पणी की सराहना करते हैं - मैंने पहले कभी किसी को मेरे सवालों का इतने विस्तार से जवाब नहीं दिया। मैं अब आपके लिंक के माध्यम से जा रहा हूँ!
शार्पर_इमेज

1
(+1) ऑन # 1: G & H का कहना है कि ये " भविष्यवाणी के लिए प्रतिगमन मॉडल बनाने के सामान्य सिद्धांत " हैं [मेरे इटैलिक] इसलिए आपके कैविएट को लागू करने की आवश्यकता नहीं है। (शायद अच्छे फेफड़े के कार्य के साथ उन दुर्लभ धूम्रपान करने वाले वास्तव में विशेष रूप से फिट होते हैं।) जब वे कारण मॉडल पर चर्चा करते हैं तो वे एक ही बिंदु बनाते हैं (Ch। 9.7)।
Scortchi - फिर से बहाल करें मोनिका

2
(+1) बकाया प्रतिक्रिया, एडमो! इस बात की सराहना करते हुए कि आपने पहले से ही बड़ी मात्रा में काम किया है, मुझे आश्चर्य है कि यदि आप अपने द्वारा उल्लिखित जर्नल नीति की वर्तमान दत्तक स्थिति के बारे में अधिक जानते हैं। मैं अभी भी कम से कम JAMA पत्रिकाओं में 'स्टेप वाइज' शब्द को देखकर रोष में फिट बैठता हूं। क्या आप इस नीति पर एक संपादकीय का हवाला दे सकते हैं?
डेविड सी। नोरिस

2
@ DavidC.Norris "एजुकेशनल एंड साइकोलॉजिकल मेजरमेंट" सवाल और काश में पत्रिका है, बेबीक लेख केवल स्वचालित स्टेप वाइज रिग्रेशन पर चर्चा करता है । मैंने कुछ लेख लेखकों में देखा है, जो "स्टेप वाइज" (यद्यपि स्वचालित नहीं है) होने के रूप में मॉडल को शामिल करने और परिष्कृत करने के लिए अपने "हाथों" पर चर्चा करते हैं। मैं तर्क दूंगा कि उन्होंने जिस प्रक्रिया का इस्तेमाल किया, उसका सही वर्णन किया है, लेकिन मेरे पास अभी भी इस दृष्टिकोण के साथ गंभीर सामग्री है।
एडम जूल

LAU1LU1AU2YU2LLAYAYAYE[Y|A,L]AU1LU2Y

9

यह शानदार सवाल और @ एडमो का व्यापक जवाब इस बात का एक प्रमुख उदाहरण है कि कैसे सीवी नियमित रूप से मानवता में मेरे विश्वास को नवीनीकृत करता है। मैं यहाँ मुख्य रूप से उस उत्तर (और ओपी के प्रश्न) की सराहना करने के कुछ तरीकों की पेशकश करना चाहता हूँ।

सबसे पहले, मैं यह दावा करने के लिए उद्यम करता हूं कि सांख्यिकीय अभ्यास के बारे में सभी विश्वसनीय सलाह प्रकृति में सावधानी है - पूर्व स्क्रिप्ट के बजाय प्रो स्क्रिप्टिव। उदाहरण के लिए, जेलमैन और हिल पॉइंट # 3, जबकि यह सतही रूप से पढ़ता है कि सक्रिय रूप से कुछ करने के लिए सलाह ("विचार"), वास्तव में बेहतर समझा जाता है कि शक्तिशाली प्रभावों के साथ बातचीत पर विचार करने में विफल होने के खिलाफ सावधानी बरती जाए । अंतर्मुखी रूप से एक (बहुभिन्नरूपी) टेलर श्रृंखला विस्तार में सबसे महत्वपूर्ण शब्दों को चुनने के साथ जुड़े अंतर्ज्ञान के लिए अपील के रूप में , यह मेरे लिए अविश्वसनीय लगता है।

दूसरे, जबकि ओपी अधिकांश पीएचडी बायोस्टैटिस्टों की तुलना में बेहतर शिक्षा प्राप्त करने में व्यस्त है (एडमो के उद्धरणों का पालन करके), ओपी डेविड ए। फ्रीडमैन के सांख्यिकीय मॉडल और कॉसल इनविज़न [1] भी उठा सकता है , जहां एक स्वस्थ चुनौती होगी माना जाता है कि नैदानिक ​​अनुसंधान में प्रतिगमन हमारा प्राथमिक उपकरण होना चाहिए। मैं विशेष रूप से अध्याय 3, "सांख्यिकीय मॉडल और जूता चमड़ा" की सिफारिश करता हूं, जो यहां पहले से प्रकाशित रूप [2] में भी उपलब्ध है । (पत्रिका का नाम आप बंद न होने दें; तैयार किए गए प्रमुख पाठ जॉन स्नो की हैजा की जांच से हैं। यह उत्तर भी देखें , जहां ये पाठ कुछ विस्तार से दिए गए हैं।)

अंत में - और शायद यह वास्तव में फ्रीडमैन के लिए एक कोरोलरी है - यह उल्लेख किया जाना चाहिए कि ओपी द्वारा पेश किए गए उदाहरण 'निष्कर्ष' वास्तव में पेपर के परिणाम अनुभाग में होंगे। यह जितनी जल्दी हो सके विचार करने के लिए सबसे स्वस्थ होगा कि कागज के वास्तविक निष्कर्ष और चर्चा अनुभागों को कैसे शब्दबद्ध किया जाएगा, ताकि डॉक्टरों, मीडिया और यहां तक ​​कि रोगियों की बढ़ती संख्या और उनके बिछाने की वकालत की जा सके, जो वीरता से करते हैं चिकित्सा साहित्य को पढ़ने के लिए श्रम। उस अंतिम बिंदु पर ध्यान बनाए रखना उपयोगी रूप से सांख्यिकीय विश्लेषण के तकनीकी कार्य को आकार देगा, और इसे उस दुनिया की वास्तविकता में जमीन पर रख देगा जिसका वर्णन करना इसका उद्देश्य है, और इसकी आवश्यकताओं का उद्देश्य सेवा करना है।


  1. फ्रीडमैन, डेविड, डेविड कोलियर, जसजीत सिंह सेखों और फिलिप बी। स्टार्क। सांख्यिकीय मॉडल और कारण आविष्कार: सामाजिक विज्ञान के साथ एक संवाद। कैम्ब्रिज; न्यूयॉर्क: कैम्ब्रिज यूनिवर्सिटी प्रेस, 2010।

  2. फ्रीडमैन, डेविड ए। "सांख्यिकीय मॉडल और जूता चमड़ा।" समाजशास्त्रीय पद्धति 21 (1991): 291–313। डोई: 10.2307 / 270,939।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.