व्याख्यात्मक बनाम भविष्य कहनेवाला मॉडलिंग पर व्यावहारिक विचार


70

अप्रैल में वापस, मैंने यूएमडी मठ विभाग सांख्यिकी समूह संगोष्ठी श्रृंखला में एक चर्चा में भाग लिया, जिसे "समझाने या भविष्यवाणी करने के लिए" कहा गया। यह बात प्रो गैलीट श्मुइली ने दी, जो यूएमडी के स्मिथ बिजनेस स्कूल में पढ़ाते हैं। उसकी बात शोध पर आधारित थी, जो उसने "प्रिडिक्टिव बनाम एक्सप्लानेटरी मॉडलिंग इन आईएस रिसर्च" शीर्षक के पेपर के लिए किया था , और एक फॉलोइंग वर्किंग पेपर जिसका शीर्षक "To Explain or To Predict?"

डॉ। श्मुइली का तर्क यह है कि सांख्यिकीय मॉडलिंग के संदर्भ में पूर्वानुमान और व्याख्यात्मक शब्द टकरा गए हैं, और सांख्यिकीय साहित्य में मतभेदों की गहन चर्चा नहीं होती है। कागज में, वह दोनों के विपरीत है और उनके व्यावहारिक प्रभाव के बारे में बात करती है। मैं आपको पेपर पढ़ने के लिए प्रोत्साहित करता हूं।

व्यवसायी समुदाय के लिए मैं जो प्रश्न करना चाहता हूँ वे हैं:

  • आप व्याख्यात्मक / वर्णनात्मक बनाम बनाम एक पूर्वानुमानात्मक अभ्यास को कैसे परिभाषित करते हैं? यदि आप विशिष्ट एप्लिकेशन के बारे में बात कर सकते हैं तो यह उपयोगी होगा।
  • क्या आप कभी दूसरे का उपयोग करने के लिए एक का उपयोग करने के जाल में पड़ गए हैं? मेरे पास निश्चित रूप से है। आप कैसे जानते हैं कि किसका उपयोग करना है?

2
इस प्रश्न को बंद करने का प्रस्ताव है। देखें: meta.stats.stackexchange.com/questions/213/… मैं देखता हूं कि इसमें 2 वोट हैं। क्या मतदाता या ओपी टिप्पणी कर सकते हैं कि वे इस सवाल को मेटा थ्रेड में खुला क्यों देखना चाहेंगे?

9
यह कहने के बजाय "यह बंद होना चाहिए। किसी को इसका बचाव करना चाहिए" यह बताने के बारे में कि आप इसे बंद क्यों करना चाहते हैं। बहुत ही अस्पष्ट? फिर स्पष्टीकरण मांगें। यह मेरे लिए एक उचित प्रश्न लगता है। प्रश्नकर्ता एक पेपर प्रस्तुत करता है और अंतर के बारे में पूछता है कि यह पूर्वानुमान और व्याख्यात्मक आंकड़ों के बीच का अंतर है। प्रश्न में मैं केवल एक ही बदलाव करूँगा, यह है कि इस प्रश्न को स्पष्ट रूप से स्पष्ट करना ताकि इस प्रकार मतदान करना आसान हो।
जद लॉन्ग

2
मैं पहले ही मेटा थ्रेड पर एक कारण की पेशकश कर चुका हूं। मुझे लगता है कि प्रश्न के बारे में 'मेटा चर्चा' इस विशेष पृष्ठ को अव्यवस्थित कर देगी।

2
@ श्रीकांत @ जद मैं सवाल उठाऊंगा। प्रतिक्रिया के लिए धन्यवाद। मुझे लगता है कि यह एक ऐसा विषय है जो चर्चा का गुण है।
वल्हुलु

4
क्या आप ऊपर बताई गई बातों / पत्रों के लिए उचित लिंक जोड़ सकते हैं?
CHL

जवाबों:


39

एक वाक्य में

प्रेडिक्टिव मॉडलिंग सब के बारे में है "क्या होने की संभावना है?", जबकि व्याख्यात्मक मॉडलिंग सभी के बारे में है "हम इसके बारे में क्या कर सकते हैं?"

कई वाक्यों में

मुझे लगता है कि मुख्य अंतर यह है कि विश्लेषण के साथ क्या करना है। मेरा सुझाव है कि भविष्यवाणी की तुलना में हस्तक्षेप के लिए स्पष्टीकरण बहुत महत्वपूर्ण है । यदि आप किसी परिणाम को बदलने के लिए कुछ करना चाहते हैं, तो आपको सबसे अच्छा यह समझाने की ज़रूरत थी कि यह ऐसा क्यों है। व्याख्यात्मक मॉडलिंग, अगर अच्छी तरह से किया जाता है, तो आपको बताएगा कि कैसे हस्तक्षेप करना है (किस इनपुट को समायोजित किया जाना चाहिए)। हालांकि, यदि आप केवल यह समझना चाहते हैं कि भविष्य कैसा होगा, बिना किसी इरादे (या क्षमता) के हस्तक्षेप करने के लिए, तो भविष्य कहनेवाला मॉडलिंग उपयुक्त होने की अधिक संभावना है।

एक अविश्वसनीय रूप से ढीले उदाहरण के रूप में, "कैंसर डेटा" का उपयोग करते हुए।

यदि आप विभिन्न अस्पतालों के कैंसर वार्डों की फंडिंग कर रहे हैं, तो "कैंसर डेटा" का उपयोग करते हुए भविष्यवाणियाँ करना उचित (या कम से कम उपयोगी) होगा। आपको वास्तव में यह समझाने की आवश्यकता नहीं है कि लोगों को कैंसर क्यों होता है, बल्कि आपको केवल एक सटीक अनुमान की आवश्यकता है कि सेवाओं की कितनी आवश्यकता होगी। व्याख्यात्मक मॉडलिंग शायद यहाँ बहुत मदद नहीं करेगा। उदाहरण के लिए, यह जानते हुए कि धूम्रपान से कैंसर का अधिक खतरा होता है, यह आपको स्वयं नहीं बताता है कि वार्ड ए या वार्ड बी को अधिक धन देना है या नहीं।

"कैंसर डेटा" की व्याख्यात्मक मॉडलिंग उचित होगी यदि आप राष्ट्रीय कैंसर दर को कम करना चाहते हैं - भविष्य कहनेवाला मॉडलिंग यहां काफी अप्रचलित होगा। कैंसर की दरों की सटीक भविष्यवाणी करने की क्षमता शायद ही आपको यह तय करने में मदद करने की संभावना है कि इसे कैसे कम किया जाए। हालाँकि, यह जानना कि धूम्रपान से कैंसर का खतरा अधिक होता है, बहुमूल्य जानकारी है - क्योंकि यदि आप धूम्रपान की दर कम करते हैं (जैसे कि सिगरेट को और अधिक महंगा बनाकर), तो इससे कम जोखिम वाले अधिक लोग होते हैं, (उम्मीद है) कैंसर में अपेक्षित कमी आती है दरें।

इस तरह से समस्या को देखते हुए, मुझे लगता है कि व्याख्यात्मक मॉडलिंग मुख्य रूप से उन चर पर ध्यान केंद्रित करेगी जो उपयोगकर्ता के नियंत्रण में हैं, प्रत्यक्ष या अप्रत्यक्ष रूप से। अन्य चर को इकट्ठा करने की आवश्यकता हो सकती है, लेकिन यदि आप विश्लेषण में किसी भी चर को नहीं बदल सकते हैं, तो मुझे संदेह है कि व्याख्यात्मक मॉडलिंग उपयोगी होगी, सिवाय शायद आपको उन चर पर नियंत्रण या प्रभाव प्राप्त करने की इच्छा के। जो महत्वपूर्ण हैं। भविष्य कहनेवाला मॉडलिंग, गंभीर रूप से, बस चर के बीच संघों की तलाश करता है, चाहे उपयोगकर्ता द्वारा नियंत्रित किया जाए या नहीं। भविष्यवाणी करने के लिए आपको केवल इनपुट / सुविधाएँ / स्वतंत्र चर / आदि जानने की आवश्यकता है, लेकिन आपको हस्तक्षेप करने और परिणाम बदलने के लिए इनपुट / सुविधाओं / स्वतंत्र चर / आदि को संशोधित करने या प्रभावित करने में सक्षम होने की आवश्यकता है। ।


9
+1, अच्छा किया! मैं नाइटपिक से नफरत करता हूं, लेकिन मैं यह नोट करना चाहता हूं कि भविष्यवाणी भविष्य के बारे में नहीं है। उदाहरण के लिए, एक पुरातत्वविद् पूर्व में पता चला निशान (यानी, वर्षा के प्रभाव) के ज्ञान के आधार पर एक क्षेत्र में वर्षा के स्तर को निर्धारित करना चाहते हैं (जो कि वर्षा के प्रभाव को छोड़ सकते हैं)।
गंग

@ गंग - मुझे लगा कि मैंने अपनी प्रतिक्रिया व्यक्त की ताकि ऐसा न हो। स्पष्ट रूप से, मुझे एक जगह याद आती है :-)
प्रायिकतालोगिक

अच्छा जवाब। मुझे लगता है कि भविष्य में क्या और क्यों दिखता है, यह जानने के लिए हमें कई मामलों की आवश्यकता है। मान लीजिए, ग्राहक मंथन का अध्ययन करते समय, आप जानना चाहते हैं कि अगले महीने कितने ग्राहक (और वास्तव में कौन से ग्राहक) मंथन करते हैं और फिर वे इतना मंथन क्यों करते हैं कि विपणन उन्हें बनाए रखने में हस्तक्षेप कर सके। फिर हमें भविष्यवाणियां (भविष्य की संख्या और ग्राहकों को जानने के लिए) और व्याख्यात्मक दोनों की आवश्यकता है ताकि हमें यह बताया जा सके, ताकि हम मंथन को कम कर सकें। तो, क्या हमारे पास दोनों या एक के संकर मॉडल हैं? वार्टी ने यह कहकर उसे छू लिया "ज्ञात संबंध एक व्याख्यात्मक / वर्णनात्मक विश्लेषण या किसी अन्य तकनीक से उभर सकता है"
एस्पांता

@ गुंग आई को नाइटपिक पसंद है: पुरातत्वविद् अपने भविष्य में अनुभवों की भविष्यवाणी करने की इच्छा रखते हैं (यानी, भविष्यवाणी करते हुए कि वह भविष्य में किसी बिंदु पर पिछले उच्च वर्षा के निशान पाएंगे)।
एलेक्सिस

@ एलेक्सिस, यह निश्चित रूप से संभव है, लेकिन यह भी संभव है कि यह पुरातत्वविद् का प्राथमिक शोध हित नहीं है, और यह कि डेटा पहले से ही अन्य शोधकर्ताओं (जीवाश्मिकीविदों) द्वारा एकत्र किए गए हैं और पुरातत्वविद उन आंकड़ों का उपयोग करना चाहते हैं जो कि परीक्षण करने के लिए हैं उनकी प्राथमिक सैद्धांतिक रुचि ( गिल, 200 )।
गंग

30

मेरे विचार में अंतर इस प्रकार हैं:

व्याख्यात्मक / वर्णनात्मक

व्याख्यात्मक / वर्णनात्मक उत्तर की तलाश करते समय प्राथमिक फोकस हमारे पास मौजूद डेटा पर होता है और हम शोर के बाद डेटा के बीच अंतर्निहित संबंधों की खोज करना चाहते हैं।

उदाहरण: क्या यह सच है कि नियमित रूप से (प्रति दिन 30 मिनट कहते हैं) व्यायाम करने से रक्तचाप कम होता है? इस प्रश्न का उत्तर देने के लिए हम समय के साथ रोगियों से उनके व्यायाम आहार और उनके रक्तचाप के मूल्यों के बारे में डेटा एकत्र कर सकते हैं। लक्ष्य यह देखना है कि क्या हम व्यायाम में बदलाव से रक्तचाप में बदलाव की व्याख्या कर सकते हैं।

ब्लड प्रेशर केवल अन्य कारकों की विस्तृत विविधता द्वारा व्यायाम से प्रभावित होता है जैसे कि एक व्यक्ति सोडियम की मात्रा इत्यादि। इन अन्य कारकों को उपरोक्त उदाहरण में शोर माना जाएगा क्योंकि ध्यान व्यायाम एक्सरसाइज और के बीच संबंधों को छेड़ने पर है। रक्त चाप।

भविष्यवाणी

भविष्य कहनेवाला अभ्यास करते समय, हम हाथ में मौजूद डेटा के बीच ज्ञात संबंधों का उपयोग करके अज्ञात में एक्सट्रपलेशन कर रहे हैं । ज्ञात संबंध व्याख्यात्मक / वर्णनात्मक विश्लेषण या किसी अन्य तकनीक से उभर सकता है।

उदाहरण: यदि मैं प्रति दिन 1 घंटा व्यायाम करता हूं तो मेरा रक्तचाप किस हद तक गिर सकता है? इस प्रश्न का उत्तर देने के लिए, हम रक्तचाप और व्यायाम के बीच पहले से उजागर किए गए संबंध का उपयोग कर सकते हैं ताकि भविष्यवाणी की जा सके।

उपरोक्त संदर्भ में, ध्यान स्पष्टीकरण पर नहीं है, हालांकि एक व्याख्यात्मक मॉडल भविष्यवाणी प्रक्रिया के साथ मदद कर सकता है। गैर-व्याख्यात्मक दृष्टिकोण (जैसे, तंत्रिका जाल) भी हैं जो अज्ञात रूप से अनुमान लगाने के बिना हमारे ज्ञान को जोड़ने के लिए अच्छे हैं क्योंकि चर के बीच अंतर्निहित संबंध की प्रकृति के रूप में।


6
+1 यह जवाब काफी हद तक स्पष्टीकरण, विवरण और संबंध की भाषा का उपयोग करके भ्रामक जुड़ाव से बचा जाता है। यह स्पष्टता की वांछनीय डिग्री देता है।
whuber

4
स्पष्टीकरण के तहत आपने लिखा है "प्राथमिक फोकस हमारे पास मौजूद डेटा पर है" - मुझे लगता है कि आप यह कहने की कोशिश कर रहे हैं कि कार्य पूर्वव्यापी है (भविष्यवाणी की संभावित प्रकृति के विपरीत)। स्पष्टीकरण में ("कारण स्पष्टीकरण" पढ़ें) वास्तव में सिद्धांत और डोमेन ज्ञान पर एक बड़ा ध्यान केंद्रित है और डेटा का उपयोग इन मान्यताओं / सिद्धांतों का परीक्षण करने के लिए किया जाता है। इसके विपरीत, भविष्यवाणी में यह अधिक डेटा-चालित है और आप रिश्तों के बारे में अधिक खुले दिमाग वाले हैं, क्योंकि आप कार्य-कारण की खोज नहीं कर रहे हैं, बल्कि सहसंबंध के लिए।
गलित शुमेली

@GalitShmueli Reg सिद्धांत / डोमेन ज्ञान- हां, मैं उस बिंदु से सहमत हूं। मैं बस इस बात पर ध्यान केंद्रित करके भविष्यवाणी की दृष्टि के विपरीत स्पष्टीकरण की कोशिश कर रहा था जो मुझे लगता है कि मुख्य अंतर है- चर के मूल्य बनाम बनाम चर के बीच के संबंध का पता लगाना। इस प्रक्रिया में, मैं निश्चित रूप से दो प्रतिमानों के बीच सूक्ष्म बारीकियों की उपेक्षा करने का दोषी हूं।
varty

1
@varty मैं आपकी बात से सहमत हूं: स्पष्टीकरण / विवरण में आप एक समग्र / औसत संबंध / प्रभाव में रुचि रखते हैं जबकि भविष्यवाणी में आप व्यक्तिगत मूल्यों (जरूरी नहीं कि एक्सट्रपलेशन) की भविष्यवाणी करने में रुचि रखते हैं
गैलिट श्मुइली

19

एक व्यावहारिक मुद्दा जो यहां उत्पन्न होता है वह है मॉडलिंग में परिवर्तनशील चयन। एक चर एक महत्वपूर्ण व्याख्यात्मक चर हो सकता है (उदाहरण के लिए, सांख्यिकीय रूप से महत्वपूर्ण है), लेकिन भविष्य कहनेवाला उद्देश्यों के लिए उपयोगी नहीं हो सकता है (यानी, मॉडल में इसका समावेश बदतर भविष्यवाण सटीकता की ओर जाता है)। मैं इस गलती को लगभग हर दिन प्रकाशित पत्रों में देखता हूं।

एक अन्य अंतर प्रमुख घटक विश्लेषण और कारक विश्लेषण के बीच अंतर है। पीसीए का उपयोग अक्सर भविष्यवाणी में किया जाता है, लेकिन स्पष्टीकरण के लिए इतना उपयोगी नहीं है। एफए में रोटेशन का अतिरिक्त चरण शामिल है जो व्याख्या में सुधार करने के लिए किया जाता है (और इसलिए स्पष्टीकरण)। इस बारे में गैलिट श्मुइली के ब्लॉग पर आज एक अच्छी पोस्ट है

अद्यतन: एक तीसरा मामला समय श्रृंखला में उत्पन्न होता है जब एक चर एक महत्वपूर्ण व्याख्यात्मक चर हो सकता है लेकिन यह भविष्य के लिए उपलब्ध नहीं है। उदाहरण के लिए, होम लोन जीडीपी से दृढ़ता से संबंधित हो सकते हैं लेकिन भविष्य के होम लोन की भविष्यवाणी के लिए इसका ज्यादा उपयोग नहीं किया जाता है जब तक कि हमारे पास जीडीपी की अच्छी भविष्यवाणी न हो।


3
क्यों / कैसे एक महत्वपूर्ण व्याख्यात्मक चर भविष्य कहनेवाला सटीकता को कम करेगा?

3
@Srikant। यह तब हो सकता है जब व्याख्यात्मक चर का प्रतिक्रिया चर के साथ कमजोर लेकिन महत्वपूर्ण संबंध होता है। फिर गुणांक सांख्यिकीय रूप से महत्वपूर्ण हो सकता है लेकिन अनुमान लगाने में कठिन है। नतीजतन, भविष्यवाणी की एमएसई बढ़ सकती है जब चर को छोड़ दिया जाने पर तुलना में शामिल किया जाता है। (पूर्वाग्रह इसके समावेश के साथ कम हो जाता है लेकिन विचरण बढ़ जाता है।)
रोब हंडमैन

पहला पैराग्राफ एक बहुत, बहुत अच्छा बिंदु है। फिर भी कभी-कभी इससे भी बदतर होता है; यहां पीएमआईडी: 18052912 एक महान उदाहरण है कि कभी-कभी सेट के शोर भाग पर एक सच्चे मॉडल की तुलना में एक बेहतर मॉडल बनाया जा सकता है - यह स्पष्ट है कि कोई यादृच्छिक डेटा पर एक अच्छा मॉडल कर सकता है, लेकिन यह थोड़ा चौंकाने वाला है ।

1
मेरी अज्ञानता को क्षमा करें, लेकिन आम तौर पर पीसीए के साथ-साथ एफए का एक हिस्सा रोटेशन नहीं है?
अमीरसीमोर्रोस

3
एक सांख्यिकीय रूप से। लेकिन कमजोर भविष्यवक्ता शायद ही कभी भविष्यवाणी या स्पष्टीकरण के लिए प्रभावी होता है। उदाहरण के लिए, यदि एक रेखीय प्रतिगमन समाधान में प्रीड्यूसर एक्स 1 को शामिल किए बिना .40 का एक आरएसक्यू है, और अगर एक्स 1 को शामिल करना उस आरएसक्यू को .01 जोड़ता है, तो एक्स 1 "महत्वपूर्ण" है न तो भविष्यवाणी के लिए और न ही स्पष्टीकरण के लिए।
rolando2

17

हालांकि कुछ लोग उपयोग किए गए मॉडल / एल्गोरिथ्म (जैसे, तंत्रिका जाल = पूर्वसूचक) के संदर्भ में भेद के बारे में सोचना आसान समझते हैं, जो कि व्याख्या / पूर्वानुमान भेद का केवल एक विशेष पहलू है। यहां स्लाइड का एक डेक है जो मैं अपने डेटा माइनिंग कोर्स में दोनों कोणों से रैखिक प्रतिगमन सिखाने के लिए उपयोग करता हूं। अकेले रैखिक प्रतिगमन के साथ और इस छोटे उदाहरण के साथ विभिन्न मुद्दे उभर कर आते हैं जो व्याख्यात्मक बनाम भविष्य कहे जाने वाले लक्ष्यों (चर, चर चयन, प्रदर्शन के उपाय, आदि) के लिए अलग-अलग मॉडल की ओर ले जाते हैं।

Galit


5
जिज्ञासा से बाहर, क्या यह जानबूझकर है कि भविष्यवाणी के लिए प्रतिगमन की आपकी चर्चा में (पी। 33) आप प्रशिक्षण और सत्यापन डेटासेट (चरण 3) में विभाजन से पहले भविष्यवक्ता (चरण 1) चुनते हैं ? मैंने सोचा है कि सबसे उद्देश्यपूर्ण और ईमानदार प्रक्रिया स्कैप्लेट्स (चरण 2) को देखने से पहले ही शुरू में विभाजन करना होगा। यदि संपूर्ण डेटासेट के आधार पर रजिस्टरों को चुना जाता है, तो क्या वे कई परीक्षणों पर स्पष्ट महत्व के स्तर को नहीं बढ़ाते हैं, जबकि वे बाद में सत्यापन डेटा पर लागू होते हैं?
whuber

मुझे लगता है कि अधिक सामान्य प्रश्न यह है कि क्या होल्ड रखने से पहले आप डेटा विज़ुअलाइज़ेशन करते हैं। जब डेटासेट बड़ा होता है, तब यह वास्तव में मायने नहीं रखता। एक छोटे से नमूने के साथ, भविष्यवक्ताओं को चुनने के लिए दृश्य का उपयोग करना वास्तव में खतरनाक है। मेरी स्लाइड में मेरा मतलब चर चयन के लिए विज़ुअलाइज़ेशन का उपयोग करना नहीं है। "सिलेक्टेड प्रेडिक्टर्स" अधिक सामान्यतः "उपलब्ध प्रेडिक्टर्स का एक संभावित सेट चुनें जो उचित हो"। यह एक उचित सेट का चयन करने के लिए डोमेन ज्ञान को शामिल करने के बारे में अधिक है।
गलित शुमेली १४'१२ को १५:१५

"समझाने या भविष्यवाणी करने के लिए" विषय को जारी रखते हुए, मेरे पास यहां एक संबंधित प्रश्न है । मैं सराहना करूँगा यदि आपने एक नज़र डाला क्योंकि सवाल ज्यादातर आपके पेपर पर आधारित है।
रिचर्ड हार्डी

प्रोफेसर श्मुइली, आप इस विषय पर अपने पेपर के पृष्ठ 291 पर कहते हैं कि आप केवल is नॉनस्टोचस्टिक भविष्यवाणी ’पर विचार कर रहे हैं, जैसा कि गिसेसर, 1993 द्वारा परिभाषित किया गया था। मैं नॉनस्टॉस्टिक भविष्यवाणी की पूरी परिभाषा खोजने के लिए कहां जाऊंगा? खुशी है कि मैं एक नया पोस्ट शुरू करूंगा, लेकिन सोचा कि मैं यहां पहले पूछूंगा।
user0

11

उदाहरण: एक उत्कृष्ट उदाहरण जो मैंने देखा है वह मानव प्रदर्शन की भविष्यवाणी करने के संदर्भ में है। आत्म-प्रभावकारिता (यानी, जिस हद तक एक व्यक्ति सोचता है कि वे एक कार्य को अच्छी तरह से कर सकते हैं) अक्सर कार्य प्रदर्शन का एक मजबूत भविष्यवक्ता होता है। इस प्रकार, यदि आप अन्य चर जैसे बुद्धिमत्ता और पूर्व अनुभव की डिग्री के साथ कई प्रतिगमन में आत्म-प्रभावकारिता डालते हैं, तो आप अक्सर पाते हैं कि आत्म-प्रभावकारिता एक मजबूत भविष्यवक्ता है।

इससे कुछ शोधकर्ताओं ने सुझाव दिया है कि आत्म-प्रभावकारिता कार्य प्रदर्शन का कारण बनती है। और वह प्रभावी हस्तक्षेप वे हैं जो किसी व्यक्ति की आत्म-प्रभावकारिता की भावना को बढ़ाने पर ध्यान केंद्रित करते हैं।

हालांकि, वैकल्पिक सैद्धांतिक मॉडल बड़े पैमाने पर कार्य प्रदर्शन के परिणामस्वरूप आत्म-प्रभावकारिता को देखता है। यानी, यदि आप अच्छे हैं, तो आपको पता चल जाएगा। इस ढांचे में हस्तक्षेप को वास्तविक क्षमता बढ़ाने पर ध्यान देना चाहिए और कथित क्षमता पर नहीं।

इस प्रकार, स्व-प्रभावकारिता जैसे एक चर सहित भविष्यवाणी में वृद्धि हो सकती है, लेकिन यह मानते हुए कि आप स्व-प्रभावकारिता-जैसे-परिणाम मॉडल को अपनाते हैं, इसे एक भविष्यवक्ता के रूप में शामिल नहीं किया जाना चाहिए यदि मॉडल का उद्देश्य प्रदर्शन को पूरा करने वाली कारण प्रक्रियाओं को स्पष्ट करना है।

यह निश्चित रूप से एक कारण सैद्धांतिक मॉडल को विकसित करने और मान्य करने के मुद्दे को उठाता है। यह स्पष्ट रूप से कई अध्ययनों पर निर्भर करता है, आदर्श रूप से कुछ प्रयोगात्मक हेरफेर के साथ, और गतिशील प्रक्रियाओं के बारे में सुसंगत तर्क।

प्रॉक्सिमल बनाम डिस्टल : मैंने ऐसे ही मुद्दों को देखा है जब शोधकर्ता डिस्टल और समीपस्थ कारणों के प्रभाव में रुचि रखते हैं। समीपस्थ कारण, दूर के कारणों से बेहतर भविष्यवाणी करते हैं। हालांकि, सैद्धांतिक रुचि उन तरीकों को समझने में हो सकती है जिनमें डिस्टल और समीपस्थ कारण संचालित होते हैं।

चर चयन मुद्दा : अंत में, सामाजिक विज्ञान अनुसंधान में एक बड़ा मुद्दा चर चयन मुद्दा है। किसी भी अध्ययन में, अनंत संख्या में चर हैं जिन्हें मापा जा सकता था लेकिन नहीं थे। इस प्रकार, सैद्धांतिक व्याख्या करते समय मॉडल की व्याख्या को इसके निहितार्थों पर विचार करने की आवश्यकता है।


"कमजोर परिकल्पना" के सामाजिक विज्ञान में भी एक समस्या है (जैसे प्रभाव सकारात्मक बनाम नकारात्मक है)। और उस "आत्म प्रभावकारिता" उदाहरण में, आप देख सकते हैं कि प्रदर्शन के आंतरिक भविष्यवक्ता के रूप में जिसे प्रत्येक व्यक्ति ने बनाया है। तो यह एक व्याख्यात्मक चर के रूप में "ब्लैक बॉक्स" भविष्यवाणी का उपयोग करने के समान है।
प्रोबेबिलिसलॉजिक

9

सांख्यिकीय मॉडलिंग: एल। ब्रीमन द्वारा दो संस्कृतियां (2001), शायद, इस बिंदु पर सबसे अच्छा कागज है। उनके मुख्य निष्कर्ष (दस्तावेज़ के अंत में अन्य प्रमुख सांख्यिकीविदों के उत्तर भी देखें) इस प्रकार हैं:

  • "उच्च पूर्वानुमानित सटीकता अंतर्निहित डेटा तंत्र के बारे में अधिक विश्वसनीय जानकारी के साथ जुड़ी है। कमजोर पूर्वानुमान सटीकता से संदिग्ध निष्कर्ष निकल सकते हैं।"
  • "एल्गोरिथम मॉडल डेटा मॉडल की तुलना में बेहतर भविष्यवाणियां दे सकता है, और अंतर्निहित तंत्र के बारे में बेहतर जानकारी प्रदान कर सकता है।"

3
बस पहले से संबंधित प्रश्न के साथ एक लिंक बनाने के लिए: द टू कल्चर: सांख्यिकी बनाम मशीन लर्निंग?
CHL

3
एल्गोरिदम मॉडल के साथ समस्या यह है कि उन्हें समझना मुश्किल है। इससे संभावित समस्याओं का निदान और उन्हें ठीक करना मुश्किल हो जाता है। एक संरचनात्मक मॉडल का आकलन करना बहुत आसान है क्योंकि आप जानते हैं कि प्रत्येक घटक को कैसा दिखना चाहिए।
probabilityislogic

8

मैंने उसके काम को लिंक किए गए पेपर के सार से आगे नहीं पढ़ा है, लेकिन मेरी समझ में यह है कि "स्पष्टीकरण" और "भविष्यवाणी" के बीच के अंतर को फेंक दिया जाना चाहिए और अभ्यासकर्ता के उद्देश्यों के बीच अंतर के साथ प्रतिस्थापित किया जाना चाहिए, जो या तो हैं " कारण "या" पूर्वानुमान "। सामान्य तौर पर, मुझे लगता है कि "स्पष्टीकरण" इतना अस्पष्ट शब्द है कि इसका मतलब लगभग कुछ भी नहीं है। उदाहरण के लिए, हुक का कानून व्याख्यात्मक या भविष्य कहनेवाला है? स्पेक्ट्रम के दूसरे छोर पर, स्पष्ट रूप से सटीक सिफारिश प्रणाली हैं जो स्पष्ट आइटम रेटिंग के अच्छे कारण मॉडल हैं? मुझे लगता है कि हम सभी अंतर्ज्ञान को साझा करते हैं कि विज्ञान का लक्ष्य स्पष्टीकरण है, जबकि प्रौद्योगिकी का लक्ष्य भविष्यवाणी है; और यह अंतर्ज्ञान किसी भी तरह से हमारे द्वारा उपयोग किए जाने वाले उपकरणों की निगरानी में खो जाता है, जैसे कि पर्यवेक्षित शिक्षण एल्गोरिदम,

उस सब के बाद, शायद एक ही शब्द है कि मैं एक मॉडल पर लागू होता है व्याख्या करने योग्य है। प्रतिगमन आमतौर पर व्याख्या करने योग्य होते हैं; कई परतों वाले तंत्रिका जाल अक्सर नहीं होते हैं। मुझे लगता है कि लोग कभी-कभी भोलेपन से मानते हैं कि एक मॉडल जो व्याख्या करने योग्य है, कारण संबंधी जानकारी प्रदान कर रहा है, जबकि निर्बाध मॉडल केवल पूर्वानुमान संबंधी जानकारी प्रदान करता है। यह रवैया मुझे बस भ्रमित लगता है।


7

मैं अभी भी थोड़ा अस्पष्ट हूं कि प्रश्न क्या है। कहा जाता है कि, मेरे दिमाग में पूर्वानुमान और व्याख्यात्मक मॉडल के बीच मूलभूत अंतर उनके ध्यान में अंतर है।

व्याख्यात्मक मॉडल

xyβ

भविष्य कहनेवाला मॉडल

प्रेडिक्टिव मॉडल का लक्ष्य कुछ भविष्यवाणी करना है। इस प्रकार, वे पारसमणि या सादगी पर कम ध्यान केंद्रित करते हैं, लेकिन निर्भर चर की भविष्यवाणी करने की उनकी क्षमता पर अधिक ध्यान केंद्रित करते हैं।

हालांकि, ऊपर कुछ हद तक एक कृत्रिम अंतर है क्योंकि व्याख्यात्मक मॉडल का उपयोग भविष्यवाणी के लिए किया जा सकता है और कभी-कभी पूर्वानुमानित मॉडल कुछ समझा सकते हैं।


जटिलता के उल्लेख के लिए +1 जो सीधे शीर्ष उत्तरों द्वारा उल्लिखित नहीं था। हालांकि, चुनौती तब उत्पन्न होती है जब व्याख्यात्मक मॉडल का उपयोग हस्तक्षेप के लिए किया जाता है। कोई यह कैसे सुनिश्चित करता है कि अनुमानित गुणांक पक्षपाती नहीं है जो कि एक सामान्य समस्या है जो पार्सिमोनी से उत्पन्न होती है?
थॉमस स्पीडेल

5

जैसा कि दूसरों ने पहले ही कहा है, भेद कुछ अर्थहीन है, सिवाय इसके कि अभी तक शोधकर्ता के उद्देश्य चिंतित हैं।

ब्रैड एफ्रोन, द टू कल्चर्स पेपर के टिप्पणीकारों में से एक , ने निम्नलिखित अवलोकन किया (जैसा कि मेरे पहले प्रश्न में चर्चा की गई है ):

खुद से भविष्यवाणी केवल कभी-कभी पर्याप्त होती है। पोस्ट ऑफिस किसी भी विधि से खुश है जो हाथ से लिखे गए स्क्रैब से सही पते की भविष्यवाणी करता है। पीटर ग्रेगरी ने भविष्यवाणी के उद्देश्यों के लिए अपना अध्ययन किया, लेकिन हेपेटाइटिस के चिकित्सा आधार को बेहतर ढंग से समझने के लिए भी। अधिकांश सांख्यिकीय सर्वेक्षणों में उनके अंतिम लक्ष्य के रूप में कारण कारकों की पहचान होती है।

कुछ क्षेत्र (जैसे। चिकित्सा) व्याख्यात्मक प्रक्रिया (वितरण, आदि) के रूप में मॉडल फिटिंग पर भारी वजन रखते हैं, अंतर्निहित प्रक्रिया को समझने के साधन के रूप में जो डेटा उत्पन्न करता है। अन्य क्षेत्र इससे कम चिंतित हैं, और एक "ब्लैक बॉक्स" मॉडल के साथ खुश होंगे, जिसमें बहुत अधिक भविष्य कहनेवाला सफलता है। यह मॉडल निर्माण प्रक्रिया में भी अपना काम कर सकता है।


5

सम्मान के साथ, इस सवाल पर बेहतर ध्यान केंद्रित किया जा सकता है। क्या लोगों ने कभी एक शब्द का उपयोग किया जब दूसरे अधिक उपयुक्त थे? हां बिल्कुल। कभी-कभी यह संदर्भ से पर्याप्त स्पष्ट होता है, या आप पांडित्यपूर्ण नहीं होना चाहते हैं। कभी-कभी लोग अपनी शब्दावली में केवल मैला या आलसी होते हैं। यह कई लोगों का सच है, और मैं निश्चित रूप से बेहतर नहीं हूं।

यहाँ क्या संभावित मूल्य है (सीवी पर व्याख्या बनाम भविष्यवाणी पर चर्चा), दो दृष्टिकोणों के बीच अंतर को स्पष्ट करना है। संक्षेप में, कार्य-कारण की भूमिका पर भेद केंद्र। यदि आप दुनिया में कुछ गतिशील को समझना चाहते हैं, और समझाते हैं कि कुछ ऐसा क्यों होता है, तो आपको प्रासंगिक चर के बीच कारण संबंधों की पहचान करने की आवश्यकता होती है। भविष्यवाणी करने के लिए, आप कार्य-कारण की उपेक्षा कर सकते हैं। उदाहरण के लिए, आप इसके कारण के बारे में ज्ञान से एक प्रभाव की भविष्यवाणी कर सकते हैं; आप ज्ञान के कारण के अस्तित्व की भविष्यवाणी कर सकते हैं कि प्रभाव क्या हुआ; और आप दूसरे प्रभाव के ज्ञान द्वारा एक प्रभाव के अनुमानित स्तर की भविष्यवाणी कर सकते हैं जो उसी कारण से संचालित होता है। कोई ऐसा क्यों कर पाएगा? भविष्य में क्या हो सकता है, इसका ज्ञान बढ़ाने के लिए, ताकि वे तदनुसार योजना बना सकें। उदाहरण के लिए, एक पैरोल बोर्ड इस संभावना की भविष्यवाणी करने में सक्षम हो सकता है कि दोषी को पैरोल दिया गया था या नहीं। हालांकि, यह स्पष्टीकरण के लिए पर्याप्त नहीं है। बेशक, दो चर के बीच वास्तविक कारण संबंध का अनुमान लगाना बेहद कठिन हो सकता है। इसके अलावा, मॉडल जो कैप्चर करते हैं (जो माना जाता है) वास्तविक कारण संबंध अक्सर भविष्यवाणियां करने के लिए बदतर होते हैं। तो ऐसा क्यों, फिर? सबसे पहले, यह विज्ञान में किया जाता है, जहां समझदारी अपने स्वयं के लिए अपनाई जाती है। दूसरा, यदि हम मज़बूती से सच्चे कारणों को उठा सकते हैं, और उन्हें प्रभावित करने की क्षमता विकसित कर सकते हैं, तो हम प्रभावों पर कुछ प्रभाव डाल सकते हैं।

सांख्यिकीय मॉडलिंग रणनीति के संबंध में, एक बड़ा अंतर नहीं है। मुख्य रूप से अंतर अध्ययन करने के तरीके में निहित है। यदि आपका लक्ष्य भविष्यवाणी करने में सक्षम है, तो पता करें कि मॉडल के उपयोगकर्ताओं के लिए क्या जानकारी उपलब्ध होगी जब उन्हें भविष्यवाणी करने की आवश्यकता होगी। वे जानकारी जिनके पास पहुंच नहीं है उनका कोई मूल्य नहीं है। यदि वे सबसे अधिक संभावना चाहते हैं कि भविष्यवक्ताओं के एक निश्चित स्तर (या एक संकीर्ण सीमा के भीतर) की भविष्यवाणी करने में सक्षम हों, तो उस स्तर पर भविष्यवक्ता की सैंपल रेंज को केंद्र में रखने और वहां ओवरस्प्ले करने का प्रयास करें। उदाहरण के लिए, अगर एक पैरोल बोर्ड ज्यादातर 2 प्रमुख दोषियों के साथ अपराधियों के बारे में जानना चाहता है, तो आप 1, 2 और 3 दोषियों के साथ अपराधियों के बारे में जानकारी एकत्र कर सकते हैं। दूसरी ओर, एक चर के कारण की स्थिति का मूल्यांकन करने के लिए मूल रूप से एक प्रयोग की आवश्यकता होती है। अर्थात्, प्रयोगात्मक इकाइयों को व्याख्यात्मक चर के निर्धारित स्तर तक यादृच्छिक पर सौंपा जाना चाहिए। यदि इस बात की चिंता है कि कारण प्रभाव की प्रकृति किसी अन्य चर पर आकस्मिक है या नहीं, तो उस चर को प्रयोग में शामिल किया जाना चाहिए। यदि एक सच्चे प्रयोग का संचालन करना संभव नहीं है, तो आप एक अधिक कठिन स्थिति का सामना करते हैं, एक जो यहां जाने के लिए बहुत जटिल है।


1
(x,y,z,v)z(x,y,v)विश्लेषण का। अपने अंतिम पैराग्राफ को फिर से शुरू करें, इस साइट पर कई खाते हैं जो रणनीति में तेज अंतर से जुड़े हैं।
whuber

1
आप सही हैं यह अध्ययन के उद्देश्य पर टिका है। मुझे लगता है कि मैंने यह स्पष्ट नहीं किया था (मैंने केवल इस बारे में बात की थी कि आप क्या हासिल करना चाहते हैं )। यह भी सच है कि स्पष्टीकरण का कार्य-कारण से ठीक-ठीक संबंध नहीं है - कार्य-कारण के अनुरूप कुछ भी उचित है (जैसे, आयाम - आयतन का मामला तार्किक / गणितीय निहितार्थ में से एक है)। हालांकि, अधिकांश व्याख्यात्मक मॉडलिंग कारण पर केंद्र; मुझे लगता है कि मुझे लगा कि मैं सादगी के लिए उस तरह की चीज को छोड़ सकता हूं। अंत में, अध्ययन के डिजाइन और डेटा संग्रह के दौरान रणनीति भिन्न होती है, लेकिन x पर y को पुनः प्राप्त करना बहुत अधिक है।
गंग

जवाब देने के लिए धन्यवाद। इस साइट पर अन्य एक्सचेंजों से मैंने लेखक के बैकग्राउंड और अनुभव को प्रतिबिंबित करने के बजाय "स्पष्टवादिता पर सबसे अधिक व्याख्यात्मक मॉडलिंग केंद्र" जैसे सार्वभौमिक बयानों को समझने के बजाय शाब्दिक रूप से सच होने के लिए सीखा है। भौतिक और "कठिन" विज्ञानों में यह कथन सही हो सकता है, लेकिन सामाजिक और "नरम" विज्ञानों में मुझे संदेह है कि चिकित्सक ऐसा मजबूत दावा करेंगे। अक्सर, वास्तव में, अध्ययन के तहत संबंधों को सामान्य छिपे हुए कारणों के लिए माना जाता है, लेकिन regressors और regressand के बीच प्रत्यक्ष कारण को प्रतिबिंबित नहीं करते हैं।
whuber

@ जब भी यह निश्चित रूप से सच है कि मेरे विचार मेरी पृष्ठभूमि और अनुभव से प्रभावित हैं। यदि यह उत्तर उपयोगी नहीं है (मुझे लगता है कि कोई वोट नहीं मिला है), मैं इसे हटा सकता हूं। कई अन्य लोगों ने उत्तर दिए हैं जो उन विचारों को शामिल करते हैं जो मैं व्यक्त करने के लिए था।
गुंग

@ वाउबर - सॉफ्ट कॉजेल्टी का एक अच्छा उदाहरण है "धूम्रपान का कारण कैंसर" है-हालांकि मुझे यकीन है कि आपको एक चेन धूम्रपान करने वाला मिल सकता है जिसके पास कैंसर नहीं है। घटनाओं के समय के साथ कार्य-कारण की धारणा आपस में जुड़ी हुई है। कारण प्रभाव से पहले होना चाहिए - जो बताता है कि क्यूब उदाहरण का कोई मतलब नहीं है।
प्रोबेबिलिसलॉजिक

4

अधिकांश उत्तरों ने स्पष्ट करने में मदद की है कि स्पष्टीकरण के लिए मॉडलिंग क्या है और भविष्यवाणी के लिए मॉडलिंग क्या है और वे अलग क्यों हैं। इस प्रकार जो स्पष्ट नहीं है, वह यह है कि वे कैसे भिन्न हैं। इसलिए, मैंने सोचा कि मैं एक उदाहरण पेश करूंगा जो उपयोगी हो सकता है।

मान लीजिए कि हम अकादमिक तैयारी के एक समारोह के रूप में मॉडलिंग कॉलेज जीपीए में शामिल हैं। अकादमिक तैयारी के उपायों के रूप में, हमारे पास:

  1. एप्टीट्यूड टेस्ट स्कोर;
  2. एचएस जीपीए; तथा
  3. एपी टेस्ट की संख्या उत्तीर्ण।

भविष्यवाणी के लिए रणनीति

यदि लक्ष्य भविष्यवाणी है, तो मैं इन सभी चर का उपयोग एक साथ एक रैखिक मॉडल में कर सकता हूं और मेरी प्राथमिक चिंता भविष्य कहनेवाला सटीकता होगी। कॉलेज जीपीए की भविष्यवाणी के लिए चर में से जो भी सबसे उपयोगी साबित होगा, उसे अंतिम मॉडल में शामिल किया जाएगा।

स्पष्टीकरण के लिए रणनीति

यदि लक्ष्य स्पष्टीकरण है, तो मैं डेटा में कमी के बारे में अधिक चिंतित हो सकता हूं और स्वतंत्र चर के बीच संबंध के बारे में ध्यान से सोच सकता हूं। मेरी प्राथमिक चिंता गुणांक की व्याख्या करना होगा।

उदाहरण

सहसंबद्ध भविष्यवक्ताओं के साथ एक विशिष्ट बहुभिन्नरूपी समस्या में, "अप्रत्याशित" होने वाले प्रतिगमन गुणांक का निरीक्षण करना असामान्य नहीं होगा। स्वतंत्र चरों के बीच अंतर्संबंधों को देखते हुए, इनमें से कुछ चरों के लिए आंशिक गुणांक देखना आश्चर्यजनक नहीं होगा, जो उनके शून्य-क्रम संबंधों के समान दिशा में नहीं हैं और जो समझाने के लिए काउंटर सहज और कठिन लग सकते हैं।

उदाहरण के लिए, मान लीजिए कि मॉडल का सुझाव है कि (एप्टीट्यूड टेस्ट स्कोर और एपी टेस्ट की संख्या को सफलतापूर्वक ध्यान में रखते हुए) उच्चतर हाई स्कूल जीपीए, लोअर कॉलेज जीपीए से जुड़े हैं । यह भविष्यवाणी के लिए कोई समस्या नहीं है, लेकिन यह एक व्याख्यात्मक मॉडल के लिए समस्याएं पैदा करता है जहां इस तरह के संबंध की व्याख्या करना मुश्किल है । यह मॉडल नमूना भविष्यवाणियों में से सबसे अच्छा प्रदान कर सकता है, लेकिन यह अकादमिक तैयारी और कॉलेज जीपीए के बीच संबंधों को समझने में हमारी मदद करने के लिए बहुत कम है।

इसके बजाय, एक व्याख्यात्मक रणनीति परिवर्तनीय कमी के कुछ रूप की तलाश कर सकती है, जैसे कि प्रमुख घटक, कारक विश्लेषण, या SEM:

  1. उस चर पर ध्यान केंद्रित करें जो "अकादमिक प्रदर्शन" का सबसे अच्छा उपाय है और उस एक चर पर मॉडल कॉलेज जीपीए; या
  2. मूल चरों की बजाय अकादमिक तैयारी के तीन उपायों के संयोजन से प्राप्त फैक्टर स्कोर / अव्यक्त चर का उपयोग करें।

इस तरह की रणनीतियाँ मॉडल की अनुमानित शक्ति को कम कर सकती हैं, लेकिन वे एक बेहतर समझ पैदा कर सकती हैं कि शैक्षणिक तैयारी कॉलेज पीपीए से कैसे संबंधित है।


काउंटर-सहज ज्ञान युक्त संकेत के बारे में, मुझे आश्चर्य है कि क्या यह इसलिए है क्योंकि हमारा अंतर्ज्ञान गलत कोवरिएट की व्याख्या कर रहा है - एक मुख्य प्रभाव की तरह जैसे कि यह नेस्टेड या इंटरैक्शन प्रभाव था।
प्रोबेबिलिसलॉजिकल

3

मैं मामले पर एक मॉडल-केंद्रित दृश्य प्रस्तुत करना चाहता हूं।

प्रीडिक्टिव मॉडलिंग वही होती है जो ज्यादातर एनालिसिस में होती है। उदाहरण के लिए, एक शोधकर्ता भविष्यवाणियों के एक समूह के साथ एक प्रतिगमन मॉडल स्थापित करता है। प्रतिगमन गुणांक तब समूहों के बीच भविष्य कहनेवाला तुलना का प्रतिनिधित्व करता है। अनुमानित पहलू संभावना मॉडल से आता है: एक सुपरपॉपुलेशन मॉडल के संबंध में अनुमान लगाया जाता है जिसने मनाया आबादी या नमूना का उत्पादन किया हो सकता है। इस सुपरपॉप्युलेशन से निकलने वाली इकाइयों के लिए नए परिणामों की भविष्यवाणी करना इस मॉडल का उद्देश्य है। अक्सर, यह एक व्यर्थ उद्देश्य है क्योंकि चीजें हमेशा बदलती रहती हैं, खासकर सामाजिक दुनिया में। या क्योंकि आपका मॉडल देशों जैसी दुर्लभ इकाइयों के बारे में है और आप एक नया नमूना नहीं बना सकते हैं। इस मामले में मॉडल की उपयोगिता विश्लेषक की प्रशंसा के लिए छोड़ दी गई है।

जब आप अन्य समूहों या भविष्य की इकाइयों के परिणामों को सामान्य बनाने की कोशिश करते हैं, तो यह अभी भी एक अलग तरह की भविष्यवाणी है। हम इसे उदाहरण के लिए पूर्वानुमान कह सकते हैं। मुख्य बिंदु यह है कि अनुमानित मॉडल की अनुमानित शक्ति, डिफ़ॉल्ट रूप से, वर्णनात्मक प्रकृति की है। आप समूहों में एक परिणाम की तुलना करते हैं और इन तुलनाओं के लिए एक संभाव्यता मॉडल की परिकल्पना करते हैं, लेकिन आप यह निष्कर्ष नहीं निकाल सकते हैं कि ये तुलनात्मक प्रभाव उत्पन्न करते हैं।

कारण यह है कि ये समूह चयन पूर्वाग्रह से ग्रस्त हो सकते हैं । Ie, वे स्वाभाविक रूप से ब्याज के परिणाम में उच्च स्कोर, उपचार के बावजूद (काल्पनिक कारण हस्तक्षेप) हो सकता है। या वे अन्य समूहों की तुलना में एक अलग उपचार प्रभाव आकार के अधीन हो सकते हैं। यही कारण है कि, विशेष रूप से अवलोकन डेटा के लिए, अनुमानित मॉडल आमतौर पर भविष्य कहनेवाला तुलना के बारे में हैं और स्पष्टीकरण नहीं। स्पष्टीकरण कारण प्रभाव की पहचान और आकलन के बारे में है और इसके लिए अच्छी तरह से डिजाइन किए गए प्रयोगों या विचारशील उपयोग की आवश्यकता होती है। इस मामले में, भविष्यवाणी की तुलना किसी भी चयन पूर्वाग्रह से कट जाती है और कारण प्रभाव का प्रतिनिधित्व करती है। इस प्रकार मॉडल को व्याख्यात्मक माना जा सकता है।

मैंने पाया कि इन शब्दों में सोचने से अक्सर स्पष्ट होता है कि कुछ आंकड़ों के लिए एक मॉडल स्थापित करते समय मैं वास्तव में क्या कर रहा था।


+1, यहाँ अच्छी जानकारी है। मैं इस कथन के बारे में सतर्क रहूंगा कि "भविष्यवाणी मॉडलिंग में होती है, जो कि अधिकांश विश्लेषणों में होती है"। भविष्यवाणिय मॉडलिंग अधिक सामान्य है या नहीं, अनुशासन से अलग होगा, मेरा अनुमान है कि शिक्षा में अधिकांश मॉडलिंग व्याख्यात्मक है, और यह कि बहुत से मॉडलिंग / डेटा खनन निजी क्षेत्र में किए जाते हैं (जैसे संभावित दोहराए गए ग्राहकों की पहचान) भविष्य कहनेवाला है। मैं आसानी से गलत हो सकता हूं, लेकिन यह कहना मुश्किल होगा, एक प्राथमिकता, जो ज्यादातर समय होती है।
गुंग

1
वैसे, मेरे विचार से, अवलोकन संबंधी डेटा का अधिकांश मॉडलिंग भविष्य कहनेवाला है, भले ही उद्देश्य व्याख्यात्मक हो। यदि आप उपचार के आरोपण को यादृच्छिक नहीं करते हैं और वास्तव में एक प्रयोगात्मक सेटअप में बदलाव के लिए प्रेरित करते हैं, तो आपके प्रतिगमन गुणांक केवल एक वर्णनात्मक मूल्य होंगे, अर्थात, वे केवल पूर्वानुमानात्मक तुलना के साधन प्रदान करते हैं। उदाहरण के लिए, आप जनसांख्यिकीय विशेषताओं के आधार पर स्कूल में सफलता की भविष्यवाणी कर सकते हैं लेकिन इसका मतलब यह नहीं है कि ये जनसांख्यिकी व्याख्यात्मक कारण प्रभाव हैं। कारण यह है कि तुलनात्मक भविष्यवाणियों को चयन पूर्वाग्रह से अवगत कराया जाता है।
लियोनेल हेनरी

1

ब्लैक बॉक्स "प्रेडिक्टिव" मॉडल से हम जितना सोचते हैं उससे बहुत कुछ सीख सकते हैं। कुंजी विभिन्न प्रकार के संवेदनशीलता विश्लेषण चलाने में है और वास्तव में यह समझने के लिए सिमुलेशन है कि INUTUT स्थान में परिवर्तन से OUTPUT कैसे प्रभावित होता है। इस अर्थ में भी एक विशुद्ध रूप से भविष्य कहनेवाला मॉडल व्याख्यात्मक अंतर्दृष्टि प्रदान कर सकता है। यह एक ऐसा बिंदु है जिसे अक्सर अनदेखा किया जाता है या अनुसंधान समुदाय द्वारा गलत समझा जाता है। सिर्फ इसलिए कि हम समझ नहीं पाते हैं कि एल्गोरिथ्म क्यों काम कर रहा है इसका मतलब यह नहीं है कि एल्गोरिथ्म में व्याख्यात्मक शक्ति का अभाव है ...

समग्र रूप से देखने की मुख्य धारा से, प्रायोरिसोलॉजिक का संक्षिप्त उत्तर बिल्कुल सही है ...


यह स्पष्ट नहीं है कि "व्याख्यात्मक अंतर्दृष्टि" को इस तरह से चमकाया जा सकता है, यदि उस वाक्यांश द्वारा आप कार्य-कारण को प्रभावित करते हैं।
गंग

1

वह आंकड़ों में व्याख्यात्मक और भविष्य कहनेवाला अनुप्रयोगों के बीच भेद करती है। वह कहती है कि हमें हर बार पता होना चाहिए कि हम एक या एक का उपयोग करते हैं जो एक बिल्कुल उपयोग किया जा रहा है। वह कहती है कि हम अक्सर उन्हें मिलाते हैं, इसलिए भ्रम हो जाता है

मैं मानता हूं कि सामाजिक विज्ञान अनुप्रयोगों में, अंतर समझदार है, लेकिन प्राकृतिक विज्ञानों में वे समान हैं और समान होना चाहिए। इसके अलावा, मैं उन्हें अनुमान बनाम पूर्वानुमान कहता हूं , और सहमत हूं कि सामाजिक विज्ञानों में उन्हें मिश्रण नहीं करना चाहिए।

मैं प्राकृतिक विज्ञानों से शुरुआत करता हूँ। भौतिकी में हम समझाने पर ध्यान केंद्रित कर रहे हैं, हम यह समझने की कोशिश कर रहे हैं कि दुनिया कैसे काम करती है, क्या कारण है आदि, इसलिए, ध्यान कार्य-कारण, अनुमान और इस तरह है। दूसरी ओर, भविष्य कहनेवाला पहलू भी वैज्ञानिक प्रक्रिया का एक हिस्सा है। वास्तव में, जिस तरह से आप एक सिद्धांत को साबित करते हैं, जिसने पहले से ही टिप्पणियों को अच्छी तरह से समझाया (इन-सैंपल के बारे में), नई टिप्पणियों की भविष्यवाणी करना है और फिर जांचें कि भविष्यवाणी कैसे काम करती है। किसी भी सिद्धांत की भविष्यवाणी की क्षमता में कमी से भौतिकी में स्वीकृति प्राप्त करने में बड़ी परेशानी होगी। यही कारण है कि माइकलसन-मॉर्ले के प्रयोग इतने महत्वपूर्ण हैं।

सामाजिक विज्ञानों में, दुर्भाग्य से, अंतर्निहित घटनाएं अस्थिर हैं, अप्राप्य हैं, अप्रतिरोधी हैं। यदि आप नाभिक क्षय देखते हैं, तो आप हर बार जब आप उन्हें देखते हैं तो आपको वही परिणाम मिलेंगे, और वही परिणाम जो मुझे सौ साल पहले मिले थे। अर्थशास्त्र या वित्त में नहीं। इसके अलावा, प्रयोगों का संचालन करने की क्षमता बहुत ही सीमित है, सभी व्यावहारिक उद्देश्यों के लिए लगभग गैर-मौजूद है, हम केवल यादृच्छिक नमूनों का निरीक्षण और संचालन करते हैंटिप्पणियों का। मैं जारी रख सकता हूं लेकिन यह विचार कि हम जिन घटनाओं से निपटते हैं, वे बहुत अस्थिर हैं, इसलिए हमारे सिद्धांत भौतिकी में समान गुणवत्ता के नहीं हैं। इसलिए, जिन स्थितियों से हम निपटते हैं, उनमें से एक तरीका है कि या तो अनुमान पर ध्यान केंद्रित किया जाए (जब आप यह समझने की कोशिश करें कि क्या कारण या क्या प्रभाव पड़ता है) या पूर्वानुमान (सिर्फ यह कहें कि आपको क्या लगता है कि इस या उस संरचना को अनदेखा करेंगे)।


0

एक स्ट्रक्चरल मॉडल स्पष्टीकरण देगा और एक भविष्यवाणी मॉडल भविष्यवाणी देगा। एक संरचनात्मक मॉडल में अव्यक्त चर होंगे। एक संरचनात्मक मॉडल प्रतिगमन और कारक विश्लेषण की एक साथ परिणति है

अव्यक्त चर भविष्य कहनेवाला मॉडल (प्रतिगमन) में बहु कोलिनिटी के रूप में प्रकट होते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.