क्या मशीन सीखना कार्य-क्षमता को समझने के लिए कम उपयोगी है, इस प्रकार सामाजिक विज्ञान के लिए कम दिलचस्प है?


42

मशीन लर्निंग / अन्य सांख्यिकीय पूर्वानुमान तकनीकों के बीच अंतर की मेरी समझ बनाम सामाजिक वैज्ञानिकों (जैसे, अर्थशास्त्री) का उपयोग करने वाले आंकड़ों की तरह यह है कि अर्थशास्त्रियों को एक या कई चर के प्रभाव को समझने में बहुत रुचि लगती है - दोनों के संदर्भ में परिमाण और पता लगाना कि क्या संबंध कारण है। इसके लिए, आप अपने आप को प्रयोगात्मक और अर्ध-प्रयोगात्मक तरीकों से संबंधित करते हैं, आदि।

मशीन लर्निंग या सांख्यिकीय मॉडलिंग जो कि भविष्य कहनेवाला है, अक्सर इस पहलू की पूरी तरह से उपेक्षा करता है और कई मामलों में आपको एक विशिष्ट डिग्री नहीं देता है, जिसके परिणामस्वरूप एक चर परिणाम को प्रभावित करता है (लॉगिट और प्रोबिट दोनों करते हैं)।

एक संबंधित प्रश्न यह है कि नए डोमेन की भविष्यवाणी करते समय सैद्धांतिक रूप से प्रेरित आर्थिक या व्यवहार मॉडल का किस हद तक नास्तिक मॉडल पर एक फायदा है? मशीन सीखने या भविष्यवाणी करने वाले सांख्यिकीविद क्या कहेंगे जो आलोचना से कहते हैं कि एक आर्थिक मॉडल के बिना, आप नए नमूनों की सही ढंग से भविष्यवाणी नहीं कर पाएंगे, जहां कोवरिएट्स बहुत अलग थे।

मैं सभी दृष्टिकोण से लोगों को इस पर सुनने के लिए वास्तव में खुश हूँ।


सवाल। क्या आपका मतलब 'नास्तिक मॉडल' लिखने से है, और यदि हां, तो आपका क्या मतलब है? या आपका मतलब सिर्फ 'सैद्धांतिक' था?
फहीम मीठा

2
क्या आप शायद जेनरिक बनाम भेदभावपूर्ण मॉडल देख रहे हैं? विवेकशील मॉडल और तकनीकों के प्रति मशीन लर्निंग मशीन।
वेन

@ फहीममिथ: 'एथोरेटिकल': सिद्धांत के बिना।
n

जवाबों:


32

आईएमएचओ कोई औपचारिक अंतर नहीं हैं जो मशीन मॉडल और डेटा के फिटिंग मॉडल के मौलिक स्तर पर अंतर करते हैं। मॉडल की पसंद में सांस्कृतिक अंतर हो सकता है, डेटा के लिए फिटिंग मॉडल के उद्देश्य और कुछ व्याख्याओं का विस्तार कर सकते हैं।

विशिष्ट उदाहरणों में मैं सोच सकता हूं कि हमारे पास हमेशा है

  • MiiII
  • iθiMi

MiθiMi

Mi

जिसे पुराने स्कूल सांख्यिकीय मॉडल चयन कहा जा सकता है, वह स्टेप-वार चयन रणनीतियों के साथ संयुक्त रूप से सांख्यिकीय परीक्षणों पर आधारित है, जबकि मशीन लर्निंग मॉडल चयन आमतौर पर अपेक्षित सामान्यीकरण त्रुटि पर केंद्रित होता है, जिसे अक्सर क्रॉस-मान्यता का उपयोग करके अनुमानित किया जाता है। हालांकि, मॉडल चयन की वर्तमान घटनाक्रम और समझ, एक अधिक सामान्य आधार की ओर अभिसरण करते दिखते हैं, उदाहरण के लिए, मॉडल चयन और मॉडल एवरेजिंग

मॉडल से कार्य-कारण का अनुमान लगाना

इस मामले की जड़ यह है कि हम एक मॉडल की व्याख्या कैसे कर सकते हैं? यदि प्राप्त आंकड़े सावधानीपूर्वक डिजाइन किए गए प्रयोग से हैं और मॉडल पर्याप्त है तो यह प्रशंसनीय है कि हम मॉडल में परिवर्तनशील प्रभाव के रूप में परिवर्तनशील चर के प्रभाव की व्याख्या कर सकते हैं, और यदि हम प्रयोग को दोहराते हैं और इस विशेष चर पर हस्तक्षेप करते हैं हम अनुमानित प्रभाव का निरीक्षण करने की उम्मीद कर सकते हैं। यदि, हालांकि, डेटा अवलोकन योग्य हैं, तो हम यह उम्मीद नहीं कर सकते हैं कि मॉडल में अनुमानित प्रभाव अवलोकन हस्तक्षेप प्रभाव के अनुरूप हैं। इसके लिए अतिरिक्त मान्यताओं की आवश्यकता होगी चाहे वह मॉडल "मशीन लर्निंग मॉडल" हो या "शास्त्रीय सांख्यिकीय मॉडल"।

ऐसा हो सकता है कि लोगों को शास्त्रीय सांख्यिकीय मॉडल का उपयोग करने के लिए प्रशिक्षित किया गया है, जो कि एकतरफा पैरामीटर अनुमानों और प्रभाव के आकार की व्याख्याओं पर ध्यान केंद्रित कर रहे हैं, इस धारणा के हैं कि मशीन फ्रेमवर्क की तुलना में इस ढांचे में एक कारण व्याख्या अधिक मान्य है। मैं कहूंगा कि यह नहीं है।

आँकड़ों में कार्य-कारण का क्षेत्र वास्तव में समस्या को दूर नहीं करता है, लेकिन यह उन धारणाओं को बनाता है जिन पर कारण निष्कर्ष स्पष्ट होता है। उन्हें अस्थिर मान्यताओं के रूप में जाना जाता है । द पेपर कॉजल इनफॉरमेशन इन स्टैटिस्टिक्स: जूडी पर्ल द्वारा एक अवलोकन पढ़ने के लिए एक अच्छा पेपर है। कारण निष्कर्ष से एक प्रमुख योगदान मान्यताओं के तहत कारण प्रभाव के आकलन के लिए तरीकों का संग्रह है जहां वास्तव में अप्रतिबंधित कन्फ़्यूडर हैं, जो अन्यथा एक प्रमुख चिंता का विषय है। पर्ल पेपर में धारा 3.3 देखें। एक अधिक उन्नत उदाहरण एपिडेमियोलॉजी में पेपर मार्जिनल स्ट्रक्चरल मॉडल और कॉजल इंट्रेंस में पाया जा सकता है ।

यह एक विषय-वस्तु का सवाल है कि क्या सबसे ज्यादा मान्यताओं की पकड़ है। वे वास्तव में अस्थिर हैं क्योंकि हम डेटा का उपयोग करके उनका परीक्षण नहीं कर सकते हैं। मान्यताओं को सही ठहराने के लिए अन्य तर्कों की आवश्यकता होती है।

उदाहरण के तौर पर जहां मशीन लर्निंग और कारण संबंधी निष्कर्ष मिलते हैं, लक्षित वैन-लाॅन और डैनियल रुबिन द्वारा लक्षित अधिकतम संभावना सीखने में प्रस्तुत अधिकतम-संभाव्यता अनुमान के विचार आम तौर पर गैर-पैरामीट्रिक मूल्यांकन के लिए मशीन सीखने की तकनीक का "लक्ष्यीकरण" द्वारा पीछा करते हैं। "ब्याज के एक पैरामीटर की ओर। उत्तरार्द्ध बहुत अच्छी तरह से एक कारण व्याख्या के साथ एक पैरामीटर हो सकता है। सुपर लर्नर में विचारब्याज के मापदंडों के आकलन के लिए मशीन सीखने की तकनीक पर बहुत अधिक भरोसा करना है। यह मार्क वैन डेर लान (व्यक्तिगत संचार) का एक महत्वपूर्ण बिंदु है कि शास्त्रीय, सरल और "व्याख्यात्मक" सांख्यिकीय मॉडल अक्सर गलत होते हैं, जो पक्षपाती अनुमानकर्ताओं और अनुमानों की अनिश्चितता के बहुत आशावादी आकलन की ओर जाता है।


इस अविश्वसनीय जवाब के लिए धन्यवाद ... मैं आपके द्वारा प्रदान किए गए सभी लिंक का अनुसरण करने के लिए उत्सुक हूं। मेरे पास एक प्रश्न है, तकनीकों के बारे में। क्या अवलोकन संबंधी डेटा के लिए इंस्ट्रूमेंटल वैरिएबल की तरह मशीन लर्निंग एनालॉग है? इसके अलावा - एक चर के यादृच्छिककरण के मामले में, क्या मशीन सीखने का विकल्प उपचार के दौरान मतभेदों के एक साधारण टी-परीक्षण के सापेक्ष होगा? क्या मशीन सीखने की उत्तर तकनीक की जरूरत है, इससे क्या फायदा होगा?
d_a_c321 17

@dchandler, वाद्य चर के साथ मेरा अनुभव बहुत सीमित है, लेकिन फिर से मुझे मॉडल फिटिंग के लिए मशीन सीखने और सांख्यिकी पद्धति के बीच अंतर करने का कोई औपचारिक कारण नहीं दिखता है , इसलिए आप बहुत अच्छी तरह से वाद्य चर शामिल कर सकते हैं यदि यह एक उद्देश्य प्रदान करता है। मैं पाता हूं कि कार्य-कारण से जुड़ा सबसे दिलचस्प मुद्दा हस्तक्षेप का प्रभाव है। यह मूल रूप से भविष्यवाणियों का प्रश्न है लेकिन शायद अवलोकन डेटा के वितरण के तहत नहीं है।
NRH

ttp

हालांकि हस्तक्षेप करने के बाद, किस तरह के आंकड़े सीखने को रोजगार देंगे? प्रायोगिक डिजाइन के बुनियादी आँकड़े आमतौर पर मस्तिष्क-मृत आसान हैं (टी-टेस्ट के माध्यम से तुलना का मतलब है)। अर्थमिति में, अधिक धारणा के साथ आप विभिन्न मात्राओं या उपचार प्रभावों के वितरण को पुनर्प्राप्त करने का प्रयास कर सकते हैं। एक मशीन लर्निंग विश्लेषण क्या तुलना के साधनों से परे होगा?
d_a_c321

ब्रेन-डेड आसान क्या है, किसी चीज़ की गणना करना इतना आसान नहीं है, इसके लिए जरूरी मान्यताओं को सही ठहराना है। मार्क द्वारा TMLE दृष्टिकोण प्रभाव आकार (सामान्य रूप से, शायद हस्तक्षेप प्रभाव, शायद अवलोकन प्रभाव) के मापदंडों के आकलन पर है और कम प्रतिबंधात्मक मॉडल मान्यताओं के साथ ईमानदार विश्वास अंतराल प्रदान करता है। क्रॉस-मान्यता के आधार पर मॉडल चयन के साथ लचीले मॉडल फिटिंग का उपयोग प्रतिबंधात्मक और गलत, पैरामीट्रिक मॉडल से बचने के लिए किया जाता है।
NRH

10

तथाकथित "कारण निष्कर्ष" के लिए सांख्यिकीय उपकरणों का एक (काफी सीमित) सेट है। ये वास्तव में कारण संबंधों का आकलन करने के लिए डिज़ाइन किए गए हैं और यह सही ढंग से करने के लिए सिद्ध होते हैं। उत्कृष्ट, लेकिन दिल (या मस्तिष्क, उस बात के लिए) के लिए नहीं।

इसके अलावा, कई उदाहरणों में, कार्य-कारण को प्रभावित करने की क्षमता आपके हाथों की तकनीकों की तुलना में आपके डिजाइन का बहुत अधिक परिणाम है: यदि आपके पास अपने प्रयोग में सभी चर पर 'सभी' का नियंत्रण है, और आप देखते हैं कि आपको कुछ हो रहा है ( केवल) एक चर को बदलना, उस चीज़ को कॉल करना उचित है जो उस चीज़ का 'परिणाम' होता है जिसे आप बदलते हैं (दुर्भाग्य से, वास्तविक शोध में, ये चरम मामले वास्तव में शायद ही कभी होते हैं)। एक और सहज लेकिन ध्वनि युक्त तर्क समय-आधारित है: यदि आप यादृच्छिक रूप से (लेकिन नियंत्रित तरीके से) एक चर को बदलते हैं और एक और दिन के बाद बदलता है, तो कार्य-कारण भी कोने में है।

मेरे सभी दूसरे अनुच्छेद अनिवार्य रूप से इस बात पर ध्यान दिए बिना काम करते हैं कि आप किन तरीकों का उपयोग करते हैं, यह जानने के लिए कि कौन से चर किन स्थितियों में परिवर्तित हुए हैं, इसलिए कम से कम सिद्धांत में कोई कारण नहीं है कि मशीन लर्निंग (एमएल) सांख्यिकी आधारित विधियों से भी बदतर होगी।

अस्वीकरण : अत्यधिक व्यक्तिपरक पैराग्राफ फोलोइंग

हालांकि, मेरे अनुभव में, अक्सर एमएल तकनीक केवल डेटा के एक ब्लॉक पर ढीली पड़ने देती है, इस पर विचार किए बिना कि डेटा कहां से आया या इसे कैसे एकत्र किया गया (यानी डिजाइन की उपेक्षा)। उन मामलों में, कभी-कभी ऐसा परिणाम सामने आता है, लेकिन कार्य-कारण के बारे में कुछ कहना बहुत कठिन होगा। यह होगाठीक उसी तरह हो जब कुछ सांख्यिकीय ध्वनि विधि उसी डेटा पर चलाई जाए। हालांकि, एक मजबूत सांख्यिकी पृष्ठभूमि वाले लोगों को इन मामलों के लिए महत्वपूर्ण होने के लिए प्रशिक्षित किया जाता है, और अगर सब ठीक हो जाता है, तो इन नुकसानों से बचेंगे। शायद यह एमएल तकनीकों के शुरुआती (लेकिन मैला) को अपनाने की मानसिकता है (आमतौर पर नई तकनीकों के डेवलपर्स नहीं हैं, लेकिन जो अपने हित के क्षेत्र में उनके साथ कुछ परिणाम साबित करने के लिए उत्सुक हैं) जिन्होंने एमएल को इस पर अपनी खराब प्रतिष्ठा दी है। लेखा। (ध्यान दें कि मैं यह नहीं कह रहा हूं कि आंकड़े एमएल से बेहतर हैं, या यह कि एमएल करने वाले सभी लोग सुस्त हैं और जो कर रहे हैं वे आँकड़े नहीं हैं)


उत्तर के लिए बहुत बहुत धन्यवाद। मैं वास्तव में आपके स्पष्टीकरण को पसंद करता हूं कि तकनीकों की तुलना में कार्य-कारणता अधिक कैसे होती है। एक प्रश्न मेरे पास हालांकि तकनीकों के बारे में है कि क्या मशीन सीखने के लिए वाद्य चर की तरह कुछ है। इसके अलावा - एक चर के यादृच्छिककरण के मामले में, क्या मशीन सीखने का विकल्प उपचार के दौरान मतभेदों के एक साधारण टी-परीक्षण के सापेक्ष होगा?
d_a_c321 17

9

मेरा विचार है कि अर्थशास्त्र और अन्य सामाजिक विज्ञान में उपयोग किए जाने वाले मॉडल केवल उपयोगी हैं क्योंकि वे वास्तविक दुनिया में पूर्वानुमानित शक्ति रखते हैं - एक मॉडल जो वास्तविक दुनिया की भविष्यवाणी नहीं करता है वह सिर्फ कुछ चतुर गणित है। मेरे सहयोगियों के लिए एक पसंदीदा कहावत है कि "डेटा किंग है"।

मुझे ऐसा प्रतीत होता है कि आपका प्रश्न भविष्य कहनेवाला दृष्टिकोण के दो समालोचना को जन्म देता है। सबसे पहले, आप बताते हैं कि मशीन सीखने की तकनीक द्वारा निर्मित मॉडल व्याख्या योग्य नहीं हो सकते हैं । दूसरा, आप यह सुझाव देते हैं कि सामाजिक विज्ञान में उन तरीकों का उपयोग किया जाता है जो मशीन लर्निंग की तुलना में कारण संबंधों को उजागर करने के लिए अधिक उपयोगी होते हैं।

पहले बिंदु को संबोधित करने के लिए, मैं निम्नलिखित काउंटर तर्क पेश करूंगा। मशीन लर्निंग में मौजूद सनक तरीकों (जैसे SVMs और NN) के पक्ष में है, जो किसी लेपर्स के लिए समझना आसान नहीं है। इसका मतलब यह नहीं है कि सभी मशीन सीखने की तकनीक में यह संपत्ति है। उदाहरण के लिए, आदरणीय C4.5 निर्णय वृक्ष अभी भी व्यापक रूप से अपने विकास के अंतिम चरण तक पहुंचने के 20 साल बाद उपयोग किया जाता है, और आउटपुट के रूप में कई वर्गीकरण नियमों का उत्पादन करता है। मैं तर्क दूंगा कि इस तरह के नियम लॉग ऑड्स अनुपात की तरह अवधारणाओं की तुलना में व्याख्या करने के लिए खुद को बेहतर उधार देते हैं, लेकिन यह एक व्यक्तिपरक दावा है। किसी भी मामले में, इस तरह के मॉडल हैं व्याख्या।

दूसरे बिंदु को संबोधित करते हुए, मैं यह स्वीकार करूंगा कि यदि आप एक मशीन सीखने के मॉडल को एक वातावरण में प्रशिक्षित करते हैं, और दूसरे में इसका परीक्षण करते हैं, तो यह संभवतः विफल हो जाएगा, हालांकि, एक प्राथमिकता मानने का कोई कारण नहीं है कि यह भी सच नहीं है अधिक पारंपरिक मॉडल: यदि आप अपना मॉडल मान्यताओं के एक सेट के तहत बनाते हैं, और फिर दूसरे के तहत इसका मूल्यांकन करते हैं, तो आपको बुरे परिणाम मिलेंगे। कंप्यूटर प्रोग्रामिंग से एक वाक्यांश को सह-ऑप्ट करने के लिए: "कचरा, कचरा बाहर" मशीन सीखने और डिज़ाइन किए गए मॉडल दोनों पर समान रूप से लागू होता है।


9

उदाहरण के लिए, मशीन सीखने में अनुसंधान का एक सक्रिय क्षेत्र है, उदाहरण के लिए इस कार्यशाला की कार्यवाही और इस एक को देखें । मैं फिर भी यह बताना चाहूंगा कि यदि कारण या निष्कर्ष या मॉडल व्याख्या आपकी प्राथमिक रुचि है, तो यह अभी भी समानांतर में एक अपारदर्शी विशुद्ध रूप से अनुमानित दृष्टिकोण की कोशिश करने के लिए एक अच्छा विचार है, ताकि आपको पता चल जाए कि क्या कोई महत्वपूर्ण प्रदर्शन जुर्माना शामिल है एक व्याख्यात्मक मॉडल।


1
interopretable? संभवतः आप व्याख्या करने योग्य हैं?
फहीम मीठा

4

मैं अन्य उत्तरों में पहले से ही बनाए गए बहुत अच्छे अंकों को फिर से नहीं लिखूंगा, लेकिन कुछ अलग परिप्रेक्ष्य जोड़ना चाहूंगा। जो मैं यहां कहता हूं वह कुछ दार्शनिक है, जरूरी नहीं कि पेशेवर अनुभव से खींचा जाए, लेकिन भौतिक विज्ञान, जटिल सिस्टम सिद्धांत और मशीन लर्निंग में मिश्रित पृष्ठभूमि से (और, मुझे मानना ​​होगा, मोटे तौर पर स्नातक आंकड़े)।

मशीन लर्निंग और शास्त्रीय सांख्यिकीय दृष्टिकोणों के बीच एक पर्याप्त अंतर (जो मुझे पता है) मान्यताओं के सेट में है। शास्त्रीय आंकड़ों में, अंतर्निहित प्रक्रियाओं और वितरणों के बारे में कई धारणाएं तय की जाती हैं और उन्हें दी जाने वाली होती हैं। मशीन लर्निंग में, हालांकि, इन धारणाओं को स्पष्ट रूप से प्रत्येक मॉडल के लिए चुना जाता है, जिसके परिणामस्वरूप संभावनाओं का एक बहुत व्यापक सेट होता है और शायद मान्यताओं के बारे में अधिक जागरूकता होती है।

हम अधिक से अधिक यह देख रहे हैं कि हमारे आसपास की दुनिया में सिस्टम जटिल, गैर-रैखिक तरीकों से व्यवहार करते हैं, और यह कि कई प्रक्रियाएं सामान्यता की मान्यताओं का पालन नहीं करती हैं आदि आम तौर पर शास्त्रीय आंकड़ों में मौजूद हैं। मेरा तर्क है कि लचीलेपन और मॉडल मान्यताओं की विविधता के कारण, मशीन सीखने के दृष्टिकोण अक्सर ऐसे मामलों में अधिक मजबूत मॉडल का कारण बनेंगे।

"प्रभाव की भयावहता", "कारण संबंध", और "डिग्री जिसके लिए एक चर परिणाम को प्रभावित करता है" जैसे वाक्यांशों में निर्मित मजबूत मॉडल धारणाएं हैं। एक जटिल प्रणाली (जैसे कि एक अर्थव्यवस्था) में, ये धारणा केवल संभव सिस्टम राज्यों की एक निश्चित खिड़की के भीतर मान्य होगी। कुछ वेधशालाओं और प्रक्रियाओं के साथ, यह विंडो बड़ी हो सकती है, जिससे अपेक्षाकृत मजबूत मॉडल बन सकते हैं। दूसरों के साथ यह छोटा या खाली भी हो सकता है। शायद सबसे बड़ा खतरा मध्यम जमीन है: एक मॉडल काम करता हुआ दिखाई दे सकता है, लेकिन जब सिस्टम शिफ्ट होता है, तो अचानक और आश्चर्यजनक तरीके से विफल हो जाते हैं।

मशीन लर्निंग कोई रामबाण नहीं है। बल्कि, मैं इसे अपनी टिप्पणियों से अर्थ के नए तरीकों की तलाश के रूप में देख रहा हूं, नए प्रतिमानों की तलाश कर रहा हूं जिनकी आवश्यकता है यदि हम हमारे आसपास की दुनिया में हम जिस जटिलता को महसूस करना शुरू कर रहे हैं उससे प्रभावी ढंग से निपटना है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.