सांख्यिकीविद क्या करते हैं जो स्वचालित नहीं हो सकते?


26

क्या सॉफ्टवेयर अंततः सांख्यिकीविदों को अप्रचलित बना देगा? क्या किया जाता है जो कंप्यूटर में प्रोग्राम नहीं किया जा सकता है?


21
वे सोचते हैं (यानी, ज्ञान को सहन करने के लिए)।
गंग -

10
परिणामों की व्याख्या; ;-)
ocram

5
उसी प्रश्न को प्रोग्रामर के लिए सामान्य रूप से पूछा जा सकता है;)
nb1

4
हम अध्ययन डिजाइन करते हैं, और विशेष रूप से हमें वास्तविक जीवन की समस्याओं से निपटना पड़ता है जहां सांख्यिकीय रूप से "सर्वश्रेष्ठ" डिजाइन लागू नहीं किया जा सकता है। हम गंदे डेटा को साफ करते हैं, जिससे वास्तविक दुनिया का ज्ञान होता है। हम सादे [पसंद की भाषा सम्मिलित करें] में भी परिणामों की व्याख्या करते हैं।
मिशेल

13
बियर पियो! ; ओ)
डिक्रान मार्सुपियल

जवाबों:


28

@ अदम, यदि आप अन्य क्षेत्रों में उन लोगों के अनुरूप सांख्यिकीय शोधकर्ताओं के बारे में सोचते हैं - जो लोग मौजूदा कार्यप्रणाली और ज्ञान पर निर्माण करते हैं - तो यह अधिक स्पष्ट हो सकता है कि आपके पहले प्रश्न का उत्तर 'नहीं' है।

सांख्यिकीविद् जो केवल डिब्बाबंद सॉफ्टवेयर पैकेजों को लागू करने से जीवनयापन करते हैं, उन्हें संभवतः हर कदम के लिए कंप्यूटर द्वारा प्रतिस्थापित किया जा सकता है, केवल एक पेपर के चर्चा अनुभाग को लिखने के अलावा जहां परिणामों की व्याख्या की जानी चाहिए। तो, इस अर्थ में, हाँ - यह स्वचालित हो सकता है (हालांकि यह सॉफ्टवेयर का एक जटिल टुकड़ा होना चाहिए जिसमें एक प्राकृतिक भाषा प्रोसेसर का एक नरक है)।

हालांकि, जैसा कि अधिकांश शोधकर्ता अंततः पता लगाते हैं, "कैन्ड" रूटीन जो लोग अक्सर उपयोग करते हैं, वे बहुत सीमित हैं और उन्हें विशेष शोध सवालों के जवाब देने के लिए संशोधित किया जाना चाहिए (या पूरी तरह से विकसित किया जाना चाहिए) - यह वह जगह है जहां आंकड़ों का मानवीय पहलू अपरिहार्य है । या, एक शोधकर्ता को बस कुछ अलग, लेकिन संबंधित, अनुसंधान प्रश्न के लिए व्यवस्थित होना चाहिए जिसका उत्तर शास्त्रीय विधियों का उपयोग करके दिया जा सकता है।

अधिकांश सांख्यिकीविदों को मैं रिसर्च जॉब्स (जैसे प्रोफेसर, अनुसंधान वैज्ञानिक) में काम जानता हूं, जहां उनकी प्राथमिक भूमिका नई पद्धति विकसित करना है। यदि इस प्रक्रिया को स्वचालित किया जा सकता है, जिसका अर्थ है कि एक कंप्यूटर उपयोगी नई कार्यप्रणाली तैयार और क्रैंक कर सकता है, तो मुझे डर है कि हर क्षेत्र में शोधकर्ता अप्रचलित होंगे।


2
मुझे लगता है कि आपका दूसरा पैराग्राफ एक बिंदु को याद करता है: यह सिर्फ प्रक्रिया का अंत नहीं है (परिणाम व्याख्या) जो कठिन है, यह शुरुआत भी है - डेटा को किन तरीकों से लागू करना है, यह समझना, जिसे सामान्य स्थिति में प्रकृति को समझने की आवश्यकता होती है डेटा और सिस्टम से आया है।
कैसबेल

@ जेफ्रोमी, जैसे मैंने नीचे किसी से टिप्पणी की, मुझे लगता है कि समझ एक विशेषज्ञ के आवेदन के क्षेत्र में आती है, न कि एक सांख्यिकीविद् की।
मैक्रो

अगर समझ में सिर्फ "से आया" विशेषज्ञों के आवेदन के क्षेत्र में मेरी नौकरी बहुत आसान होगी (और बहुत कम मज़ा)। एक फ्रेम की समस्या है: ऐसा कुछ जिसे विशेषज्ञ नहीं कहते कि सांख्यिकीय विश्लेषण के लिए महत्वपूर्ण हो सकता है। व्यवहार में सबसे अधिक फलदायक सहयोग के परिणामस्वरूप विशेषज्ञ को आंकड़ों की उचित मात्रा का ज्ञान होता है और सांख्यिकीविद आवेदन के क्षेत्र के बारे में उचित मात्रा में सीखते हैं।
Scortchi - को पुनः स्थापित मोनिका

33

कंप्यूटर केवल सांख्यिकीविदों को अप्रचलित बनाएगा जब मजबूत AI मनुष्यों को संपूर्ण अप्रचलित बनाता है।

यह सवाल मुझे इस सवाल की याद दिलाता है, "अगर ये सभी मजबूत सांख्यिकीय तरीके हैं, तो लोग अभी भी अन्य तरीकों का उपयोग क्यों करते हैं?" जवाब में से कुछ आदत और प्रशिक्षण है, लेकिन इसमें से बहुत कुछ यह है कि सवाल अनुभवहीन है: "मजबूत" का मतलब यह नहीं है "आपको इस बारे में सोचने और समझने की ज़रूरत नहीं है कि आप क्या कर रहे हैं", जैसा कि प्रश्न का अर्थ है।

मेरा मतलब है, आप आज आर आँकड़े पैकेज डाउनलोड कर सकते हैं, और रात में किसी भी बुनियादी सांख्यिकीय तकनीक को कर सकते हैं। आप तब पैकेजों के एक जोड़े को डाउनलोड कर सकते हैं और इतने गूढ़ तरीकों का उपयोग करना शुरू कर सकते हैं कि हममें से अधिकांश ने भी उनके बारे में नहीं सुना है। सवाल यह है कि क्या आपको उचित जवाब मिलेगा? यह उत्तर संभवतः नहीं है।

एल्गोरिदम स्वचालित हैं, लेकिन आपको अभी भी सभी निर्णयकर्ता को जांच पथ पर कॉल करना होगा: हमले की योजना से लेकर अंतिम निर्णय तक कि क्या परिणाम वास्तव में समझ में आते हैं। उस बिंदु पर जाने के लिए, आप वास्तव में स्टार-ट्रेक जैसे कंप्यूटरों के बारे में बात कर रहे हैं, जहां आप कह सकते हैं, "कंप्यूटर, मुझे बताएं ...", जिसके द्वारा प्रत्येक मानव व्यवसाय अप्रचलित है।


4
+1 के लिए "कंप्यूटर केवल सांख्यिकीविदों को अप्रचलित बनाएगा जब मजबूत AI मानव को संपूर्ण अप्रचलित बनाता है।"
मैक्रो

10

एक सांख्यिकीविद क्या कर सकता है कि एक कंप्यूटर नहीं कर सकता है? उनके द्वारा प्रतिस्थापित मूल कार्यक्रम लिखें।

उस मूर्खतापूर्ण जवाब से परे, सवाल का मूल अपने यांत्रिकी के पक्ष में आंकड़ों के वास्तविक विज्ञान की अनदेखी कर रहा है , और सांख्यिकीय विश्लेषण में रचनात्मक प्रक्रिया की भूमिका को पूरी तरह से छूट दे रहा है। यह पीटर फ्लोम की कार के उदाहरण का उपयोग करने के लिए है, जैसे कि कारों को रिवेट्स और वेल्ड्स का उपयोग करके बनाया गया है, इसलिए ऐसा कोई कारण नहीं है कि नई मस्टैंग को रिवेटिंग और वेल्डिंग रोबोट द्वारा डिज़ाइन नहीं किया जा सकता है।

आँकड़ों की कर की एक जबरदस्त मात्रा में विषय-वस्तु विशेषज्ञता, निर्णय कॉल और रचनात्मकता शामिल है। एल्गोरिथ्म से चल रहे "डिब्बाबंद" विश्लेषण से आपको अक्सर सबसे अच्छा जवाब नहीं मिलेगा, और ऐसे असंख्य दस्तावेज हैं जहां स्वचालित तरीकों का उपयोग करने से वास्तव में आपको गलत जवाब मिलता है - या कम से कम जवाब आपको लगता है कि आपको मिल रहा है। स्टेप वाइज पी-वैल्यू आधारित वैरिएबल सिलेक्शन प्रॉसेस और एनालिसिस के आधार पर विशुद्ध रूप से संख्यात्मक रूप से परिभाषित क्वांटाइल्स का उपयोग दो ऐसे हैं जिनसे मैं सबसे ज्यादा परिचित हूं, लेकिन मुझे यकीन है कि आप वहां दूसरों का धन पा सकते हैं।

यहां तक ​​कि अगर सब कुछ अभी भी स्वचालित था, तो परिणाम की व्याख्या करने की बात है। जब आप एक प्रतिगमन गुणांक या पी-मान प्राप्त करते हैं, तो सांख्यिकीविद (या सांख्यिकीय-इच्छुक वैज्ञानिक) का काम नहीं किया जाता है। उस खोज का क्या मतलब है । कैवियट क्या हैं? इससे पहले जो आया है, उसके संदर्भ में यह क्या दर्शाता है?

अंत में, आपके पास नए तरीकों का विकास है। आँकड़े ऐसी कोई चीज़ नहीं है, जिसे बहुत पहले ही ऐसे लोगों द्वारा रखा गया था, जिनके नाम से हम पहचानते हैं - फिशर, कॉक्स, इत्यादि। यह एक विकसित क्षेत्र है, और जब तक कोई व्यक्ति स्वयं विधि विकसित नहीं करता है, तब तक आप एक नई विधि को कंप्यूटर में प्रोग्राम नहीं कर सकते।


2
(+1) क्योंकि "एक एल्गोरिथ्म से चलने वाला डिब्बाबंद विश्लेषण अक्सर आपको सबसे अच्छा उत्तर नहीं मिलेगा" बहुत सही है। इसका मतलब यह नहीं है कि सांख्यिकी के मानव चिकित्सक यह सब समय पर नहीं करते हैं। (नोट: आंकड़ों के अधिकांश चिकित्सक सांख्यिकीविद् नहीं हैं ... अधिक लोग ऐसे हैं जो आंकड़ों का उपयोग कर रहे हैं वास्तव में यह जानने के बावजूद कि वे क्या कर रहे हैं, अक्सर खराब विज्ञान के परिणामस्वरूप)
मैक्रो

10

इस प्रश्न की व्याख्या करने का एक अन्य तरीका यह हो सकता है: "समर्पित सांख्यिकीविदों और डेटा विश्लेषकों के लिए नौकरियों में कमी की मांग के साथ हाल के वर्षों में स्वचालित सांख्यिकीय तकनीकों में तेजी से वृद्धि हुई है?"

इस सवाल का जवाब हम डेटा को देखकर दे सकते हैं डेटा विश्लेषण पदों के लिए नौकरी बाजार
यहाँ छवि विवरण दर्ज करें

वास्तव में.com और क्रांतियों ब्लॉग के डेटा शिष्टाचार


+1 ईवनिंग डॉट कॉम ने @cboettig obselete नहीं बनाया है।
थॉमस लेविन

4
मैं "समर्पित सांख्यिकीविदों और डेटा विश्लेषकों के लिए नौकरियों में मांग" के बारे में आश्वस्त नहीं हूं, नौकरी विज्ञापनों में कीवर्ड "डेटा वैज्ञानिक" या "बड़े डेटा" के उपयोग के साथ मजबूत संबंध है। <- मान्यताओं पर संदेह किया जा रहा है कि मानव टेबल पर क्या लाता है ;-)
डैरेन कुक

@DarrenCook अच्छी तरह से कहा!
cboettig

7

मैं पूरी तरह से प्रश्न के आधार से सहमत नहीं हूं, यानी मुझे लगता है कि ऐसा कोई तरीका नहीं है जिससे कंप्यूटर कभी भी सांख्यिकीविदों को बदलने की उम्मीद कर सकता है, लेकिन मुझे लगता है कि ऐसा करने के लिए एक ठोस उदाहरण लगाने के लिए:

वैज्ञानिकों के साथ विशेष रूप से प्रयोगों के डिजाइन और व्याख्या में जो काम सांख्यिकीविदों का होता है, उसके लिए न केवल एक मानवीय मन की आवश्यकता होती है, बल्कि एक दार्शनिक मोड़ भी होता है, जो कि समझ से बाहर है।

जब तक हम किसी प्रकार की स्काईनेट प्रकार की स्थिति में समाप्त नहीं होते हैं, निश्चित रूप से, जिस स्थिति में मुझे लगता है कि सभी दांव शायद सभी मानवता के भविष्य से दूर हैं, कभी भी केवल सांख्यिकीविदों के बारे में कोई बात नहीं है, चिंतित है :-)


1
सिवाय मैं पालन करने के लिए बिल्ली के समान अधिपति है। :)
मिशेल

5

प्रश्न एक सांख्यिकीविद् के एक भोले विचार का सुझाव देता है-यह कि यह देखने के लिए कि क्या एपी <0.05 और कुछ नंबरों और मानक रेखांकन की रिपोर्टिंग है। यदि आप सांख्यिकीविद् से इसका मतलब है तो आप अपने निहितार्थ में सही हैं कि इसका अधिकांश हिस्सा पूरी तरह से स्वचालित हो सकता है। लेकिन यह नहीं है कि सांख्यिकीय का क्या मतलब है।

हालांकि अपने शब्द सांख्यिकीविद् को परिभाषित करें, और आपको बेहतर उत्तर मिल सकते हैं।


3

आपके कंप्यूटर पर एक आँकड़े पैकेज लोड हो रहा है जो आपको एक सांख्यिकीविद नहीं बनाता है जो कार खरीदने से अधिक आपको ड्राइव करने में सक्षम बनाता है।

यहां तक ​​कि अगर सांख्यिकीविद् सिर्फ "डिब्बाबंद" दिनचर्या लागू करता है तो बहुत सारे सवाल हैं।

  1. कौन सी दिनचर्या? क्लाइंट के सवालों के जवाब में कौन सी दिनचर्या होगी?
  2. किस चर के साथ? और क्या उन्हें बदलना चाहिए? क्या कुछ स्तरों को जोड़ा जाना चाहिए? जिसे एक मॉडल में मजबूर किया जाना चाहिए?
  3. किस डेटा के साथ? क्या बाहरी लोगों को हटा दिया जाना चाहिए? छंटनी की? शायद एक मजबूत विधि?

और इसी तरह।

लेकिन कंप्यूटर चालू होने से पहले नौकरी शुरू हो जाती है, और सांख्यिकीय पैकेज बंद होने के बाद लंबे समय तक समाप्त होता है।

पहले: ग्राहक क्या करना चाहता है? अक्सर यह बहुत काम है! क्लाइंट के पास क्या डेटा है? ओ वेरी! चरों को V1 से V828171 पर लेबल किया जाता है कौन से हैं? साहित्य की स्थिति क्या है? ग्राहक क्या उम्मीद करेंगे? यह कितना तकनीकी होना चाहिए?

के बाद: परिणाम का क्या मतलब है ? (और न केवल "इसका मतलब है कि प्रतिगमन महत्वपूर्ण है") परिणामों को ग्राहक को कैसे समझाया जाना चाहिए? परिणाम क्या अन्य प्रश्न उठाते हैं?

यह होगा, मुझे लगता है, इससे पहले कि कंप्यूटर ऐसा कर सकता है।


1
(1), (2) और (3) में सूचीबद्ध प्रश्नों के उत्तर देने के लिए, आप कुछ तार्किक प्रक्रिया से गुजरते हैं। सैद्धांतिक रूप से, इस तार्किक प्रक्रिया को एक कंप्यूटर प्रोग्राम में कोडित किया जा सकता है। यदि कंप्यूटर में एक संपूर्ण प्राकृतिक भाषा प्रोसेसर था और सॉफ्टवेयर में सभी "डिब्बाबंद" सॉफ्टवेयर थे, और इसमें ऊपर दिए गए तर्क का उल्लेख था, तो यह इन चीजों को करने में सक्षम होगा। या, आप कह रहे हैं, यह एक तार्किक प्रक्रिया नहीं है?
मैक्रो

4
मेरे लिए, सादृश्य "कार खरीदने से आपको मैकेनिक या कार डिजाइनर नहीं बनाता है।"
कार्डिनल

1
@ मैक्रो क्योंकि इसकी तार्किक प्रक्रिया का मतलब यह नहीं है कि कंप्यूटर में प्रोग्राम किया जा सकता है या नहीं। "कुछ स्तरों को संयुक्त किया जाना चाहिए" हमेशा एक संख्यात्मक माप नहीं होता है - यह विचार करने की आवश्यकता है कि क्या उन संयुक्त स्तरों को चर के संदर्भ में समझ में आता है, उदाहरण के लिए।
फोमाइट

1
यह तय करना कि क्या यह आवेदन के संदर्भ में समझ में आता है या तो एक सांख्यिकीविद् के लिए कोई प्रश्न नहीं है - यह एक विशेषज्ञ के लिए एक प्रश्न है कि आवेदन क्या है। एक सांख्यिकीविद् आपको बता सकता है कि क्या वे सजातीय दिखाई देते हैं या नहीं, इसके आधार पर स्तरों को संयोजित करना उचित है, जो निश्चित रूप से एक कंप्यूटर को सिखाया जा सकता है।
मैक्रों

4
मैं उनका कहना है कि गूगल दिशा से कार खरीदने जहां में महान अग्रिम कर रहा है विरोध नहीं कर सकते हैं करेंगे आप ड्राइव करने में सक्षम बनाने के - यह तो स्वचालित रूप से करना होगा!
whuber

2

शैक्षणिक अध्ययन जो विभिन्न व्यवसायों या कार्य के स्वचालन की संभावना को देखते हैं, यह नहीं सोचते हैं कि सांख्यिकीविदों को जल्द ही कंप्यूटर द्वारा प्रतिस्थापित किया जाएगा। उदाहरण के लिए विवादास्पद फ्रे एंड ओसबोर्न (2013) के अध्ययन को देखें, जो कम्प्यूटरीकरण की उनकी संभावना के अनुसार व्यवसायों को रैंक करता है, सांख्यिकीविदों को 222% की संभावना के साथ 702 में से 213 से कम रैंक दिया गया है (परिशिष्ट में तालिका देखें)। यदि आप आगे रुचि रखते हैं, तो स्लेट लेख यहां भी देखें ।

अर्न्ट्ज एट अल। (२०१६) ( यहां एक द इकोनॉमिस्ट लेख) यूरोपीय संघ के लिए पेशों के बजाय कार्यों को देखता है और एक समान निष्कर्ष पर आता है: "कॉम्प्लेक्स मठ या सांख्यिकी" करना सांख्यिकीय रूप से नकारात्मक रूप से नौकरी से संबंधित है ऑटोमैटिबिलिटी (तालिका ३ देखें)।

लेकिन कुछ सावधानी की सलाह दी जाती है, शिक्षाविदों और / या अर्थशास्त्रियों ने भविष्य की भविष्यवाणी करने में हमेशा बहुत अच्छा नहीं किया है (उदाहरण के लिए, नोबेल पुरस्कार विजेता रॉबर्ट लुकास ने वित्तीय संकटों से कुछ साल पहले 2003 में निष्कर्ष निकाला था, कि "अवसाद की रोकथाम की केंद्रीय समस्या के रूप में) सभी व्यावहारिक उद्देश्यों के लिए हल किया गया है, और वास्तव में कई दशकों से हल किया गया है। " )। दोनों अध्ययन वर्किंग पेपर प्रतीत होते हैं, जिनकी व्यापक रूप से चर्चा की जाती है, लेकिन मानक पीयर-रिव्यू जर्नल में प्रकाशित नहीं हुए हैं।

शैक्षिक बहस के बारे में, यहां आप स्वचालन के बारे में अनुसंधान की स्थिति के बारे में एक अवलोकन लेख पा सकते हैं।


0

मुझे लगता है कि AI केवल सांख्यिकीविदों को और अधिक प्रतिस्पर्धी बनाएगा। क्यूं कर? क्योंकि यह कई दशक पहले उनकी गर्भाधान के बाद से कृत्रिम बुद्धि का इरादा है ...

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.