क्या सॉफ्टवेयर अंततः सांख्यिकीविदों को अप्रचलित बना देगा? क्या किया जाता है जो कंप्यूटर में प्रोग्राम नहीं किया जा सकता है?
क्या सॉफ्टवेयर अंततः सांख्यिकीविदों को अप्रचलित बना देगा? क्या किया जाता है जो कंप्यूटर में प्रोग्राम नहीं किया जा सकता है?
जवाबों:
@ अदम, यदि आप अन्य क्षेत्रों में उन लोगों के अनुरूप सांख्यिकीय शोधकर्ताओं के बारे में सोचते हैं - जो लोग मौजूदा कार्यप्रणाली और ज्ञान पर निर्माण करते हैं - तो यह अधिक स्पष्ट हो सकता है कि आपके पहले प्रश्न का उत्तर 'नहीं' है।
सांख्यिकीविद् जो केवल डिब्बाबंद सॉफ्टवेयर पैकेजों को लागू करने से जीवनयापन करते हैं, उन्हें संभवतः हर कदम के लिए कंप्यूटर द्वारा प्रतिस्थापित किया जा सकता है, केवल एक पेपर के चर्चा अनुभाग को लिखने के अलावा जहां परिणामों की व्याख्या की जानी चाहिए। तो, इस अर्थ में, हाँ - यह स्वचालित हो सकता है (हालांकि यह सॉफ्टवेयर का एक जटिल टुकड़ा होना चाहिए जिसमें एक प्राकृतिक भाषा प्रोसेसर का एक नरक है)।
हालांकि, जैसा कि अधिकांश शोधकर्ता अंततः पता लगाते हैं, "कैन्ड" रूटीन जो लोग अक्सर उपयोग करते हैं, वे बहुत सीमित हैं और उन्हें विशेष शोध सवालों के जवाब देने के लिए संशोधित किया जाना चाहिए (या पूरी तरह से विकसित किया जाना चाहिए) - यह वह जगह है जहां आंकड़ों का मानवीय पहलू अपरिहार्य है । या, एक शोधकर्ता को बस कुछ अलग, लेकिन संबंधित, अनुसंधान प्रश्न के लिए व्यवस्थित होना चाहिए जिसका उत्तर शास्त्रीय विधियों का उपयोग करके दिया जा सकता है।
अधिकांश सांख्यिकीविदों को मैं रिसर्च जॉब्स (जैसे प्रोफेसर, अनुसंधान वैज्ञानिक) में काम जानता हूं, जहां उनकी प्राथमिक भूमिका नई पद्धति विकसित करना है। यदि इस प्रक्रिया को स्वचालित किया जा सकता है, जिसका अर्थ है कि एक कंप्यूटर उपयोगी नई कार्यप्रणाली तैयार और क्रैंक कर सकता है, तो मुझे डर है कि हर क्षेत्र में शोधकर्ता अप्रचलित होंगे।
कंप्यूटर केवल सांख्यिकीविदों को अप्रचलित बनाएगा जब मजबूत AI मनुष्यों को संपूर्ण अप्रचलित बनाता है।
यह सवाल मुझे इस सवाल की याद दिलाता है, "अगर ये सभी मजबूत सांख्यिकीय तरीके हैं, तो लोग अभी भी अन्य तरीकों का उपयोग क्यों करते हैं?" जवाब में से कुछ आदत और प्रशिक्षण है, लेकिन इसमें से बहुत कुछ यह है कि सवाल अनुभवहीन है: "मजबूत" का मतलब यह नहीं है "आपको इस बारे में सोचने और समझने की ज़रूरत नहीं है कि आप क्या कर रहे हैं", जैसा कि प्रश्न का अर्थ है।
मेरा मतलब है, आप आज आर आँकड़े पैकेज डाउनलोड कर सकते हैं, और रात में किसी भी बुनियादी सांख्यिकीय तकनीक को कर सकते हैं। आप तब पैकेजों के एक जोड़े को डाउनलोड कर सकते हैं और इतने गूढ़ तरीकों का उपयोग करना शुरू कर सकते हैं कि हममें से अधिकांश ने भी उनके बारे में नहीं सुना है। सवाल यह है कि क्या आपको उचित जवाब मिलेगा? यह उत्तर संभवतः नहीं है।
एल्गोरिदम स्वचालित हैं, लेकिन आपको अभी भी सभी निर्णयकर्ता को जांच पथ पर कॉल करना होगा: हमले की योजना से लेकर अंतिम निर्णय तक कि क्या परिणाम वास्तव में समझ में आते हैं। उस बिंदु पर जाने के लिए, आप वास्तव में स्टार-ट्रेक जैसे कंप्यूटरों के बारे में बात कर रहे हैं, जहां आप कह सकते हैं, "कंप्यूटर, मुझे बताएं ...", जिसके द्वारा प्रत्येक मानव व्यवसाय अप्रचलित है।
एक सांख्यिकीविद क्या कर सकता है कि एक कंप्यूटर नहीं कर सकता है? उनके द्वारा प्रतिस्थापित मूल कार्यक्रम लिखें।
उस मूर्खतापूर्ण जवाब से परे, सवाल का मूल अपने यांत्रिकी के पक्ष में आंकड़ों के वास्तविक विज्ञान की अनदेखी कर रहा है , और सांख्यिकीय विश्लेषण में रचनात्मक प्रक्रिया की भूमिका को पूरी तरह से छूट दे रहा है। यह पीटर फ्लोम की कार के उदाहरण का उपयोग करने के लिए है, जैसे कि कारों को रिवेट्स और वेल्ड्स का उपयोग करके बनाया गया है, इसलिए ऐसा कोई कारण नहीं है कि नई मस्टैंग को रिवेटिंग और वेल्डिंग रोबोट द्वारा डिज़ाइन नहीं किया जा सकता है।
आँकड़ों की कर की एक जबरदस्त मात्रा में विषय-वस्तु विशेषज्ञता, निर्णय कॉल और रचनात्मकता शामिल है। एल्गोरिथ्म से चल रहे "डिब्बाबंद" विश्लेषण से आपको अक्सर सबसे अच्छा जवाब नहीं मिलेगा, और ऐसे असंख्य दस्तावेज हैं जहां स्वचालित तरीकों का उपयोग करने से वास्तव में आपको गलत जवाब मिलता है - या कम से कम जवाब आपको लगता है कि आपको मिल रहा है। स्टेप वाइज पी-वैल्यू आधारित वैरिएबल सिलेक्शन प्रॉसेस और एनालिसिस के आधार पर विशुद्ध रूप से संख्यात्मक रूप से परिभाषित क्वांटाइल्स का उपयोग दो ऐसे हैं जिनसे मैं सबसे ज्यादा परिचित हूं, लेकिन मुझे यकीन है कि आप वहां दूसरों का धन पा सकते हैं।
यहां तक कि अगर सब कुछ अभी भी स्वचालित था, तो परिणाम की व्याख्या करने की बात है। जब आप एक प्रतिगमन गुणांक या पी-मान प्राप्त करते हैं, तो सांख्यिकीविद (या सांख्यिकीय-इच्छुक वैज्ञानिक) का काम नहीं किया जाता है। उस खोज का क्या मतलब है । कैवियट क्या हैं? इससे पहले जो आया है, उसके संदर्भ में यह क्या दर्शाता है?
अंत में, आपके पास नए तरीकों का विकास है। आँकड़े ऐसी कोई चीज़ नहीं है, जिसे बहुत पहले ही ऐसे लोगों द्वारा रखा गया था, जिनके नाम से हम पहचानते हैं - फिशर, कॉक्स, इत्यादि। यह एक विकसित क्षेत्र है, और जब तक कोई व्यक्ति स्वयं विधि विकसित नहीं करता है, तब तक आप एक नई विधि को कंप्यूटर में प्रोग्राम नहीं कर सकते।
इस प्रश्न की व्याख्या करने का एक अन्य तरीका यह हो सकता है: "समर्पित सांख्यिकीविदों और डेटा विश्लेषकों के लिए नौकरियों में कमी की मांग के साथ हाल के वर्षों में स्वचालित सांख्यिकीय तकनीकों में तेजी से वृद्धि हुई है?"
इस सवाल का जवाब हम डेटा को देखकर दे सकते हैं
वास्तव में.com और क्रांतियों ब्लॉग के डेटा शिष्टाचार
मैं पूरी तरह से प्रश्न के आधार से सहमत नहीं हूं, यानी मुझे लगता है कि ऐसा कोई तरीका नहीं है जिससे कंप्यूटर कभी भी सांख्यिकीविदों को बदलने की उम्मीद कर सकता है, लेकिन मुझे लगता है कि ऐसा करने के लिए एक ठोस उदाहरण लगाने के लिए:
वैज्ञानिकों के साथ विशेष रूप से प्रयोगों के डिजाइन और व्याख्या में जो काम सांख्यिकीविदों का होता है, उसके लिए न केवल एक मानवीय मन की आवश्यकता होती है, बल्कि एक दार्शनिक मोड़ भी होता है, जो कि समझ से बाहर है।
जब तक हम किसी प्रकार की स्काईनेट प्रकार की स्थिति में समाप्त नहीं होते हैं, निश्चित रूप से, जिस स्थिति में मुझे लगता है कि सभी दांव शायद सभी मानवता के भविष्य से दूर हैं, कभी भी केवल सांख्यिकीविदों के बारे में कोई बात नहीं है, चिंतित है :-)
प्रश्न एक सांख्यिकीविद् के एक भोले विचार का सुझाव देता है-यह कि यह देखने के लिए कि क्या एपी <0.05 और कुछ नंबरों और मानक रेखांकन की रिपोर्टिंग है। यदि आप सांख्यिकीविद् से इसका मतलब है तो आप अपने निहितार्थ में सही हैं कि इसका अधिकांश हिस्सा पूरी तरह से स्वचालित हो सकता है। लेकिन यह नहीं है कि सांख्यिकीय का क्या मतलब है।
हालांकि अपने शब्द सांख्यिकीविद् को परिभाषित करें, और आपको बेहतर उत्तर मिल सकते हैं।
आपके कंप्यूटर पर एक आँकड़े पैकेज लोड हो रहा है जो आपको एक सांख्यिकीविद नहीं बनाता है जो कार खरीदने से अधिक आपको ड्राइव करने में सक्षम बनाता है।
यहां तक कि अगर सांख्यिकीविद् सिर्फ "डिब्बाबंद" दिनचर्या लागू करता है तो बहुत सारे सवाल हैं।
और इसी तरह।
लेकिन कंप्यूटर चालू होने से पहले नौकरी शुरू हो जाती है, और सांख्यिकीय पैकेज बंद होने के बाद लंबे समय तक समाप्त होता है।
पहले: ग्राहक क्या करना चाहता है? अक्सर यह बहुत काम है! क्लाइंट के पास क्या डेटा है? ओ वेरी! चरों को V1 से V828171 पर लेबल किया जाता है कौन से हैं? साहित्य की स्थिति क्या है? ग्राहक क्या उम्मीद करेंगे? यह कितना तकनीकी होना चाहिए?
के बाद: परिणाम का क्या मतलब है ? (और न केवल "इसका मतलब है कि प्रतिगमन महत्वपूर्ण है") परिणामों को ग्राहक को कैसे समझाया जाना चाहिए? परिणाम क्या अन्य प्रश्न उठाते हैं?
यह होगा, मुझे लगता है, इससे पहले कि कंप्यूटर ऐसा कर सकता है।
शैक्षणिक अध्ययन जो विभिन्न व्यवसायों या कार्य के स्वचालन की संभावना को देखते हैं, यह नहीं सोचते हैं कि सांख्यिकीविदों को जल्द ही कंप्यूटर द्वारा प्रतिस्थापित किया जाएगा। उदाहरण के लिए विवादास्पद फ्रे एंड ओसबोर्न (2013) के अध्ययन को देखें, जो कम्प्यूटरीकरण की उनकी संभावना के अनुसार व्यवसायों को रैंक करता है, सांख्यिकीविदों को 222% की संभावना के साथ 702 में से 213 से कम रैंक दिया गया है (परिशिष्ट में तालिका देखें)। यदि आप आगे रुचि रखते हैं, तो स्लेट लेख यहां भी देखें ।
अर्न्ट्ज एट अल। (२०१६) ( यहां एक द इकोनॉमिस्ट लेख) यूरोपीय संघ के लिए पेशों के बजाय कार्यों को देखता है और एक समान निष्कर्ष पर आता है: "कॉम्प्लेक्स मठ या सांख्यिकी" करना सांख्यिकीय रूप से नकारात्मक रूप से नौकरी से संबंधित है ऑटोमैटिबिलिटी (तालिका ३ देखें)।
लेकिन कुछ सावधानी की सलाह दी जाती है, शिक्षाविदों और / या अर्थशास्त्रियों ने भविष्य की भविष्यवाणी करने में हमेशा बहुत अच्छा नहीं किया है (उदाहरण के लिए, नोबेल पुरस्कार विजेता रॉबर्ट लुकास ने वित्तीय संकटों से कुछ साल पहले 2003 में निष्कर्ष निकाला था, कि "अवसाद की रोकथाम की केंद्रीय समस्या के रूप में) सभी व्यावहारिक उद्देश्यों के लिए हल किया गया है, और वास्तव में कई दशकों से हल किया गया है। " )। दोनों अध्ययन वर्किंग पेपर प्रतीत होते हैं, जिनकी व्यापक रूप से चर्चा की जाती है, लेकिन मानक पीयर-रिव्यू जर्नल में प्रकाशित नहीं हुए हैं।
शैक्षिक बहस के बारे में, यहां आप स्वचालन के बारे में अनुसंधान की स्थिति के बारे में एक अवलोकन लेख पा सकते हैं।