क्या अर्थशास्त्र के क्षेत्र के लिए R भाषा विश्वसनीय है?


64

मैं अर्थशास्त्र में एक स्नातक छात्र हूं जिसने हाल ही में अन्य बहुत प्रसिद्ध सांख्यिकीय पैकेजों से आर में परिवर्तित किया (मैं मुख्य रूप से एसपीएसएस का उपयोग कर रहा था)। इस समय मेरी छोटी समस्या यह है कि मैं अपनी कक्षा में एकमात्र आर उपयोगकर्ता हूँ। मेरे सहपाठी स्टाटा और गॉस का उपयोग करते हैं और मेरे एक प्रोफेसर ने यहां तक ​​कहा कि आर इंजीनियरिंग के लिए एकदम सही है, लेकिन अर्थशास्त्र के लिए नहीं। उन्होंने कहा कि कई पैकेज ऐसे लोगों द्वारा बनाए जाते हैं जो प्रोग्रामिंग के बारे में बहुत कुछ जानते हैं, लेकिन अर्थशास्त्र के बारे में ज्यादा नहीं और इसलिए विश्वसनीय नहीं हैं। उन्होंने इस तथ्य का भी उल्लेख किया कि चूंकि कोई पैसा वास्तव में आर पैकेज बनाने में शामिल नहीं है, इसलिए इसे सही तरीके से करने के लिए कोई प्रोत्साहन नहीं है (उदाहरण के लिए स्टैटा के विपरीत) और उन्होंने आर का इस्तेमाल एक समय के लिए किया और कुछ "हास्यास्पद" परिणाम प्राप्त किए कुछ सामानों का अनुमान लगाने का उनका प्रयास। इसके अलावा, उन्होंने आर में यादृच्छिक संख्या जनरेटर के बारे में शिकायत की जो उन्होंने कहा था "

मैं एक महीने से अधिक समय से आर का उपयोग कर रहा हूं और मुझे कहना होगा कि मुझे इससे प्यार हो गया है। यह सब सामान जो मैं अपने प्रोफेसर से सुन रहा हूं, वह मुझे हतोत्साहित कर रहा है।

तो मेरा सवाल है: "क्या अर्थशास्त्र के क्षेत्र के लिए आर विश्वसनीय है?"।


30
"कई पैकेज ऐसे लोगों द्वारा बनाए जाते हैं जो प्रोग्रामिंग के बारे में बहुत कुछ जानते हैं, लेकिन अर्थशास्त्र के बारे में नहीं।" पैकेज लेखक व्यावहारिक रूप से हमेशा वैज्ञानिक या शिक्षाविद पहले और प्रोग्रामर (बहुत) दूर (अंतिम) दूसरे होते हैं। वास्तव में, मुझे लगता है कि एक "प्रोग्रामर" द्वारा लिखित पैकेज ढूंढना एक चुनौती होगी।
ब्रैंडन बर्टेल्सन

9
क्या मैं आपको और हमारे अन्य
सांख्यिकी

18
ऐसा लगता है कि आपके प्रोफेसर की टिप्पणियों में थोड़ा सा पेशेवर चौविंवाद भी है। एक अर्थशास्त्री को विश्वसनीयता की गारंटी कैसे दी जा रही है? मुझे इसके बजाय सॉफ्टवेयर डेवलपर्स पर भरोसा था (यह वास्तव में एक पेशा है, न कि कोई ऐसा जो विशेष अनुभव या प्रशिक्षण के बिना अच्छा कर सकता है) और सांख्यिकीविद् विश्वसनीय सांख्यिकीय सॉफ्टवेयर का उत्पादन करने के लिए।
गाला

23
विश्वसनीयता के कारण "इंजीनियरिंग के लिए बिल्कुल सही लेकिन अर्थशास्त्र के लिए नहीं"? वह बल्कि एक गगनचुंबी इमारत एक अर्थव्यवस्था से ढह गई थी? आदमी का मूढ़। उस स्कूल से बाहर निकलें और किसी को बेवकूफ न समझें।
स्पेसमैन

10
व्यावसायिक सॉफ्टवेयर अच्छा या बुरा हो सकता है। ओपन सोर्स सॉफ्टवेयर अच्छा या बुरा हो सकता है। क्या मायने रखता है कि आप जिस सॉफ्टवेयर का उपयोग करते हैं वह अच्छा है या नहीं। यह तय न करें कि पूर्वाग्रह और हठधर्मिता के आधार पर। असली सबूत का उपयोग करें।
डेविड हेफर्नन

जवाबों:


83

मुझे एक विपरीत दृश्य बिंदु साझा करने दें। मैं एक अर्थशास्त्री हूं। मुझे SAS का उपयोग करके अर्थमिति में प्रशिक्षित किया गया। मैं वित्तीय सेवाओं में काम करता हूं और आज रात मैंने आर आधारित मॉडलों को अपडेट किया है जिसका इस्तेमाल हम कल लाखों डॉलर के जोखिम में डालेंगे।

आपका प्रोफेसर सिर्फ सादा गलत है। लेकिन वह जो गलती कर रहा है वह बहुत आम है और चर्चा के लायक है। लगता है कि आपके प्रोफेसर जो कर रहे हैं, वह आर सॉफ्टवेयर के विचार (एस भाषा का जीएनयू कार्यान्वयन) बनाम पैकेज (या अन्य कोड) आर में लागू है। मैं एसएएम आईएमएल का उपयोग करके एक रैखिक प्रतिगमन के बकवास कार्यान्वयन लिख सकता हूं। वास्तव में, मैंने बहुत काम किया है। इसका मतलब यह है कि SAS बकवास है? बिलकूल नही। एसएएस बकवास है क्योंकि उनका मूल्य-निर्धारण गैर-पारदर्शी, हास्यास्पद रूप से महंगा है, और वादा पर घर के सलाहकारों में, डिलीवरी के तहत, और खुशी के लिए एक प्रीमियम चार्ज करते हैं। लेकिन मैं पीछे हटा...

R का खुलापन एक दोहरी धार वाली तलवार है: खुलेपन किसी भी टॉम, डिक या हैरी को किसी भी एल्गोरिथ्म के बकवास कार्यान्वयन को लिखने की अनुमति देता है जो वे सोचते हैं कि अर्थशास्त्र भवन के तहखाने में धूम्रपान करते समय। समान खुलापन अर्थशास्त्रियों को खुले तौर पर कोड साझा करने और एक दूसरे के कोड में सुधार करने का अभ्यास करने की अनुमति देता है। R के साथ लाइसेंसिंग नियमों का मतलब है कि मैं अमेज़ॅन के क्लाउड पर समानांतर में R चलाने के लिए समानांतर कोड लिख सकता हूं और 30 नोड क्लस्टर के लिए लाइसेंस शुल्क के बारे में चिंता करने की ज़रूरत नहीं है। यह सिमुलेशन आधारित विश्लेषण के लिए एक बड़ी जीत है जो मैं जो भी करता हूं उसका एक बड़ा हिस्सा है।

आपके प्रोफेसर की टिप्पणी है कि "कई पैकेज ऐसे लोगों द्वारा बनाए जाते हैं जो प्रोग्रामिंग के बारे में बहुत कुछ जानते हैं, लेकिन अर्थशास्त्र के बारे में बहुत कुछ नहीं", इसमें कोई संदेह नहीं है, सही है। लेकिन CRAN पर 3716 पैकेज हैं। आप यह सुनिश्चित कर सकते हैं कि उनमें से कई अर्थशास्त्रियों द्वारा नहीं लिखे गए थे। इसी तरह से आप सुनिश्चित हो सकते हैं कि CPAN के 105,089 मॉड्यूल में से कई अर्थशास्त्रियों द्वारा नहीं लिखे गए थे।

अपना सॉफ्टवेयर सावधानी से चुनें। सुनिश्चित करें कि आप समझ रहे हैं और आपके द्वारा उपयोग किए जा रहे टूल का परीक्षण कर चुके हैं। यह भी सुनिश्चित करें कि आप सही अर्थशास्त्र को समझते हैं जिसके पीछे आपने कभी कार्यान्वयन किया था। एक बंद सॉफ़्टवेयर समाधान में बंद हो जाना सिर्फ लाइसेंस शुल्क से अधिक महंगा है।


आपकी प्रतिक्रिया के लिए धन्यवाद। तो क्या आप यह सुझाव दे रहे हैं कि मैं कुछ और सीखने की कोशिश करूं? फिर आप मुझे क्या सीखेंगे?
SavedByJESUS

5
नहींं, मैं लगभग पूरी तरह से आर का उपयोग करता हूं। क्या कुछ पैकेज हैं जो आपके प्रोफेसर या अन्य अर्थशास्त्री बहुत उपयोग करते हैं? मैं किसी भी econ विशिष्ट संकुल का उपयोग नहीं करते। मैं प्लाई, मैट्रिक्स, और कई अन्य पैकेजों का उपयोग करता हूं, लेकिन अर्थशास्त्रियों के लिए कोई भी विशिष्ट रूप से डिज़ाइन नहीं किया गया है।
जेडी लॉन्ग

तो क्या आप "पैकेज" की बात कर रहे थे और आपने कहा था कि मुझे एक बंद सॉफ्टवेयर समाधान में बंद नहीं होना चाहिए?
SavedByJESUS

3
"खुलापन किसी भी टॉम, डिक या हैरी को किसी भी एल्गोरिथ्म के बकवास कार्यान्वयन को लिखने की अनुमति देता है" - यह खुलेपन से कोई लेना-देना नहीं है, यह विशुद्ध रूप से एक सार्वजनिक एपीआई होने का एक परिणाम है, जिसके कई बंद स्रोत उत्पाद हैं (अर्थात कोई भी स्वामित्व सॉफ्टवेयर जिसमें एक प्लगइन इंटरफ़ेस है)। हालांकि अच्छा जवाब।
n

3
"अब नहीं है, न ही कभी वहाँ गया है, और न ही कभी होगा, कोई भी प्रोग्रामिंग भाषा है जिसमें बुरा कोड लिखना सबसे कम मुश्किल है।"
ar

33

यह अन्य सॉफ़्टवेयर की तुलना में अधिक या कम विश्वसनीय नहीं है। बेस और अनुशंसित आर शायद योगदान पैकेजों की तुलना में त्रुटियों के लिए कम संभावना है, लेकिन यह लेखकों पर निर्भर करता है।

लेकिन आर का सबसे बड़ा फायदा यह है कि आप खुद देख सकते हैं कि यह क्या है! यह मुफ्त सॉफ्टवेयर है, स्टाटा या एसपीएसएस या समान नहीं है। इसलिए, भले ही यह अविश्वसनीय था, यह अंततः पता लगाया जाएगा। मालिकाना सॉफ्टवेयर के लिए ऐसा नहीं हो सकता है। और आप इसे और अधिक विश्वसनीय बनाने में मदद कर सकते हैं।

आपके प्रोफेसर की बाकी टिप्पणियों के लिए, वह स्पष्ट रूप से गलत है और FUD फैलाने वाला व्यक्ति है। लेकिन मुझे यह कहने की अनुमति दें कि अविश्वसनीय सॉफ्टवेयर को इस क्षेत्र में उपयोग किए गए मॉडल और अनुमानों और अनुमानों के आधार पर अर्थशास्त्री की चिंताओं का कम से कम होना चाहिए।

यदि आप इसे पसंद करते हैं तो आर के साथ छड़ी करें और हो सकता है कि आप और प्रोफेसर अर्थशास्त्र के लिए अच्छे सॉफ्टवेयर विकसित करने में भी योगदान दे सकें। यहाँ एक संभवतः दिलचस्प शुरुआती बिंदु है http://cran.r-project.org/web/views/Econometrics.html और http://cran.r-project.org/web/views/TimeSeries.html


1
आपका बहुत बहुत धन्यवाद! मैं वास्तव में आर के साथ रहना चाहता हूं। मुझे लगता है कि यह एक महान सॉफ्टवेयर है। इसके अलावा, मैं हमेशा ओपन सोर्स का बहुत बड़ा प्रशंसक रहा हूं।
SavedByJESUS

17
हमारे समय के एक दुर्भाग्यपूर्ण सच को बताने के लिए +1। "अविश्वसनीय सॉफ्टवेयर को इस क्षेत्र में उपयोग किए गए मॉडल और मान्यताओं और अनुमानों के आधार पर अर्थशास्त्री की चिंताओं का कम से कम होना चाहिए।"
digitalmaps

2
मैं यहां व्राई टोन की सराहना करता हूं, लेकिन कुछ असहमति संभव है। मालिकाना सॉफ्टवेयर में त्रुटियों को विभिन्न तरीकों से दिखाया जा सकता है, उदाहरण के लिए यदि आर में परिणामों के साथ स्पष्ट असहमति है जो पूरी तरह से सही दिखाई देते हैं। मालिकाना सॉफ्टवेयर के बारे में यहाँ कुछ FUD है जो R के बारे में मूर्खतापूर्ण FUD के समान ही अनुचित है। R में चेकबिलिटी लगभग सभी R उपयोगकर्ताओं के लिए सिद्धांत रूप में जांचनीयता है; यह एक विशेषता है कि यह मौजूद है, लेकिन यह कहते हुए कि आप अपने लिए कोड की जांच कर सकते हैं थोड़ा बयानबाजी भी है। ध्यान दें कि Stata के लिए अधिकांश कोड उपयोगकर्ताओं को दिखाई देता है; यह सिर्फ निष्पादन योग्य है जो नहीं है।
निक कॉक्स

23

आपके प्रोफेसर कुछ साहसिक दावे करते हैं। मुझे संदेह है कि समस्या आर भाषा से अपरिचित थी, न कि वास्तविक परिणाम। मैं एक ऐसी कंपनी में काम करता हूं जो बहुत अधिक अर्थमितीय मॉडलिंग करती है और हम आर में सब कुछ करते हैं। मैंने अपने अर्थशास्त्री सहकर्मी को भी यू का उपयोग करने के लिए परिवर्तित कर दिया।

मेरे व्यक्तिगत अनुभव में अर्थशास्त्र के क्षेत्र में, विश्वसनीयता का मुद्दा दूसरे रास्ते पर जा सकता है। उदाहरण के लिए EVIEWS संस्करण 5 में पैनल डेटा के साथ काम करते समय कुछ अजीब कीड़े थे। और यह सामान्य रूप से रिपोर्ट किए गए ओएलएस के लिए डर्बिन-वाटसन स्टेटिस्टिक की सूचना देता है, जो पैनल-डेटा सेटिंग में गलत है। पैनल डेटा के साथ काम करने के लिए आर पैकेज के पास इसके मुद्दे भी हैं, लेकिन यहां पैसे का तर्क आर के पक्ष में दृढ़ता से खेलता है।

हाल ही में मैं गैर-स्थिर पैनल टाइम श्रृंखला विधियों पर पाठ्यक्रम में था। लेक्चरर ने RATS सॉफ्टवेयर का इस्तेमाल किया। कुछ कोड का प्रदर्शन करते समय उन्होंने कुछ आइकन पर क्लिक करने की सलाह दी जो कार्यक्षेत्र को कई बार साफ करते हैं, बस मामले में। विश्वसनीयता की बात करें।


20

मैं एक अर्थशास्त्री हूं और अब मैं 4 साल से रिसर्च में काम कर रहा हूं, ज्यादातर एप्लाएंटिक्स कर रहा हूं। वहाँ अर्थमिति के बहुत सारे पैकेज हैं, और उन सभी के लिए जगह है। मेरे विचार में, अर्थशास्त्र में, स्टैटा का उपयोग लगभग सभी चीजों के लिए किया जाता है, लेकिन समय श्रृंखला के लिए समय श्रृंखला, चूहे, ईव्यू और ऑक्स का उपयोग किया जाता है, अधिक निम्न स्तर की प्रोग्रामिंग के लिए मैटलैब और गॉस का उपयोग किया जाता है।

R का लाभ यह है कि यह अन्य कार्यक्रमों को करने में लगभग सब कुछ करने में सक्षम है, और यह मुफ़्त और खुला है। इसके लिए कुछ और प्रोग्रामिंग की आवश्यकता होती है और इसमें डिब्बाबंद प्रक्रियाएँ कम होती हैं, लेकिन यह अंत में काम करवाती हैं। मैं ज्यादातर समय स्टाटा का उपयोग करता हूं, लेकिन अगर मुझे सब कुछ करने के लिए एक सॉफ्टवेयर चुनना था, तो मैं आर चुनूंगा।

अधिकांश अर्थमिति समस्याओं पर आर बहुत विश्वसनीय है, लेकिन मैं आर के लिए लिखे गए कुछ दिनचर्या के उदाहरण प्रदान कर सकता हूं जो विश्वसनीय नहीं हैं। मुझे 3SLS और डिमांड सिस्टम एस्टीमेशन रूटीन की समस्या है। न्यूमेरिकल ऑप्टिमाइज़ेशन रूटीन स्टाट या गॉस में उतने मजबूत नहीं हैं। दूसरी ओर, क्वांटाइल रिग्रेशन जैसी समस्याओं में आर ज्यादा बेहतर है। फिर भी, R के एक अच्छे कामकाजी ज्ञान के साथ, आप यह पता लगा सकते हैं कि R के उपयोगकर्ता की लिखित दिनचर्या में क्या समस्या है, इसे ठीक करें और काम करना जारी रखें। इसलिए मुझे नहीं लगता कि कुछ विशिष्ट दिनचर्या में विश्वसनीयता की कमी आर का उपयोग नहीं करने का एक अनिवार्य कारण है।

मेरी सलाह होगी कि आप R का उपयोग करते रहें, लेकिन अन्य प्रोग्राम पर अनुभव करने के लिए जो आपके क्षेत्र में व्यापक रूप से उपयोग किए जाते हैं, जैसे समय श्रृंखला के लिए microeconometrics या Rats के लिए Stata।


13

जब मैं स्नातक स्तर के आंकड़े पढ़ा रहा था, तो मैं अपने छात्रों को बता रहा था: "मुझे परवाह नहीं है कि आप किस पैकेज का उपयोग करते हैं, और आप अपने होमवर्क के लिए कुछ भी उपयोग कर सकते हैं, जैसा कि मैं आपसे स्पष्ट स्पष्टीकरण प्रदान करने की अपेक्षा करता हूं, और अगर मैं करूंगा देख tr23y5mआपके प्रस्तुतियाँ में परिवर्तनशील नाम। मैं स्टाटा में आपके सीखने का बहुत अच्छा समर्थन कर सकता हूं, और यथोचित रूप से, आर। में, एसएएस के साथ, आप अपने दम पर हैं, जैसा कि आप दावा करते हैं कि आपने इसमें एक कोर्स लिया है। SPSS या मिनिटैब के साथ, भगवान आपको आशीर्वाद देते हैं "। मुझे लगता है कि उचित नियोक्ता समान सोचते हैं। परियोजना के परिणामों के मामले में आपकी उत्पादकता क्या है। यदि आप 40 घंटे के काम के साथ आर में लक्ष्य प्राप्त कर सकते हैं, तो ठीक है; यदि आप इसे C ++ में 40 घंटे के काम में हासिल कर सकते हैं, ठीक है; यदि आप जानते हैं कि यह आर में 40 घंटे में कैसे करना है, लेकिन आपका पर्यवेक्षक आपको एसएएस में ऐसा करना चाहता है, और आपको कुछ मूल बातें सीखने के लिए सिर्फ 60 घंटे खर्च करने होंगे और जहाँ अर्धविराम जाते हैं, वह केवल शेष कोड की बड़ी तस्वीर के संदर्भ में समझदार हो सकता है ... और तब प्रबंधक एक आर प्रोग्रामर को काम पर रखने में बहुत समझदार नहीं था।

कुल लागत के इस दृष्टिकोण से, "नि: शुल्क" आर एक बेहद हद तक मिथक है। किसी भी गंभीर परियोजना के लिए कस्टम कोड की आवश्यकता होती है, अगर सिर्फ डेटा इनपुट के लिए और आउटपुट स्वरूपण के लिए, और यह पेशेवर समय की गैर-शून्य लागत है। यदि इस डेटा इनपुट और फॉर्मेटिंग के लिए एसएएस कोड के 10 घंटे और आर कोड के 20 घंटे की आवश्यकता होती है, तो आर मार्जिन पर एक अधिक महंगा सॉफ्टवेयर है , जैसा कि एक अर्थशास्त्री कार्यक्षमता के दिए गए टुकड़े का उत्पादन करने के लिए अतिरिक्त लागत के संदर्भ में कहेगा। । यदि किसी बड़ी परियोजना के लिए 200 घंटे R प्रोग्रामर के समय की आवश्यकता होती है और समान कार्यक्षमता प्रदान करने के लिए Stata प्रोग्रामर के 100 घंटे के समय में, Stem समग्र सस्ता होता है, यहां तक ​​कि ~ $ 1K लाइसेंस के लिए लेखांकन जो आपको खरीदने की आवश्यकता है। ऐसी प्रत्यक्ष तुलनाओं को देखना दिलचस्प होगा; मैं SPSS कोड के 2Mb की एक बड़ी गड़बड़ी को फिर से लिखने में शामिल था, जिसके बारे में कहा गया था कि Stata कोड के ~ 150K में लगभग 10 व्यक्ति-वर्ष जमा हो गए थे, जो जितनी तेजी से चलता था, उतना ही तेज हो सकता है; यह लगभग 1 व्यक्ति-वर्ष परियोजना थी। मुझे नहीं पता कि यह 10: 1 दक्षता अनुपात एसपीएसएस के लिए विशिष्ट है: स्टैटा तुलना, लेकिन मुझे आश्चर्य नहीं होगा यदि यह था। मेरे लिए, खोज लागतों के कारण R के साथ काम करना हमेशा एक बड़ा खर्च होता है: मुझे यह निर्धारित करना होगा कि समान नामों वाले पांच पैकेजों में से मुझे क्या करना है, और यह पता लगाना है कि क्या यह मज़बूती से मेरे लिए इसे उपयोग करने के लिए पर्याप्त है मेरा काम। अक्सर इसका मतलब है कि मेरे लिए यह सस्ता है कि मैं अपना स्टैट्टा कोड कम समय में लिखूं कि मैं किसी कार्य में आर काम कैसे करूं। यह समझा जाना चाहिए कि यह मेरी व्यक्तिगत पहचान है; इस साइट पर अधिकांश लोग मेरे से बेहतर उपयोग करते हैं।

मजेदार यह है कि आपके प्रोफेसर आर के ऊपर स्टाटा या GAUSS पसंद करेंगे क्योंकि "आर अर्थशास्त्रियों द्वारा नहीं लिखा गया था"। न तो Stata या GAUSS थे; वे कंप्यूटर वैज्ञानिकों के उपकरणों का उपयोग करके कंप्यूटर वैज्ञानिकों द्वारा लिखे गए हैं। यदि आपके प्रोफेसर को CodeAcademy.com से प्रोग्रामिंग के बारे में विचार मिलते हैं, तो यह कुछ भी नहीं से बेहतर है, लेकिन व्यावसायिक ग्रेड सॉफ्टवेयर विकास कोडएकैडमी.कॉम टेक्स्ट बॉक्स में टाइप करने से अलग है क्योंकि भाड़ा ट्रक चलाना बाइक चलाने से अलग है। (स्टाटा को एक श्रम अर्थशास्त्री द्वारा परिवर्तित कंप्यूटर वैज्ञानिक द्वारा शुरू किया गया था, लेकिन वह अब तक लगभग 25 वर्षों से इस श्रम अर्थमिति की बात नहीं कर रहे हैं।)

अपडेट : जैसा कि एंडीडब्ल्यू ने नीचे टिप्पणी की है, आप किसी भी भाषा में भयानक कोड लिख सकते हैं। लागत का प्रश्न तब बनता है, जिस भाषा में डिबग करना आसान है। मेरे लिए यह ऐसा लगता है कि आउटपुट कितना सटीक और ज्ञानवर्धक है, और वाक्य रचना स्वयं कितनी आसान और पारदर्शी है, और मेरे पास इसके लिए कोई अच्छा जवाब नहीं है। उदाहरण के लिए, पायथन कोड इंडेंटिंग को लागू करता है, जो एक अच्छा विचार है। स्टैटा और आर कोड को कोष्ठक के ऊपर मोड़ा जा सकता है, और यह एसएएस के साथ काम करने वाला नहीं है। सबरूटीन का उपयोग एक दोधारी तलवार है: आर में *apply()तदर्थ के साथ का उपयोग functionस्पष्ट रूप से बहुत कुशल है, लेकिन डीबग करना कठिन है। एक समान टोकन के द्वारा, स्टाटा localएस लगभग कुछ भी मुखौटा कर सकता है, और एक खाली स्ट्रिंग को डिफ़ॉल्ट कर सकता है, जबकि उपयोगी, मुश्किल से पकड़ने वाली त्रुटियों को भी जन्म दे सकता है।


1
यह एक अच्छा जवाब है, लेकिन IMO अति-सामान्यीकरण बहुत मददगार नहीं हैं (आप व्यावहारिक रूप से किसी भी भाषा में बुरा या अच्छा कोड लिख सकते हैं, स्टैटा अच्छा कोडिंग मानकों को लागू करने में जादुई नहीं है)। मेरे पास यह देखने में कठिन समय है कि एसपीएसएस कोड का 2mb कुशल SPSS कोड कैसे शुरू होता है (सिंटैक्स हाइलाइटिंग वाले नए संस्करणों के साथ संपादक में ऐसी फ़ाइल को खोलने की भी सलाह दी जाएगी)। लगता है कि यह एक अच्छा मौका है जब यह किसी भी भाषा में फिर से लिखने में अच्छा समय बिताया गया था।
एंडी डब्ल्यू

1
मैं एसपीएसएस कोड बिल्कुल नहीं लिखता, और मेरी समझ यह है कि मैंने जिस कोड के साथ काम किया है, वह कोड के रूप में नहीं लिखा गया था, बल्कि बिंदु और क्लिक इंटरफेस से बचा था, और फिर थोड़ा ब्रश किया जा सकता है। मुझे लगता है कि SPSS इंटरफ़ेस-से-कोड रूपांतरण के साथ सभी चूक और इस तरह से डाल देगा, इसलिए यह शुरू करने के लिए बहुत ही कुशल कोड नहीं था।
स्टैस्क

12

मैं किसी ऐसे व्यक्ति से बहुत सावधान रहूंगा जो किसी तथ्य का दावा करता है लेकिन कभी भी किसी भी चीज के साथ उसका समर्थन नहीं करता है।

आप आसानी से उसकी दलीलें पलट सकते हैं।

उदाहरण के लिए, कोड लिखने के लिए भुगतान करने वाले लोगों को इसे प्राप्त करने के लिए कम प्रोत्साहन मिल सकता है क्योंकि एक उम्मीद है कि उनका कोड सही होगा, जबकि विशिष्ट तहखाने निवासी एक ऐसा कमिटमेंट करना चाहता है जो परियोजना के नेताओं को प्रभावित करेगा। हो सकता है कि वह इस बात पर कम ध्यान नहीं दे पा रहा हो कि वह कितना अतिरिक्त समय मुफ्त में खर्च कर रहा है अगर इसका मतलब है कि गुणवत्ता का काम हो जाए।

यदि यादृच्छिक संख्या जनरेटर 'गन्दा' है (जो एक अस्पष्ट शब्द है, आसानी से अपने तर्क का समर्थन करने के लिए एक वास्तविक तथ्य को प्रतिस्थापित करता है), तो उसे यह साबित करने में सक्षम होना चाहिए या आपको कोई ऐसा व्यक्ति दिखा सकता है जो कर सकता है।

यदि उसे किसी पैकेज से असंगत परिणाम मिलते हैं, तो उसे उस परिणाम को प्राप्त करने के लिए उठाए गए कदमों को इंगित करने में सक्षम होना चाहिए। यदि यह वास्तव में एक बग है और आपके पास अच्छा प्रोग्रामिंग कौशल है, तो आप भी उसके लिए कोशिश कर सकते हैं और इसे ठीक कर सकते हैं!

मुझे एहसास है कि मेरा जवाब सीधे आपके सवाल का जवाब नहीं देता (क्षमा करें)। बस जिस तरह से वह अपने बिंदुओं को शब्द देता है, आप देख सकते हैं कि इसके पीछे कोई मांस नहीं है। अगर वहाँ है, तो अपने लोगों के लिए इसे और अधिक चर्चा के लिए अपने प्रश्न में संपादित करने के लिए स्वतंत्र महसूस करें!


5

ReplicationWiki (जिसमें मैं काम करता हूं) पर आप देख सकते हैं कि आर उन सॉफ्टवेयर पैकेजों में से एक था जिसका इस्तेमाल 2000-2013 में पहले से ही कुछ अच्छी तरह से स्थापित पत्रिकाओं में प्रकाशित कुछ 2000 अनुभवजन्य अध्ययनों के लिए किया जाता था। ऐसा लगता है कि हाल के वर्षों में इसका अधिक उपयोग किया गया था। स्टैटा का उपयोग सबसे अधिक बार (> 900 बार) किया गया, इसके बाद MATLAB (280), एसएएस (60), जीएयूएसएस (60), एक्सेल (50), आर (30), फोरट्रान (30), मैथमेटिका (19), ईवीवाई (18), जेड-ट्री (16), डायनेरे (15), आरएटीएस (12), सी (8), सी ++ (6), अजगर (5, हाल ही के अध्ययन), एसपीएसएस (5) और कुछ अन्य। अक्सर कई बार एक से अधिक पैकेज का उपयोग किया जाता है।


सॉफ्टवेयर उपयोग के बारे में यह दिलचस्प सबूत है। लेकिन यह स्पष्ट संकेत प्रदान करने के अलावा सवाल पर सीधे सहन नहीं करता है कि आर का व्यापक रूप से उपयोग किया जाता है (अनुमान है कि यह व्यापक रूप से विश्वसनीय है, जर्मन भी है)।
निक कॉक्स

2

मैं आधे दशक से आर का उपयोग कर रहा हूं और एसएएस, एसपीएसएस, कैल्क, डब्ल्यूईकेए और कुछ अन्य उपकरणों का भी उपयोग करता हूं। मैंने कभी भी किसी भी उपकरण के साथ आनंद नहीं लिया जितना कि आर। मूल रूप से आर के माध्यम से था जो उन लोगों के लिए है जो स्वतंत्र रूप से सोचते हैं और अपने स्वयं के सीखने पर कुछ करने की कोशिश करते हैं। जब आंकड़ों की बात आती है, तो यह सभी तरीकों के बारे में है। उपयोगकर्ताओं को यह नहीं पता चल सकता है कि वाणिज्यिक सॉफ्टवेयर में तरीकों को कैसे परिभाषित किया गया था और वे सही या गलत हो सकते हैं। आर उन लोगों के लिए है जो तरीकों को परिभाषित करना चाहते हैं और उन तरीकों का उपयोग करना चाहते हैं जो उनकी आवश्यकताओं के लिए उपयुक्त हैं। यह सब स्वतंत्रता के बारे में है। यह स्वतंत्रता पैसे खर्च करने और उन्हें खरीदने के बावजूद वाणिज्यिक सॉफ्टवेयर के साथ नहीं है। ज्ञान समुदाय (समाज) की संपत्ति है कोई भी उसी पर लेखकों का दावा नहीं कर सकता है। अनुसंधान सभी समस्याओं के समाधान खोजने के बारे में है। जहां तक ​​आर का संबंध है, उपयोगकर्ताओं को परिभाषित करने और सुधारने के लिए स्वतंत्र होने के तरीकों की चिंता नहीं करनी चाहिए। उदाहरण के लिए, यदि कोई मॉडल विशिष्ट समस्या या गलत तरीके से परिभाषित तरीके से मौजूद है, जिसे एक नया कोड फिक्स करके या विकसित करके तय किया जा सकता है। ऐसा करने से एक शोधकर्ता न केवल ज्ञान विकसित करता है, बल्कि विकसित भी होता है।

R का लाभ यह है कि किसी को कंप्यूटर प्रोग्रामर नहीं होना चाहिए। सांख्यिकीय विधियां केवल नियंत्रण कथनों और लूप के साथ फ़ंक्शन लिखने के बारे में हैं (शुरुआत के साथ, उच्च स्तर की चीजें बाद में आती हैं)। आर में newbies के लिए प्रोग्रामिंग का बहुत आसान वातावरण है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.