R, bash, Python, asciidoc, (La) TeX, खुला स्रोत sofwtare या किसी भी un * x टूल के उत्साही उपयोगकर्ता के रूप में, मैं एक ऑब्जेक्टिव उत्तर नहीं दे सकता। इसके अलावा, जैसा कि मैं अक्सर एमएस एक्सेल या किसी भी प्रकार के स्प्रेडशीट के उपयोग के खिलाफ तर्क देता हूं (ठीक है, आप अपना डेटा, या इसका हिस्सा देखते हैं, लेकिन और क्या?), मैं बहस में सकारात्मक योगदान नहीं करूंगा। मैं केवल एक ही नहीं हूँ, उदाहरण के लिए
- पी। बर्न्स से स्प्रेडशीट की लत ।
- एमएस एक्सेल की सटीकता और सटीकता , 2004 आर मेलिंग-सूची पर एक पोस्ट
- एल। नुसेल, Microsoft Excel 97 , कम्प्यूटेशनल स्टेटिस्टिक्स एंड डेटा एनालिसिस, 26: 375-377, 1998 में सांख्यिकीय वितरण की सटीकता पर । ( पीडीएफ )
- Microsoft Excel 2000 और Excel XP , कम्प्यूटेशनल स्टेटिस्टिक्स एंड डेटा एनालिसिस , 40: 713-721, 2002 में सांख्यिकीय प्रक्रियाओं की सटीकता पर बीडी मैकुलॉफ और बी। विल्सन ।
- एम। अल्टमैन, जे। गिल और सांसद मैकडोनाल्ड, सामाजिक वैज्ञानिक , विली, 2004 के लिए सांख्यिकीय कम्प्यूटिंग में संख्यात्मक मुद्दे । [उदाहरण के लिए, पीपी। 12-14]
मेरा एक सहकर्मी पिछड़े अनुकूलता की कमी के कारण अपने सभी मैक्रोज़ ढीले कर देता है, आदि एक अन्य सहयोगी ने आनुवांशिकी डेटा (लगभग 700 विषय 800,000 मार्कर, 120 मो) पर जीनोटाइप किए गए, बस "उन्हें देखने के लिए" आयात करने की कोशिश की। एक्सेल विफल रहा, नोटपैड ने भी हार मान ली ... मैं vi के साथ "उन्हें देखने" में सक्षम हूं, और जल्दी से कुछ sed / awk या perl स्क्रिप्ट के साथ डेटा को पुन: स्वरूपित कर रहा हूं। इसलिए मुझे लगता है कि स्प्रेडशीट की उपयोगिता के बारे में चर्चा करने के लिए अलग-अलग स्तर हैं। या तो आप छोटे डेटा सेट पर काम करते हैं, और केवल प्राथमिक सांख्यिकीय सामान लागू करना चाहते हैं और शायद यह ठीक है। फिर, परिणामों पर भरोसा करना आपके ऊपर है, या आप हमेशा स्रोत कोड के लिए पूछ सकते हैं, लेकिन शायद NIST बेंचमार्क के साथ सभी इनलाइन प्रक्रियाओं का त्वरित परीक्षण करना सरल होगा। मुझे नहीं लगता कि यह आंकड़ों को करने के एक अच्छे तरीके से मेल खाता है क्योंकि यह एक सच्चा सांख्यिकीय सॉफ्टवेयर (IMHO) नहीं है, हालाँकि उपरोक्त सूची के अपडेट के रूप में, एमएस एक्सेल के नए संस्करणों ने इसकी सटीकता में सुधार के लिए प्रदर्शन किया है। सांख्यिकीय विश्लेषण, कीलिंग और पावुर देखें, नौ सांख्यिकीय सॉफ्टवेयर पैकेजों की विश्वसनीयता का एक तुलनात्मक अध्ययन ( CSDA 2007 51: 3811)।
फिर भी, 10 या 20 में से एक पेपर (बायोमेडिसिन, मनोविज्ञान, मनोचिकित्सा में) में एक्सेल के साथ बनाए गए ग्राफिक्स शामिल हैं, कभी-कभी ग्रे बैकग्राउंड, क्षैतिज काली रेखा या स्वचालित कथा (एंड्रयू गेलमैन और हैडली विकम को हटाए बिना) निश्चित रूप से खुश होते हैं। मुझे यह देखते हुए)। लेकिन आम तौर पर, यह फ्लोइंगडाटा के हालिया सर्वेक्षण के अनुसार सबसे अधिक इस्तेमाल किया जाने वाला "सॉफ्टवेयर" है , जो मुझे ब्रायन रिप्ले (जो एमएएस आर पैकेज का सह-लेखक था, और पैटर्न मान्यता पर एक उत्कृष्ट पुस्तक लिखता है) की एक पुरानी बात याद दिलाता है। , दूसरों के बीच में):
चलो अपने आप को बच्चा नहीं बनाते हैं: आंकड़ों के लिए सबसे व्यापक रूप से उपयोग किए जाने वाला टुकड़ा एक्सेल (बी डी रिप्ले जन दे लीव के माध्यम से), http://www.stats.ox.ac.uk/~ripley/RSS2002.pdf
अब, यदि आपको लगता है कि यह आपको अपने आँकड़े प्राप्त करने का एक त्वरित और आसान तरीका प्रदान करता है, तो क्यों नहीं? समस्या यह है कि ऐसे वातावरण में अभी भी चीजें हैं (या कम से कम, यह मुश्किल है) नहीं किया जा सकता है। मुझे लगता है कि बूटस्ट्रैप, क्रमपरिवर्तन, बहुभिन्नरूपी खोज डेटा विश्लेषण, कुछ नाम करने के लिए। जब तक आप VBA (जो कि न तो स्क्रिप्टिंग है और न ही प्रोग्रामिंग लैंग्वेज है) में बहुत निपुण हैं, तो मुझे लगता है कि डेटा पर मामूली ऑपरेशन भी आर (या मैटलैब, या पायथन) के तहत बेहतर तरीके से संभाले जाते हैं, बशर्ते आपको डील करने के लिए सही टूल मिल जाए। उदाहरण के लिए तथाकथित डेटा.फ्रेम)। इन सबसे ऊपर, मुझे लगता है कि एक्सेल डेटा विश्लेषक के लिए बहुत अच्छी प्रथाओं को बढ़ावा नहीं देता है (लेकिन यह किसी "क्लिकोड्रोम" पर भी लागू होता है, डेटा प्रोसेसिंग का रिकॉर्ड बनाए रखने की आवश्यकता के बारे में मेडस्टैट्स पर चर्चा देखें,डॉक्यूमेंटिंग एनालिसिस और डेटा एडिट्स ), और मुझे यह पोस्ट प्रैक्टिकल स्टैट्स पर अपेक्षाकृत कुछ एक्सेल कमियों के बारे में पता चला। फिर भी, यह एक्सेल पर लागू होता है, मुझे नहीं पता कि यह GDocs में कैसे अनुवाद करता है।
अपने काम को साझा करने के बारे में, मुझे लगता है कि गितुब (या स्रोत कोड के लिए जिस्ट ) या ड्रॉपबॉक्स (हालांकि ईयूएलए कुछ लोगों को हतोत्साहित कर सकता है) बहुत अच्छे विकल्प हैं (संशोधन इतिहास, अनुदान प्रबंधन यदि आवश्यक हो, आदि)। मैं एक सॉफ्टवेयर के उपयोग को प्रोत्साहित नहीं कर सकता हूं जो मूल रूप से आपके डेटा को द्विआधारी प्रारूप में संग्रहीत करता है। मुझे पता है कि इसे R, मतलाब, स्टाटा, SPSS में आयात किया जा सकता है, लेकिन मेरी राय में:
- डेटा निश्चित रूप से एक पाठ प्रारूप में होना चाहिए, जिसे किसी अन्य सांख्यिकीय सॉफ़्टवेयर द्वारा पढ़ा जा सकता है;
- विश्लेषण प्रतिलिपि प्रस्तुत करने योग्य होना चाहिए, जिसका अर्थ है कि आपको अपने विश्लेषण के लिए एक पूरी स्क्रिप्ट प्रदान करनी चाहिए और इसे किसी भी समय किसी अन्य ऑपरेटिंग सिस्टम पर (हम पास के आदर्श मामले को पास करना चाहिए);
- अपने स्वयं के सांख्यिकीय सॉफ़्टवेयर को स्वीकृत एल्गोरिदम को लागू करना चाहिए और सांख्यिकीय मॉडलिंग में वर्तमान सर्वोत्तम प्रथाओं को प्रतिबिंबित करने के लिए इसे अपडेट करने का एक आसान तरीका होना चाहिए;
- आपके द्वारा चुनी गई साझाकरण प्रणाली में संस्करण और सहयोगी सुविधाएं शामिल होनी चाहिए।
बस।