संयोग से, Google स्प्रेडशीट के उपयोग के बारे में एक प्रश्न इसके विपरीत (इसलिए, दिलचस्प) राय उठाया गया, क्या आप में से कुछ लोग अपने सांख्यिकीय कार्य को दूसरों के साथ संचालित करने और साझा करने के लिए Google डॉक्स स्प्रेडशीट का उपयोग करते हैं?
मेरे मन में एक पुराना कागज है जो इतना निराशावादी नहीं लगता था, लेकिन यह केवल आपके द्वारा उल्लिखित कागज में थोड़ा सा उद्धृत किया गया है: कीलिंग और पावुर, नौ सांख्यिकीय सॉफ्टवेयर पैकेजों की विश्वसनीयता का एक तुलनात्मक अध्ययन (CSDA 2007 51: 3811)। लेकिन अब, मैंने अपनी हार्ड ड्राइव पर तुम्हारा पाया। 2008 में एक विशेष मुद्दा भी था, Microsoft Excel 2007 पर विशेष अनुभाग देखें , और हाल ही में जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर में: स्प्रैडशीट्स की न्यूमेरिकल सटीकता पर ।
मुझे लगता है कि यह एक लंबे समय से चली आ रही बहस है, और आप सांख्यिकीय कंप्यूटिंग के लिए एक्सेल विश्वसनीयता के बारे में अलग-अलग कागजात / राय पाएंगे। मुझे लगता है कि चर्चा के विभिन्न स्तर हैं (आप किस तरह का विश्लेषण करने की योजना बना रहे हैं, क्या आप आंतरिक सॉल्वर पर भरोसा करते हैं, क्या गैर-रेखीय शब्द हैं जो किसी दिए गए मॉडल में प्रवेश करते हैं, आदि), और संख्यात्मक अशुद्धि के स्रोत उत्पन्न हो सकते हैं। उचित कंप्यूटिंग त्रुटियों या डिजाइन विकल्पों के मुद्दों के परिणामस्वरूप ; यह अच्छी तरह से संक्षेप में है
एम। अल्टमैन, जे। गिल और सांसद मैकडोनाल्ड,
सामाजिक वैज्ञानिक , विली, 2004 के लिए सांख्यिकीय कम्प्यूटिंग में संख्यात्मक मुद्दे ।
अब, खोजपूर्ण डेटा विश्लेषण के लिए, विभिन्न विकल्प हैं जो उन्नत दृश्य क्षमताओं, बहुभिन्नरूपी और गतिशील ग्राफिक्स, उदाहरण के लिए GGobi प्रदान करते हैं - लेकिन इस विकी पर संबंधित थ्रेड देखें।
लेकिन, स्पष्ट रूप से आपने जो पहला मुद्दा बनाया है, वह किसी अन्य समस्या (IMO) को संबोधित करता है, अर्थात् बड़े डेटा सेट से निपटने के लिए एक स्प्रेडशीट का उपयोग करना: यह एक्सेल में एक बड़ी सीएसवी फ़ाइल आयात करना संभव नहीं है (मैं जीनोमिक डेटा के बारे में सोच रहा हूं) लेकिन यह अन्य प्रकार के उच्च-आयामी डेटा पर लागू होता है)। यह उस उद्देश्य के लिए नहीं बनाया गया है।
R
एसएएस से अधिक सटीक प्रतीत होता है ) के बीच वितरण गणना में उल्लेखनीय सुधार है ।