एक्सेल एक सांख्यिकी कार्यक्षेत्र के रूप में

52

ऐसा लगता है कि बहुत से लोग (मेरे सहित) एक्सेल में खोजपूर्ण डेटा विश्लेषण करना पसंद करते हैं। कुछ सीमाएँ, जैसे स्प्रेडशीट में अनुमत पंक्तियों की संख्या एक दर्द है, लेकिन ज्यादातर मामलों में डेटा के साथ खेलने के लिए एक्सेल का उपयोग करना असंभव नहीं है।

मैकुलॉ और हेसर का एक पेपर , हालांकि, व्यावहारिक रूप से चिल्लाता है कि आपको अपने परिणाम सभी गलत मिलेंगे - और शायद नरक में भी जलते हैं - यदि आप एक्सेल का उपयोग करने का प्रयास करते हैं।

क्या यह कागज सही है या यह पक्षपातपूर्ण है? लेखक ध्वनि करते हैं जैसे वे माइक्रोसॉफ्ट से नफरत करते हैं।

software computational-statistics excel

— कार्लोस एक्सीली
स्रोत

5

सांख्यिकीय गणनाओं के लिए स्प्रेडशीट सॉफ़्टवेयर की सटीकता का एक हालिया विश्लेषण [केली बी। कीलिंग और रॉबर्ट जे। पावुर (2011): स्टेट्स ऑफ स्प्रेडशीट सॉफ़्टवेयर, द स्टेट स्टेटिस्टिशियन, 65: 4, 265-273] (वर्तमान में एक मुफ्त डाउनलोड) में दिखाई देता है। पर amstat.tandfonline.com/doi/pdf/10.1198/tas.2011.09076 )। परिणाम मिश्रित होते हैं और शायद थोड़ा आश्चर्य होता है। एक्सेल 2007 और एक्सेल 2010 (जो Rएसएएस से अधिक सटीक प्रतीत होता है ) के बीच वितरण गणना में उल्लेखनीय सुधार है ।

— whuber

45

सही काम के लिए सही उपकरण का उपयोग करें और उन उपकरणों की ताकत का फायदा उठाएं जिनसे आप परिचित हैं।

एक्सेल के मामले में कुछ मुख्य मुद्दे हैं:

कृपया डेटा को प्रबंधित करने के लिए स्प्रेडशीट का उपयोग न करें, भले ही आपका डेटा एक में फिट हो। तुम सिर्फ परेशानी, भयानक मुसीबत पूछ रहे हो। वस्तुतः टाइपोग्राफिक त्रुटियों, डेटा के थोक मिश्रण, डेटा मूल्यों को काट-छाँट, इत्यादि से कोई सुरक्षा नहीं है।
कई सांख्यिकीय कार्य वास्तव में टूट गए हैं। टी वितरण उनमें से एक है।
डिफ़ॉल्ट ग्राफिक्स भयानक हैं।
यह कुछ मौलिक सांख्यिकीय ग्राफिक्स, विशेष रूप से बॉक्सप्लॉट्स और हिस्टोग्राम को याद कर रहा है।
यादृच्छिक संख्या जनरेटर एक मजाक है (लेकिन इसके बावजूद अभी भी शैक्षिक उद्देश्यों के लिए प्रभावी है)।
उच्च-स्तरीय कार्यों और अधिकांश ऐड-इन्स से बचें; वे सी ** पी हैं। लेकिन यह सुरक्षित कंप्यूटिंग का सिर्फ एक सामान्य सिद्धांत है: यदि आप सुनिश्चित नहीं हैं कि एक फ़ंक्शन क्या कर रहा है, तो इसका उपयोग न करें। निचले स्तर के लोगों के लिए छड़ी (जिसमें अंकगणितीय कार्य शामिल हैं, रैंकिंग, ऍक्स्प, ln, ट्रिग फ़ंक्शंस, और - सीमा के भीतर - सामान्य वितरण फ़ंक्शंस)। एक ऐड-इन का उपयोग कभी न करें जो एक ग्राफिक पैदा करता है: यह भयानक होने वाला है। (एनबी: यह खरोंच से अपने स्वयं के संभावना भूखंड बनाने के लिए आसान मर चुका है। वे सही और उच्च अनुकूलन योग्य होंगे।)

इसके पक्ष में, हालांकि, निम्नलिखित हैं:

इसकी बुनियादी संख्यात्मक गणनाएं उतनी ही सटीक हैं जितनी कि डबल सटीक फ्लोट हो सकती हैं। उनमें कुछ उपयोगी शामिल हैं, जैसे लॉग गामा।
स्प्रेडशीट में इनपुट बक्से के चारों ओर एक नियंत्रण लपेटना काफी आसान है, जिससे गतिशील सिमुलेशन आसानी से बनाया जा सकता है।
यदि आपको गैर-सांख्यिकीय लोगों के साथ गणना साझा करने की आवश्यकता है, तो अधिकांश को स्प्रेडशीट के साथ कुछ आराम होगा और सांख्यिकीय सॉफ्टवेयर के साथ बिल्कुल भी नहीं, चाहे वह कितना भी सस्ता क्यों न हो।
यह पुराने संख्यात्मक कोड को पोर्ट करने सहित प्रभावी संख्यात्मक मैक्रोज़ लिखना आसान है, जो कि VBA के काफी करीब है। इसके अलावा, VBA का निष्पादन काफी तेजी से होता है। (उदाहरण के लिए, मेरे पास कोड है जो खरोंच से गैर-केंद्रीय टी वितरणों की गणना करता है और फास्ट फूरियर टॉक्स के तीन अलग-अलग कार्यान्वयन है।)
यह कुछ प्रभावी सिमुलेशन और क्रिस्टल बॉल और @Risk जैसे मोंटे-कार्लो ऐड-ऑन का समर्थन करता है। (वे अपने स्वयं के आरएनजी का उपयोग करते हैं, वैसे - मैंने जाँच की।)
डेटा का एक छोटा सा सेट (सीधे) के साथ बातचीत करने की क्षमता अद्वितीय है: यह किसी भी आँकड़े पैकेज, गणितज्ञ आदि से बेहतर है। भंडारण के भार के साथ एक विशाल कैलकुलेटर के रूप में उपयोग किए जाने पर, एक स्प्रेडशीट वास्तव में अपने आप में आ जाती है।
अच्छा ईडीए, मजबूत और प्रतिरोधी तरीकों का उपयोग करना आसान नहीं है, लेकिन एक बार ऐसा करने के बाद, आप इसे फिर से जल्दी से सेट कर सकते हैं। एक्सेल के साथ आप Tukey की EDA पुस्तक में सभी गणनाओं (हालांकि केवल कुछ भूखंडों) को प्रभावी ढंग से पुन: उत्पन्न कर सकते हैं , जिसमें n- वे टेबल की माध्यिका पॉलिश भी शामिल है (हालाँकि यह थोड़ा बोझिल है)।

मूल प्रश्न के सीधे उत्तर में, उस पेपर में एक पूर्वाग्रह है: यह उस सामग्री पर केंद्रित है जो एक्सेल सबसे कमजोर है और एक सक्षम सांख्यिकीविद् का उपयोग करने की कम से कम संभावना है। हालांकि, यह कागज की आलोचना नहीं है, क्योंकि इस तरह की चेतावनी प्रसारित करने की आवश्यकता है।

— व्हीबर
स्रोत

7

@whuber पेशेवरों और विपक्ष का एक अच्छा और आसान अवलोकन!

— chl

4

+1 अच्छा और संतुलित। मुझे विशेष रूप से "सीधे बातचीत करने की छाप" के बारे में बिंदु पसंद है जो मुझे लगता है कि एक्सेल का (या वास्तव में, स्प्रेडशीट का) सबसे बड़ा विक्रय बिंदु है। जनता के लिए घोषणात्मक प्रोग्रामिंग - जो बताती है कि क्यों कुछ लोगों को लगता है कि दुनिया के 80% व्यापारिक तर्क एक्सेल में लिखे गए हैं (प्रोग्रामर और सांख्यिकीविदों को इंगित करते हैं जो आर वी एसएएस या जावा वी सी ++, आदि के बारे में तर्क देते हैं)।

— ars

2

मैंने सुना है कि Microsoft ने एक्सेल में टूटे हुए कार्यों को ठीक करने के लिए कुछ संख्यात्मक विश्लेषकों को कई साल पहले काम पर रखा था। क्या आप जानते हैं कि 2007 या 2010 संस्करणों में एक्सेल के साथ समस्याएं अभी भी हैं या नहीं?

— जॉन डी। कुक

2

@Zach उदाहरण के लिए, Excel 2002 का उपयोग करते हुए, =TINV(2*p,df)p। के मान को लगभग 0 से घटाकर 0 तक गणना करें और सही मानों के साथ उनकी तुलना करें। (मैंने 32 के माध्यम से 2 से लेकर df के साथ जाँच की।) छठी महत्वपूर्ण आकृति में त्रुटियां शुरू होती हैं और फिर एक बार p लगभग 1.E-5 या उससे कम होता है। भले ही पी के ये मूल्य छोटे हैं, वे परीक्षण करने के लिए यथार्थवादी मूल्य हैं क्योंकि वे कई-तुलनात्मक परीक्षणों के लिए महत्वपूर्ण हैं और टी वितरण से संबंधित कंप्यूटिंग मूल्यों के लिए, जैसे कि गैर-केंद्रीय टी।

— whuber

2

मुझे लगता है कि आपके पहले बुलेट पॉइंट के लिए तारों और तीरों का होना जरूरी है। स्प्रैडशीट कोई ऑडिट ट्रेल प्रदान नहीं करता है, जो महत्वपूर्ण है यदि आप ऐसा काम करना चाहते हैं जो वास्तव में किसी पर निर्भर हो। इसके विपरीत, आर, सीधे एक ऑडिट ट्रेल प्रदान नहीं करता है, लेकिन चूंकि यह कमांड्स को स्वीकार करता है और आप कमांड को आयात, प्रीप्रोसेस, प्रोसेस, ग्राफ, आदि के लिए सहेज सकते हैं, एक अलग फाइल में आपके पास जो कुछ भी करना है उसका एक निशान हो सकता है। ग्राफ # 1 प्राप्त करें, और आप इसे खरोंच से फिर से बना सकते हैं, बस अगर आपके पास अचानक यह सवाल करने का कारण है।

— वेन

18

जैव सूचना विज्ञान सेटिंग में एक्सेल का उपयोग करने के बारे में एक दिलचस्प पेपर है:

गलत पहचानकर्ता: बायोइंफॉर्मेटिक्स, बीएमसी बायोइनफॉरमैटिक्स, 2004 ( लिंक ) में एक्सेल का उपयोग करते समय अनजाने में जीन नाम की त्रुटियों को पेश किया जा सकता है ।

यह लघु पेपर एक्सेल (विशेष तिथि और फ्लोटिंग प्वाइंट रूपांतरणों) में स्वचालित प्रकार के रूपांतरणों की समस्या का वर्णन करता है । उदाहरण के लिए, जीन नाम Sept2 को 2-Sept में बदल दिया जाता है। आप वास्तव में ऑनलाइन डेटाबेस में यह त्रुटि पा सकते हैं ।

बड़ी मात्रा में डेटा का प्रबंधन करने के लिए एक्सेल का उपयोग करना खतरनाक है। उपयोगकर्ता की सूचना के बिना गलतियाँ आसानी से रेंग सकती हैं।

— csgillespie
स्रोत

6

यह एक्सेल के उस पहलू से बहुत दूर है जो मुझे सबसे ज्यादा प्रभावित करता है। डेटा संग्रहण के लिए स्पष्ट डेटा प्रकारों की आवश्यकता होती है, स्वरूपण की नहीं।

— मैट पार्कर

3

दरअसल, यह सामान्य रूप से एमएस सॉफ्टवेयर के बारे में कुछ है जो मुझे परेशान करता है: यह आपके इनपुट को बदल देता है जो यह मानता है कि आप वास्तव में इसका मतलब है, और आप आमतौर पर ऐसा होते हुए भी नहीं देखते हैं।

— कार्लोस एकॉली

@csgillespie (+1) इस परिप्रेक्ष्य से एक्सेल को सुनने के लिए अच्छा है!

— chl

6

मेरी पसंदीदा त्रुटि तब हुई जब एक्सेल अन्य स्वरूपों में निर्यात के दौरान चुपचाप खेतों को काटता था। मिट्टी में कीटनाशक सांद्रता की एक फ़ाइल में, इसने प्रारंभिक अंक से कतर कर 1,000,050 (असाधारण रूप से विषाक्त) के मूल्य को 50 (लगभग असंगत) में बदल दिया!

— whuber

@ यदि आप एक्सेल में डेटा "स्टोर" कर रहे हैं, तो इसकी केवल सूचना ही दें। रिपोर्टिंग और चार्ट निर्माण के लिए फ्रंट एंड के रूप में एक्सेल को शुद्ध रूप से उपयोग करते समय इसकी एक बड़ी विशेषता है।

— बेनामी टाइप

11

ठीक है, यह प्रश्न कि क्या पेपर सही है या पक्षपाती होना आसान है: आप बस उनके कुछ विश्लेषणों को दोहरा सकते हैं और देख सकते हैं कि क्या आपको वही उत्तर मिलते हैं।

मैककूल अब कुछ वर्षों से एमएस एक्सेल के अलग-अलग संस्करण ले रहे हैं, और जाहिर तौर पर एमएस ने उन त्रुटियों को ठीक करने के लिए फिट नहीं देखा है जो उन्होंने पिछले संस्करणों में वर्षों पहले बताए थे।

मुझे एक्सेल में डेटा के साथ खेलने में कोई समस्या नहीं दिख रही है। लेकिन ईमानदार होने के लिए, मैं एक्सेल में अपने "गंभीर" विश्लेषण नहीं करूंगा। मेरी मुख्य समस्या अशुद्धि नहीं होगी (जो मुझे लगता है कि शायद ही कभी एक समस्या होगी), लेकिन एक साल बाद जब मेरे समीक्षक या मेरे बॉस पूछते हैं कि मैंने एक्स नहीं किया तो ट्रैक करने और मेरे विश्लेषण की नकल करने की असंभवता - आप अपनी बचत कर सकते हैं काम और आपका अंधा आर कोड में टिप्पणी करता है, लेकिन एक्सेल में सार्थक तरीके से नहीं।

— एस। कोलासा - मोनिका को बहाल करना
स्रोत

2

(+1) आप डेटा संपादन और विश्लेषण ( j.mp/dAyGGY ) का रिकॉर्ड रखने की आवश्यकता के बारे में मेडस्टैट्स पर चर्चा को अच्छी तरह से प्रतिध्वनित कर रहे हैं ! धन्यवाद।

— १०:०१ पर ० ch

अपने "काम और अंधे गलियों को सहेजना" एक्सेल के साथ आर के साथ करने के लिए कोई कठिन नहीं है। यह वास्तव में इसे करने की बात है। एक्सेल के साथ मुख्य समस्या इसकी ताकत से संबंधित है: अनजाने में कुछ बदलना बहुत आसान है। लेकिन ईडीए के लिए - ओपी का ध्यान - हम शायद ही कभी अगर हम सब कुछ बचाते हैं। ईडीए, आखिरकार, इंटरैक्टिव

— whuber

1

यदि आप इसे VB में करते हैं, तो अपने तरीकों का एक पुन: प्रयोज्य रिकॉर्ड रखना संभव है, लेकिन एक्सेल का GUI फ़ोकस उस व्यवहार को प्रोत्साहित नहीं करता है।

— जेम्स

7

संयोग से, Google स्प्रेडशीट के उपयोग के बारे में एक प्रश्न इसके विपरीत (इसलिए, दिलचस्प) राय उठाया गया, क्या आप में से कुछ लोग अपने सांख्यिकीय कार्य को दूसरों के साथ संचालित करने और साझा करने के लिए Google डॉक्स स्प्रेडशीट का उपयोग करते हैं?

मेरे मन में एक पुराना कागज है जो इतना निराशावादी नहीं लगता था, लेकिन यह केवल आपके द्वारा उल्लिखित कागज में थोड़ा सा उद्धृत किया गया है: कीलिंग और पावुर, नौ सांख्यिकीय सॉफ्टवेयर पैकेजों की विश्वसनीयता का एक तुलनात्मक अध्ययन (CSDA 2007 51: 3811)। लेकिन अब, मैंने अपनी हार्ड ड्राइव पर तुम्हारा पाया। 2008 में एक विशेष मुद्दा भी था, Microsoft Excel 2007 पर विशेष अनुभाग देखें , और हाल ही में जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर में: स्प्रैडशीट्स की न्यूमेरिकल सटीकता पर ।

मुझे लगता है कि यह एक लंबे समय से चली आ रही बहस है, और आप सांख्यिकीय कंप्यूटिंग के लिए एक्सेल विश्वसनीयता के बारे में अलग-अलग कागजात / राय पाएंगे। मुझे लगता है कि चर्चा के विभिन्न स्तर हैं (आप किस तरह का विश्लेषण करने की योजना बना रहे हैं, क्या आप आंतरिक सॉल्वर पर भरोसा करते हैं, क्या गैर-रेखीय शब्द हैं जो किसी दिए गए मॉडल में प्रवेश करते हैं, आदि), और संख्यात्मक अशुद्धि के स्रोत उत्पन्न हो सकते हैं। उचित कंप्यूटिंग त्रुटियों या डिजाइन विकल्पों के मुद्दों के परिणामस्वरूप ; यह अच्छी तरह से संक्षेप में है

एम। अल्टमैन, जे। गिल और सांसद मैकडोनाल्ड, सामाजिक वैज्ञानिक , विली, 2004 के लिए सांख्यिकीय कम्प्यूटिंग में संख्यात्मक मुद्दे ।

अब, खोजपूर्ण डेटा विश्लेषण के लिए, विभिन्न विकल्प हैं जो उन्नत दृश्य क्षमताओं, बहुभिन्नरूपी और गतिशील ग्राफिक्स, उदाहरण के लिए GGobi प्रदान करते हैं - लेकिन इस विकी पर संबंधित थ्रेड देखें।

लेकिन, स्पष्ट रूप से आपने जो पहला मुद्दा बनाया है, वह किसी अन्य समस्या (IMO) को संबोधित करता है, अर्थात् बड़े डेटा सेट से निपटने के लिए एक स्प्रेडशीट का उपयोग करना: यह एक्सेल में एक बड़ी सीएसवी फ़ाइल आयात करना संभव नहीं है (मैं जीनोमिक डेटा के बारे में सोच रहा हूं) लेकिन यह अन्य प्रकार के उच्च-आयामी डेटा पर लागू होता है)। यह उस उद्देश्य के लिए नहीं बनाया गया है।

— CHL
स्रोत

मुझे "चर्चा के विभिन्न स्तरों" के बारे में अति सूक्ष्म अंतर पसंद है।

— whuber

7

कागजात और अन्य प्रतिभागी तकनीकी कमजोरियों की ओर इशारा करते हैं। Whuber कम से कम अपनी कुछ खूबियों को रेखांकित करने का अच्छा काम करता है। मैं व्यक्तिगत रूप से एक्सेल (परिकल्पना परीक्षण, रैखिक और कई प्रतिगमन) में व्यापक सांख्यिकीय कार्य करता हूं और इसे प्यार करता हूं। मैं 256 स्तंभों और 65,000 पंक्तियों की क्षमता के साथ Excel 2003 का उपयोग करता हूं, जो मेरे द्वारा उपयोग किए जाने वाले डेटा सेट के लगभग 100% को संभाल सकता है। मैं समझता हूं कि Excel 2007 ने एक बड़ी राशि (लाखों में पंक्तियों) द्वारा उस क्षमता को बढ़ाया है।

Whuber का उल्लेख है, एक्सेल भी बहुत सारे उत्कृष्ट ऐड-इन सॉफ़्टवेयर की भीड़ के लिए एक शुरुआती मंच के रूप में कार्य करता है जो सभी बहुत शक्तिशाली और उपयोग करने में आसान हैं। मैं मोंटे कार्लो सिमुलेशन के लिए क्रिस्टल बॉल और @Risk के बारे में सोच रहा हूं; शक्तिशाली आँकड़े और डेटा विश्लेषण के चारों ओर XLStat; अनुकूलन के लिए सबसे अच्छा क्या है। और सूची खत्म ही नहीं होती। यह एक्सेल की तरह है जो बहुत ही अविश्वसनीय ऐप्स के एक ज़िलिन के साथ एक आइपॉड या आईपीएड के बराबर है। दी एक्सेल ऐप्स सस्ते नहीं हैं। लेकिन, वे जो करने में सक्षम हैं, वे आम तौर पर बहुत बढ़िया सौदेबाजी हैं।

जहां तक मॉडल डॉक्यूमेंटेशन का सवाल है, टेक्स्ट बॉक्स डालना इतना आसान है, जहां आप अपनी कार्यप्रणाली, अपने स्रोतों आदि के बारे में एक किताब लिख सकते हैं ... आप किसी भी सेल में टिप्पणियां भी डाल सकते हैं। तो, अगर कुछ भी एक्सेल एम्बेडेड प्रलेखन की सुविधा के लिए वास्तव में अच्छा है।

— sympa
स्रोत

1

अतिरिक्त बिंदुओं के लिए और अपना दृष्टिकोण साझा करने के लिए धन्यवाद।

— whuber

महान बिंदु, किसी को इसे सही तरीके से उपयोग करने और सुनने के लिए अच्छा है।

— अनाम टाइप

6

एक्सेल आँकड़ों के लिए अच्छा नहीं है, लेकिन यह खोजपूर्ण डेटा विश्लेषण के लिए अद्भुत हो सकता है। कुछ विशेष दिलचस्प तकनीकों के लिए इस वीडियो पर एक नज़र डालें । एक्सेल की सशर्त रूप से आपके डेटा को रंग देने और इन-सेल बार चार्ट को जोड़ने की क्षमता आपके कच्चे डेटा की संरचना में बहुत अंतर्दृष्टि दे सकती है।

— ज़ैक
स्रोत

6

एक और अच्छा संदर्भ स्रोत है कि आप एक्सेल का उपयोग क्यों नहीं करना चाहते हैं:

स्प्रेडशीट की लत

यदि आप अपने आप को ऐसी स्थिति में पाते हैं जहाँ आपको वास्तव में एक्सेल (कुछ शैक्षणिक विभाग) का उपयोग करने की आवश्यकता है, तो मैं Rexcel प्लगइन का उपयोग करने का सुझाव दूंगा । यह आपको एक्सेल का उपयोग करके इंटरफ़ेस करने देता है, लेकिन कम्प्यूटेशनल इंजन के रूप में आर प्रोग्राम का उपयोग करता है। आपको इसका उपयोग करने के लिए R को जानने की आवश्यकता नहीं है, आप ड्रॉप डाउन मेनू और संवाद का उपयोग कर सकते हैं, लेकिन यदि आप करते हैं तो आप बहुत अधिक कर सकते हैं। चूंकि आर गणना कर रहा है, वे एक्सेल की तुलना में बहुत अधिक भरोसेमंद हैं और आपके पास एक्सेल से बहुत बेहतर ग्राफ़ और बॉक्सप्लाट्स और अन्य ग्राफ़ गायब हैं। यहां तक कि यह एक्सेल में ऑटोमैटिक सेल अपडेट के साथ भी काम करता है (हालांकि अगर चीजें बहुत धीमी हो जाती हैं, तो आपके पास हर बार रिजेक्ट करने के लिए बहुत सारे जटिल विश्लेषण हैं)। यह स्प्रेडशीट की लत पृष्ठ से सभी समस्याओं को ठीक नहीं करता है, लेकिन सीधे एक्सेल का उपयोग करने पर यह एक बड़ा सुधार है।

— ग्रेग हिमपात
स्रोत

1

एक्सेल खोजकर्ता डेटा विश्लेषण और सही प्लगइन्स के साथ रैखिक प्रतिगमन विश्लेषण दोनों के लिए महान हो सकता है। कई वाणिज्यिक उत्पाद हैं, हालांकि उनमें से अधिकांश उत्पादन की गुणवत्ता के संदर्भ में वांछित होने के लिए कुछ छोड़ देते हैं (वे एक्सेल के चार्टिंग विकल्पों या अन्य कार्यालय अनुप्रयोगों के साथ लिंक करने की क्षमता का पूरा फायदा नहीं उठाते हैं) और सामान्य तौर पर वे डेटा विज़ुअलाइज़ेशन और प्रस्तुति के लिए उतने अच्छे नहीं होते हैं। वे एक अनुशासित मॉडलिंग दृष्टिकोण का समर्थन नहीं करते हैं जिसमें (अन्य बातों के अलावा) आप अपने काम के लिए एक अच्छी तरह से प्रलेखित ऑडिट ट्रेल रखते हैं। यहाँ एक मुफ़्त प्लगइन है, "RegressIt", जो इनमें से कई मुद्दों को संबोधित करता है: http://regressit.com। यह अन्वेषणात्मक विश्लेषण के लिए बहुत अच्छा समर्थन प्रदान करता है (जिसमें समांतर समय श्रृंखला के भूखंडों को उत्पन्न करने की क्षमता और 50 वैरिएबल्स के साथ स्कैटरप्लॉट मैट्रीस शामिल हैं), यह डेटा परिवर्तनों जैसे लैगिंग, लॉगिंग और अलग-अलग लागू करना आसान बनाता है (जो अक्सर लागू नहीं होते हैं प्रतिगमन के भोले उपयोगकर्ताओं द्वारा उचित रूप से), यह बहुत विस्तृत तालिका और चार्ट आउटपुट प्रदान करता है जो डेटा विश्लेषण की सर्वोत्तम प्रथाओं का समर्थन करता है, और यह एक ऑडिट-ट्रेल वर्कशीट को बनाए रखता है जो साइड-बाय-साइड मॉडल तुलनाओं के साथ-साथ किन मॉडलों का रिकॉर्ड रखता है। किस क्रम में लगे थे। यह आपके द्वारा उपयोग किए जा रहे किसी और चीज के लिए एक अच्छा पूरक है, यदि आप मल्टीवेरेट डेटा के साथ काम कर रहे हैं और कम से कम आपके कुछ काम एक्सेल वातावरण में किए जा रहे हैं।

— बॉब नौ
स्रोत