मैं पहले से ही दिए गए सभी उत्तरों को रेखांकित करता हूं, लेकिन चलो एक बिल्ली को एक बिल्ली कहते हैं: कई कार्यक्षेत्रों में प्रबंधन को यह विश्वास दिलाना असंभव है कि "विदेशी" सॉफ़्टवेयरटल्स (उन पर विदेशी निवेश, जो आवश्यक है) में निवेश करना आवश्यक है, अकेले ही किसी को काम पर रखने दें जो सेट कर सकता है। इसे बनाए रखें और इसे बनाए रखें। मैंने काफी कुछ ग्राहकों को बताया है कि वे सॉफ्टवेयर और डेटाबेस पर पूरी तरह से पृष्ठभूमि के साथ एक सांख्यिकीविद को काम पर रखने से बहुत लाभान्वित होंगे, लेकिन "कोई भी नहीं कर सकता" सामान्य प्रतिक्रिया है।
तो जब तक ऐसा नहीं होने वाला है, कुछ सरल चीजें हैं जो आप एक्सेल के साथ कर सकते हैं जो जीवन को आसान बना देगा। और इसमें से पहला शक संस्करण नियंत्रण के बिना है। एक्सेल के साथ संस्करण नियंत्रण के बारे में अधिक जानकारी यहां पाई जा सकती है ।
एक्सेल का उपयोग करने के बारे में कुछ बातें
EXCEL का उपयोग करने वाले लोग बहुत बार EXCEL के सूत्र सुविधाओं को पसंद करते हैं। फिर भी, यह EXCEL शीट्स के भीतर त्रुटियों का सबसे महत्वपूर्ण स्रोत है, और जब मेरा अनुभव जाता है, तो EXCEL फाइलों में पढ़ने की कोशिश करते समय समस्याओं का सामना करना पड़ता है। मैं फार्मूले वाली शीट के साथ काम करने से इनकार करता हूं।
मैं उन सभी को भी मजबूर करता हूं जिनके साथ मैं एक सादे प्रारूप में एक्सेल शीट देने का काम करता हूं, जिसका अर्थ है:
- पहली पंक्ति में विभिन्न चर के नाम हैं
- स्प्रेडशीट सेल A1 में शुरू होती है
- सभी डेटा कॉलम में, बिना किसी रुकावट और बिना फॉर्मेटिंग के डाले जाते हैं।
- यदि संभव हो, तो डेटा को .csv प्रारूप में भी सहेजा जाता है। वीबीए स्क्रिप्ट लिखना मुश्किल नहीं है जो डेटा को निकालेगा, इसे सुधारेगा और इसे एक .csv फ़ाइल में डाल देगा। यह बेहतर संस्करण नियंत्रण की भी अनुमति देता है, क्योंकि आप हर दिन डेटा का एक .csv डंप कर सकते हैं।
यदि डेटा की सामान्य संरचना हमेशा होती है, तो डेटा जोड़ने और विश्लेषण के लिए डेटासेट उत्पन्न करने के लिए अंतर्निहित वीबी मैक्रो के साथ एक टेम्पलेट विकसित करना अच्छा हो सकता है। यह सामान्य रूप से बच जाएगा कि हर कर्मचारी डेटा भंडारण की अपनी "जीनियस" प्रणाली के साथ आता है, और यह आपको इसके फ़ंक्शन में अपना कोड लिखने की अनुमति देता है।
इसने कहा, यदि आप एसक्यूएल (और डेटा दर्ज करने के लिए सामने का छोर) का उपयोग करने के लिए सभी को मना सकते हैं, तो आप आर को सीधे उस एक से जोड़ सकते हैं। यह प्रदर्शन को बहुत बढ़ाएगा।
डेटा संरचना और प्रबंधन
एक सामान्य नियम के रूप में, डेटाबेस में संग्रहीत डेटा (या यदि वे जोर देते हैं तो EXCEL शीट) पूर्ण न्यूनतम होना चाहिए, जिसका अर्थ है कि किसी भी चर को कुछ अन्य चर से गणना की जा सकती है। ध्यान रखें, कभी-कभी उन व्युत्पन्न या रूपांतरित चर को संग्रहीत करने के लिए भी फायदेमंद हो सकता है, यदि गणना थकाऊ हैं और एक लंबा समय लगता है। लेकिन इन्हें एक अलग डेटाबेस में संग्रहीत किया जाना चाहिए, यदि आवश्यक हो तो मूल एक से जुड़ा हुआ है।
सोचा जाना चाहिए कि क्या एक मामले के रूप में माना जाता है (और इसलिए एक पंक्ति)। एक उदाहरण के रूप में, लोग प्रत्येक समय बिंदु के लिए एक नया चर बनाकर समय श्रृंखला का निर्माण करते हैं। हालांकि यह एक EXCEL में समझ में आता है, इन आंकड़ों में पढ़ना डेटा मैट्रिक्स के आसपास काफी कुछ flipping की मांग करता है। समूहों की तुलना करने के लिए समान: एक समूह सूचक और एक प्रतिक्रिया चर होना चाहिए, प्रत्येक समूह के लिए प्रतिक्रिया चर नहीं होना चाहिए। इस तरह डेटा संरचनाओं को भी मानकीकृत किया जा सकता है।
एक आखिरी चीज जो मैं अक्सर चलाता हूं, वह है विभिन्न मैट्रिक्स का उपयोग। लंबाई मीटर या सेंटीमीटर, सेल्युकस, केल्विन या फ़ारेनहाइट में तापमान पर दी जाती है, ... किसी को किसी भी सामने के छोर या किसी भी टेम्पलेट में संकेत देना चाहिए कि इकाई क्या है जिसमें चर मापा जाता है।
और इन सभी चीजों के बाद भी, आप अभी भी एक डेटा नियंत्रण कदम रखना चाहते हैं इससे पहले कि आप वास्तव में विश्लेषण के साथ शुरू करें। फिर, यह कोई भी स्क्रिप्ट हो सकती है जो नई प्रविष्टियों पर दैनिक (जैसे रात भर) चलती है, और यह झंडे की समस्याओं को तुरंत (सीमा के बाहर, गलत प्रकार, लापता फ़ील्ड, ...) ताकि वे जितनी जल्दी हो सके सुधारा जा सके। यदि आपको एक प्रविष्टि पर लौटना है जो 2 महीने पहले बनाई गई थी, तो यह पता लगाने के लिए कि क्या गलत है और क्यों, आपको इसे ठीक करने के लिए कुछ अच्छे "शर्लक-कौशल" मिलते हैं।
मेरे 2 सेंट