मुझे थम्ब के सांख्यिकीय नियमों पर जी वैन बेले की पुस्तक पसंद है , और कुछ हद तक कॉमन एरर्स इन स्टैटिस्टिक्स (और हाउ टू अवॉयड देम) फिलिप आई गुड और जेम्स डब्ल्यू हार्डिन से। प्रायोगिक और अवलोकन अध्ययनों के परिणामों की व्याख्या करते समय वे आम नुकसान को संबोधित करते हैं और सांख्यिकीय निष्कर्ष, या खोज डेटा विश्लेषण के लिए व्यावहारिक सिफारिशें प्रदान करते हैं। लेकिन मुझे लगता है कि "आधुनिक" दिशानिर्देशों में कुछ कमी है, विशेष रूप से विभिन्न क्षेत्रों में कम्प्यूटेशनल और मजबूत आँकड़ों के लगातार बढ़ते उपयोग के साथ, या मशीन सीखने वाले समुदाय से तकनीकों का परिचय, जैसे नैदानिक जैव प्रौद्योगिकी या आनुवंशिक महामारी विज्ञान।
डेटा विज़ुअलाइज़ेशन में कम्प्यूटेशनल ट्रिक्स या सामान्य नुकसान के अलावा, जिसे कहीं और संबोधित किया जा सकता है, मैं पूछना चाहता हूँ: कुशल डेटा विश्लेषण के लिए आप अंगूठे के शीर्ष नियम क्या सुझाएंगे? ( प्रति उत्तर एक नियम, कृपया )।
मैं उन दिशानिर्देशों के बारे में सोच रहा हूं जो आप किसी सहकर्मी को प्रदान कर सकते हैं, सांख्यिकीय मॉडलिंग में मजबूत पृष्ठभूमि के बिना एक शोधकर्ता, या उन्नत पाठ्यक्रम के लिए मध्यवर्ती में एक छात्र। यह डेटा विश्लेषण के विभिन्न चरणों से संबंधित हो सकता है, उदाहरण के लिए नमूनाकरण रणनीति, सुविधा चयन या मॉडल निर्माण, मॉडल तुलना, उत्तर-आकलन, आदि।