मैं प्रकृति में इस लेख को पढ़ रहा था जिसमें डेटा विश्लेषण के संदर्भ में कुछ कमियों को समझाया गया है। मैंने देखा कि टेक्सास के शार्पशूटर की खराबी से बचना विशेष रूप से मुश्किल था:
एक संज्ञानात्मक जाल जो डेटा विश्लेषण के दौरान इंतजार करता है, उसे टेक्सास के शार्पशूटर की कथा द्वारा चित्रित किया गया है: एक अयोग्य निशानदार जो एक खलिहान के किनारे गोलियों का एक यादृच्छिक पैटर्न फायर करता है, बुलेट छेद के सबसे बड़े डंप के चारों ओर एक लक्ष्य खींचता है, और गर्व से इंगित करता है उसकी सफलता।
उनकी बुल्सआई स्पष्ट रूप से हंसी है - लेकिन जुआ खेलने वालों के लिए पराजय इतनी स्पष्ट नहीं है जो 'गर्म हाथ' में विश्वास करते हैं जब उनके पास जीत की एक लकीर होती है, या उन लोगों के लिए जो अलौकिक महत्व देखते हैं जब सभी विषम संख्या में लॉटरी निकलती है।
न ही यह हमेशा शोधकर्ताओं के लिए स्पष्ट है। पश्लर कहते हैं, "आपको डेटा से कुछ प्रोत्साहन मिलता है और फिर लगता है, ठीक है, यह नीचे जाने का मार्ग है।" "आपको एहसास नहीं है कि आपके पास 27 अलग-अलग विकल्प थे और आपने उस एक को चुना जो आपको सबसे सहमत या दिलचस्प परिणाम देता था, और अब आप कुछ ऐसे काम में लगे हुए हैं जो डेटा के निष्पक्ष प्रतिनिधित्व पर नहीं है। "
मुझे लगता है कि इस तरह के अन्वेषण कार्य आम हैं और अक्सर, विश्लेषण के उस हिस्से के आधार पर परिकल्पनाओं का निर्माण किया जाता है। इस प्रक्रिया के लिए एक संपूर्ण दृष्टिकोण ( EDA ) समर्पित है:
डेटा का पता लगाने के लिए सांख्यिकीविदों को प्रोत्साहित करने के लिए जॉन टके द्वारा व्याख्यात्मक डेटा विश्लेषण को बढ़ावा दिया गया था, और संभवतया परिकल्पना तैयार की गई थी जिससे नए डेटा संग्रह और प्रयोग किए जा सके।
ऐसा लगता है कि पहले से परिकल्पना किए बिना किसी भी खोजपूर्ण प्रक्रिया का आयोजन किया जाता है, जिसमें सहज परिकल्पना उत्पन्न होती है।
ध्यान दें कि ऊपर EDA का वर्णन वास्तव में बात करता है new data collection and experiments
। मैं समझता हूं कि नए डेटा एकत्र किए जाने के बाद, फिर एक पुष्टिकरण डेटा विश्लेषण (सीडीए) उपयुक्त है। हालांकि, मुझे नहीं लगता कि यह अंतर बहुत स्पष्ट रूप से बनाया गया है, और यद्यपि ईडीए और सीडीए का एक पृथक्करण आदर्श होगा, निश्चित रूप से कुछ परिस्थितियां हैं जिनमें यह संभव नहीं है। मैं यह कहना चाहूंगा कि इस अलगाव का कड़ाई से पालन असामान्य है और अधिकांश चिकित्सक EDA प्रतिमान की सदस्यता नहीं लेते हैं।
तो मेरा सवाल यह है: क्या ईडीए (या डेटा की खोज की कोई अनौपचारिक प्रक्रिया) टेक्सास के शार्पशूट की गिरावट के लिए गिरने की अधिक संभावना है?