यदि आप हाल ही में सामुदायिक बुलेटिन पढ़ रहे हैं, तो आपने संभवतः द हंटिंग ऑफ द स्नार्क को देखा है, जो स्टैकएक्सचेंज नेटवर्क के सीईओ जोएल स्पोल्स्की द्वारा आधिकारिक स्टैकएक्सचेंज ब्लॉग पर एक पोस्ट है । वह बाहरी उपयोगकर्ता के दृष्टिकोण से उनकी "मित्रता" का मूल्यांकन करने के लिए एसई टिप्पणियों के नमूने पर आयोजित सांख्यिकीय विश्लेषण पर चर्चा करता है। टिप्पणियों को स्टैकऑवरफ्लो से बेतरतीब ढंग से नमूना लिया गया था और सामग्री विश्लेषक अमेज़ॅन के मैकेनिकल तुर्क समुदाय के सदस्य थे, काम के लिए एक बाजार जो कंपनियों को उन श्रमिकों से जोड़ता है जो सस्ती फीस के लिए छोटे, छोटे कार्य करते हैं।
बहुत पहले नहीं, मैं राजनीति विज्ञान में स्नातक छात्र था और मैंने जो कक्षाएं ली थीं, उनमें से एक सांख्यिकीय सामग्री विश्लेषण था । वर्ग की अंतिम परियोजना, वास्तव में इसका संपूर्ण उद्देश्य, न्यूयॉर्क टाइम्स की युद्ध रिपोर्टिंग का विस्तृत विश्लेषण करना था , यह परीक्षण करने के लिए कि युद्ध के दौरान अमेरिकियों ने समाचार कवरेज के बारे में कितनी धारणाएं बनाईं, वे सटीक थीं (स्पॉइलर: सबूत से पता चलता है) नहीं)। यह परियोजना बहुत बड़ी और काफी मज़ेदार थी, लेकिन अब तक इसका सबसे दर्दनाक खंड 'प्रशिक्षण और विश्वसनीयता परीक्षण चरण' था, जो कि हमारे विश्लेषण का संचालन करने से पहले हुआ था। इसके दो उद्देश्य थे (विस्तृत विवरण के लिए लिंक किए गए पेपर के पृष्ठ 9 देखें, साथ ही सामग्री विश्लेषण सांख्यिकीय साहित्य में इंटरकोडर विश्वसनीयता मानकों का संदर्भ):
सभी कोडर्स की पुष्टि करें, अर्थात, सामग्री के पाठकों को समान गुणात्मक परिभाषाओं पर प्रशिक्षित किया गया था। जोएल के विश्लेषण में, इसका मतलब सभी को पता था कि परियोजना कैसे "दोस्ताना" और "अनफ्रेंडली" परिभाषित करती है।
सभी कोडर्स की पुष्टि करें कि इन नियमों की मज़बूती से व्याख्या की गई है, यानी हमने अपने नमूने का नमूना लिया, सबसेट का विश्लेषण किया, और फिर गुणात्मक मूल्यांकन पर हमारे जोड़ीदार सहसंबंधों का सांख्यिकीय रूप से प्रदर्शन किया।
विश्वसनीयता परीक्षण चोट लगी है क्योंकि हमें इसे तीन या चार बार करना पड़ा। जब तक -1- को बंद नहीं किया गया था और -2 को उच्च जोड़ीदार सहसंबंध दिखाया गया था, पूर्ण विश्लेषण के लिए हमारे परिणाम संदिग्ध थे। उन्हें वैध या अमान्य नहीं दिखाया जा सकता है। सबसे महत्वपूर्ण बात, हमें अंतिम नमूना सेट से पहले विश्वसनीयता के पायलट परीक्षण करने थे।
मेरा सवाल यह है: जोएल के सांख्यिकीय विश्लेषण में पायलट विश्वसनीयता परीक्षण का अभाव था और "मित्रता" की कोई परिचालन परिभाषा स्थापित नहीं की थी। क्या अंतिम डेटा उसके परिणामों की सांख्यिकीय वैधता के बारे में कुछ भी कहने के लिए पर्याप्त विश्वसनीय था?
एक परिप्रेक्ष्य के लिए, इस प्राइमर को इंटरकोडर विश्वसनीयता और लगातार परिचालन परिभाषाओं के मूल्य पर विचार करें । एक ही स्रोत में गहराई से, आप पायलट विश्वसनीयता परीक्षणों (सूची में आइटम 5) के बारे में पढ़ सकते हैं।
प्रति उत्तर में एंडी डब्ल्यू के सुझाव, मैं डेटासेट की विभिन्न प्रकार की विश्वसनीयता आँकड़ों की गणना करने का प्रयास कर रहा हूँ, जो यहाँ उपलब्ध है, आर में इस कमांड श्रृंखला का उपयोग करके (अद्यतन के रूप में मैं नए आँकड़ों की गणना करता हूँ)।
प्रतिशत समझौता (सहिष्णुता = 0 के साथ): 0.0143
प्रतिशत समझौता (सहिष्णुता = 1 के साथ): 11.8
क्रिपेंडोर्फ़ का अल्फा: 0.1529467
मैंने एक अन्य प्रश्न में इस डेटा के लिए एक आइटम-प्रतिक्रिया मॉडल का भी प्रयास किया ।