प्रश्न को ठीक से फ्रेम करना और स्कोर के उपयोगी वैचारिक मॉडल को अपनाना महत्वपूर्ण है।
प्रश्न
55, 65, और 85 जैसी संभावित चीटिंग थ्रॉल्ड्स को डेटा से स्वतंत्र रूप से एक प्राथमिकता के रूप में जाना जाता है : उन्हें डेटा से निर्धारित होने की आवश्यकता नहीं है। (इसलिए यह न तो एक बाहरी पहचान समस्या है और न ही एक वितरण फिटिंग समस्या है।) परीक्षण को उन सबूतों का आकलन करना चाहिए कि इन थ्रेसहोल्डों की तुलना में कुछ (सभी) स्कोर कम थे (या, शायद, केवल उन थ्रेसहोल्ड पर)।
वैचारिक प्रतिरूप
वैचारिक मॉडल के लिए, यह समझना महत्वपूर्ण है कि अंकों का सामान्य वितरण होने की संभावना नहीं है (और न ही कोई अन्य आसानी से परिचालित वितरण)। यह पोस्टेड उदाहरण में और मूल रिपोर्ट से हर दूसरे उदाहरण में बहुतायत से स्पष्ट है । ये स्कोर स्कूलों के मिश्रण का प्रतिनिधित्व करते हैं; भले ही किसी भी स्कूल के भीतर वितरण सामान्य था (वे नहीं हैं), मिश्रण सामान्य होने की संभावना नहीं है।
एक सरल दृष्टिकोण स्वीकार करता है कि एक वास्तविक स्कोर वितरण है: वह जो इस विशेष रूप को धोखा देने के अलावा रिपोर्ट किया जाएगा । इसलिए यह एक गैर पैरामीट्रिक सेटिंग है। यह बहुत व्यापक लगता है, लेकिन स्कोर वितरण की कुछ विशेषताएं हैं जो वास्तविक डेटा में अनुमानित या देखी जा सकती हैं:
स्कोर , , और की गणना बारीकी से सहसंबंधित होगी, ।i−1ii+11≤i≤99
स्कोर वितरण के कुछ आदर्शित चिकने संस्करण के आसपास इन गणनाओं में भिन्नता होगी। ये विविधताएँ आमतौर पर गिनती के वर्गमूल के बराबर आकार की होंगी।
दहलीज सापेक्ष धोखा किसी भी स्कोर लिए मायने नहीं रखता । इसका प्रभाव प्रत्येक स्कोर की गिनती के लिए आनुपातिक है (छात्रों को धोखा देने से प्रभावित होने के लिए "जोखिम में" की संख्या)। स्कोर के लिए इस सीमा से नीचे, गिनती कुछ अंश से कम हो जाएगा और इस राशि में जोड़ दिया जाएगा ।ti≥tic(i)δ(t−i)c(i)t(i)
एक स्कोर और थ्रेशोल्ड के बीच की दूरी के साथ परिवर्तन की मात्रा घट जाती है: का घटता कार्य है ।δ(i)i=1,2,…
एक सीमा को देखते हुए , रिक्त परिकल्पना (कोई धोखाधड़ी) वह यह है कि , जिसका अर्थ है हूबहू है । विकल्प यह है कि ।tδ(1)=0δ0δ(1)>0
एक परीक्षण का निर्माण
क्या परीक्षण सांख्यिकीय का उपयोग करने के लिए? इन मान्यताओं के अनुसार, (ए) प्रभाव गिनती में योगात्मक है और (बी) सबसे बड़ा प्रभाव दहलीज के चारों ओर होगा। यह मायने रखता है कि पहले अंतर को देखते हुए, । आगे के विचार से एक कदम और आगे बढ़ने का सुझाव मिलता है: वैकल्पिक परिकल्पना के तहत, हम धीरे-धीरे अवसादग्रस्त गिनती के एक क्रम को देखने की उम्मीद करते हैं क्योंकि स्कोर नीचे से दहलीज जाता है, तब (i) बाद एक बड़ा सकारात्मक परिवर्तन (ii) ए पर बड़ा नकारात्मक परिवर्तन । परीक्षण की शक्ति को अधिकतम करने के लिए, आइए, दूसरे अंतर को देखें,मैं टी टी टी + 1c′(i)=c(i+1)−c(i)ittt+1
c′′(i)=c′(i+1)−c′(i)=c(i+2)−2c(i+1)+c(i),
पर क्योंकि यह एक बड़ा सा नकारात्मक गिरावट जोड़ेगा के साथ नकारात्मक एक बड़ी सकारात्मक वृद्धि की , जिससे धोखाधड़ी प्रभाव आवर्धक ।c ( t + 1 ) - c ( t ) c ( t ) - c ( t - 1 )i=t−1c(t+1)−c(t)c(t)−c(t−1)
मैं परिकल्पना करने जा रहा हूँ - और यह जाँच की जा सकती है - कि दहलीज के पास की गिनती का क्रमिक सहसंबंध काफी छोटा है। (सीरियल सहसंबंध कहीं और अप्रासंगिक है।) इसका अर्थ है कि का विचरण लगभग हैc′′(t−1)=c(t+1)−2c(t)+c(t−1)
var(c′′(t−1))≈var(c(t+1))+(−2)2var(c(t))+var(c(t−1)).
मैंने पहले यह सुझाव दिया था कि सभी (कुछ ऐसा भी जिसे जाँचा जा सके)। जहां सेvar(c(i))≈c(i)i
z=c′′(t−1)/c(t+1)+4c(t)+c(t−1)−−−−−−−−−−−−−−−−−−−−√
लगभग इकाई विचरण होना चाहिए। बड़ी स्कोर आबादी के लिए (पोस्ट किया गया 20,000 के आसपास दिखता है) हम लगभग सामान्य वितरण की भी उम्मीद कर सकते हैं। चूंकि हम एक धोखा पैटर्न को इंगित करने के लिए एक अत्यधिक नकारात्मक मूल्य की उम्मीद करते हैं, इसलिए हम आसानी से आकार का एक परीक्षण प्राप्त करते हैं : मानक सामान्य वितरण के cdf के लिए लिखना , थ्रेसहोल्ड पर कोई धोखा की परिकल्पना को अस्वीकार करते हैं जब ।c′′(t−1)αΦtΦ(z)<α
उदाहरण
उदाहरण के लिए, तीन सामान्य वितरणों के मिश्रण से तैयार किए गए सच्चे परीक्षण स्कोर के इस सेट पर विचार करें :
इसके लिए मैंने दहलीज पर एक धोखा अनुसूची लागू किया, जिसे द्वारा परिभाषित किया गया है । यह एक या दो स्कोर पर लगभग सभी को धोखा देता है जो तुरंत 65 से नीचे है:t=65δ(i)=exp(−2i)
परीक्षण क्या करता है, इसकी समझ पाने के लिए, मैंने हर स्कोर के लिए गणना की , न कि केवल , और इसे स्कोर के विरुद्ध प्लॉट किया:zt
(वास्तव में, छोटी गणनाओं के साथ परेशानियों से बचने के लिए, मैंने पहली बार के हरकार की गणना करने के लिए 0 से 100 तक हर गिनती में 1 जोड़ा ।)z
65 के पास उतार-चढ़ाव स्पष्ट है, जैसा कि अन्य सभी उतार-चढ़ाव की प्रवृत्ति है, जो इस परीक्षण की मान्यताओं के अनुरूप लगभग 1 आकार का है। परीक्षण आँकड़ा जो कि एक समान महत्वपूर्ण परिणाम संगत p- मान के साथ है । प्रश्न में आकृति के साथ दृश्य तुलना से ही पता चलता है कि यह परीक्षण कम-से-कम एक पी-मान लौटाएगा।Φ ( z ) = 0.0000136z=−4.19Φ(z)=0.0000136
(कृपया ध्यान दें, हालांकि, परीक्षण स्वयं इस भूखंड का उपयोग नहीं करता है , जो विचारों को चित्रित करने के लिए दिखाया गया है। परीक्षण केवल थ्रेशोल्ड पर प्लॉट किए गए मूल्य पर दिखता है, कहीं और नहीं। फिर भी इस तरह के भूखंड बनाने के लिए अच्छा अभ्यास होगा। यह पुष्टि करने के लिए कि परीक्षण आँकड़ा वास्तव में धोखा देने के लोकी के रूप में अपेक्षित थ्रेसहोल्ड को बाहर करता है और अन्य सभी स्कोर इस तरह के बदलाव के लिए नहीं हैं। यहाँ, हम देखते हैं कि अन्य सभी अंकों में लगभग -2 और 2 के बीच उतार-चढ़ाव है, लेकिन शायद ही कभी। अधिक। ध्यान दें, भी, कि किसी को वास्तव में गणना करने के लिए इस भूखंड में मूल्यों के मानक विचलन की गणना करने की आवश्यकता नहीं है , जिससे कई स्थानों पर उतार-चढ़ाव को प्रभावित करने वाले धोखा प्रभावों से जुड़ी समस्याओं से बचा जा सके।)z
जब इस परीक्षण को कई थ्रेसहोल्ड पर लागू किया जाता है, तो परीक्षण आकार का एक बोनफेरोनी समायोजन बुद्धिमान होगा। एक ही समय में कई परीक्षणों पर लागू होने पर अतिरिक्त समायोजन भी एक अच्छा विचार होगा।
मूल्यांकन
वास्तविक डेटा पर परीक्षण किए जाने तक यह प्रक्रिया उपयोग के लिए गंभीरता से प्रस्तावित नहीं की जा सकती है। एक अच्छा तरीका यह होगा कि एक टेस्ट के लिए स्कोर लिया जाए और टेस्ट के लिए नॉन-क्रिटिकल स्कोर का उपयोग थ्रेशोल्ड के रूप में किया जाए। संभवतः इस तरह की दहलीज इस तरह की धोखाधड़ी के अधीन नहीं है। इस वैचारिक मॉडल के अनुसार धोखा देने का अनुकरण करें और के नकली वितरण का अध्ययन करें । यह इंगित करेगा (ए) कि क्या पी-मान सटीक हैं और (बी) धोखा देने के नकली रूप को इंगित करने के लिए परीक्षण की शक्ति। वास्तव में, कोई भी इस तरह के एक सिमुलेशन अध्ययन का उपयोग कर सकता है बहुत ही डेटा पर एक मूल्यांकन कर रहा है, यह परीक्षण का एक अत्यंत प्रभावी तरीका प्रदान करता है कि क्या परीक्षण उपयुक्त है और इसकी वास्तविक शक्ति क्या है। क्योंकि परीक्षण आँकड़ाzzz इतना सरल है, सिमुलेशन करने और तेजी से निष्पादित करने के लिए व्यावहारिक होगा।