यह जानते हुए कि कैसे ग्रेडर अलग है, लेकिन अभी भी आपको यह नहीं बताया गया है कि ग्रेड की भरपाई के लिए क्या करना चाहिए । सादगी के लिए सिर्फ दो ग्रेडर की कल्पना करें। यहां तक कि अगर हम ग्रेडर 1 को समाप्त करते हैं, तो ग्रेडर 2 की तुलना में लगातार 5 अंक अधिक उदार होते हैं, जो आपको यह नहीं बताता है कि दो छात्रों के साथ क्या करना है जो प्रत्येक ग्रेडेड 70 थे, एक ग्रेडर 1 और एक ग्रेडर 2 से। क्या हम कहते हैं कि ग्रेडर 2 एक कठोर मार्कर था, और उस 70 को 75 तक बढ़ा दिया, जबकि 70 को ग्रेडर 1 द्वारा अपरिवर्तित रखा? या क्या हम मान लेते हैं कि ग्रेडर 1 अयोग्य था, अपने छात्र को 65 अंक तक गिरा दिया, और ग्रेडर 2 के 70 को अपरिवर्तित रखा? क्या हम 11 ग्रेडरों के औसत के आधार पर, आपके मामले के बीच आधे रास्ते का समझौता करते हैं? यह बात है कि पूर्ण ग्रेड है, इसलिए सापेक्ष उदारता जानना पर्याप्त नहीं है।
आपका निष्कर्ष इस बात पर निर्भर हो सकता है कि आपको लगता है कि "उद्देश्य" आपको लगता है कि अंतिम पूर्ण चिह्न होना चाहिए। एक मानसिक मॉडल का प्रस्ताव होगा कि प्रत्येक छात्र के पास "सही" ग्रेड हो - जो लीड एसेसर द्वारा प्रदान किया जाएगा, यदि उनके पास प्रत्येक पेपर को व्यक्तिगत रूप से चिह्नित करने का समय हो - जिसमें देखे गए ग्रेड सन्निकटन हैं। इस मॉडल में, उनके ग्रेडर के लिए देखे गए ग्रेड को मुआवजा देने की जरूरत है, ताकि उन्हें उनके "सही" ग्रेड के प्रति यथासंभव करीब लाया जा सके। एक अन्य मॉडल यह हो सकता है कि सभी ग्रेडिंग व्यक्तिपरक है, और हम प्रत्येक प्रेक्षित ग्रेड को उस चिह्न की ओर बदलना चाहते हैं जिसका हम अनुमान लगाते हैं कि यदि सभी ग्रेडर्स ने एक ही पेपर पर विचार किया होता और उसके लिए किसी प्रकार का समझौता या औसत ग्रेड तक पहुँच जाते। मैं दूसरे मॉडल को कम समाधान के रूप में समझाता हूं, भले ही विषय का प्रवेश अधिक यथार्थवादी हो। एक शैक्षिक सेटिंग में आम तौर पर कोई है जो मूल्यांकन के लिए अंतिम जिम्मेदारी वहन करता है, यह सुनिश्चित करने के लिए कि छात्रों को "वे जिस ग्रेड के लायक हैं" प्राप्त करते हैं, लेकिन इस नेतृत्व की भूमिका अनिवार्य रूप से बहुत ही ग्रेडर के लिए ज़िम्मेदार है जिसे हम पहले से ही स्पष्ट रूप से असहमत जानते हैं। यहां से मैं वहां पहुंच गयाहै एक 'सही' ग्रेड कि हम अनुमान के उद्देश्य, लेकिन यह एक contestable प्रस्ताव है और अपनी परिस्थितियों के अनुरूप न हो।
मान लीजिए कि छात्र ए, बी, सी और डी, सभी एक ही समतुल्य में, "को" क्रमशः 75, 80, 85 और 90 के रूप में वर्गीकृत किया जाना चाहिए, लेकिन उनके उदार ग्रेडर में लगातार 5 अंक बहुत अधिक हैं। हम 80, 85, 90 और 95 निरीक्षण करते हैं और 5 घटाना चाहिए, लेकिन घटाना का आंकड़ा खोजना समस्याग्रस्त है। यह सहकर्मियों के बीच परिणामों की तुलना करके नहीं किया जा सकता है क्योंकि हम उम्मीद करते हैं कि सहकर्मी औसत क्षमता में भिन्न हो सकते हैं। एक संभावना दूसरे असाइनमेंट पर सही स्कोर की भविष्यवाणी करने के लिए कई विकल्प परीक्षण परिणामों का उपयोग कर रही है, फिर प्रत्येक ग्रेडर और सही ग्रेड के बीच भिन्नता का आकलन करने के लिए इसका उपयोग करें। लेकिन यह भविष्यवाणी करना गैर-तुच्छ है - यदि आप दो आकलनों के बीच भिन्न माध्य और मानक विचलन की अपेक्षा करते हैं, तो आप यह मान ही नहीं सकते कि दूसरा मूल्यांकन ग्रेड पहले से मेल खाना चाहिए।
इसके अलावा, छात्रों को बहु-विकल्प और लिखित मूल्यांकन में सापेक्ष योग्यता में अंतर होता है। आप इसे किसी प्रकार के यादृच्छिक प्रभाव के रूप में मान सकते हैं, जिससे छात्र "मनाया" और "सच" ग्रेड का एक घटक बन सकता है, लेकिन उनके "अनुमानित" ग्रेड द्वारा कब्जा नहीं किया जाता है। यदि कोहोर्ट्स व्यवस्थित रूप से भिन्न होते हैं और एक पलटन में छात्र समान होते हैं, तो हमें इस प्रभाव की उम्मीद नहीं करनी चाहिए कि प्रत्येक कोहॉर्ट के भीतर शून्य हो। अगर किसी सहकर्मी ने अपने पूर्वानुमानित लोगों के औसत ग्रेड +5 का अवलोकन किया है, तो यह असंभव हैयह निर्धारित करने के लिए कि क्या यह एक उदार ग्रेडर के कारण है, एक सहकर्मी विशेष रूप से कई विकल्पों की तुलना में लिखित मूल्यांकन के लिए बेहतर-अनुकूल है, या दोनों के कुछ संयोजन। एक चरम मामले में, कोहोर्ट के पास दूसरे मूल्यांकन में कम योग्यता हो सकती है, लेकिन इसके लिए एक बहुत ही उदार ग्रेडर - या इसके विपरीत क्षतिपूर्ति की तुलना में अधिक था। आप इसे अलग नहीं कर सकते। यह उलझन है।
मुझे आपके डेटा के लिए इस तरह के एक सरल योगात्मक मॉडल की पर्याप्तता पर भी संदेह है। ग्रेडर्स लीड एसेसर से भिन्न हो सकते हैं, न केवल स्थान में बदलाव के द्वारा, बल्कि यह भी फैलता है - यद्यपि समरूपता की संभावना एकरूपता में भिन्न होती है, आप इसका पता लगाने के लिए प्रत्येक कॉहोर्ट में केवल देखे गए ग्रेड के प्रसार की जांच नहीं कर सकते। इसके अलावा, वितरण के थोक में उच्च स्कोर हैं, सैद्धांतिक रूप से अधिकतम 100 के पास। मैं यह अनुमान लगाता हूं कि अधिकतम के पास संपीड़न के कारण गैर-रैखिकता का परिचय होगा - बहुत उदार ग्रेडर ए, बी, सी और डी जैसे अंक दे सकता है। 85, 90, 94, 97. यह एक स्थिरांक को घटाने के बजाए उल्टा करना कठिन है। इससे भी बदतर, आप "कतरन" देख सकते हैं - एक अत्यंत उदार ग्रेडर उन्हें 90, 95, 100, 100 के रूप में ग्रेड दे सकता है। यह असंभव हैसी और डी के सापेक्ष प्रदर्शन के बारे में जानकारी को उल्टा करना, अपरिवर्तनीय रूप से खो गया है।
आपके ग्रेडर बहुत अलग तरह से व्यवहार करते हैं। क्या आप सुनिश्चित हैं कि वे मूल्यांकन के विभिन्न घटकों में अपनी उदारता के बजाय केवल अपनी समग्र उदारता में भिन्न हैं? यह जाँच के लायक हो सकता है, क्योंकि यह विभिन्न जटिलताओं का परिचय दे सकता है - जैसे B के लिए मनाया गया ग्रेड A की तुलना में खराब हो सकता है, B के 5 अंक "बेहतर" होने के बावजूद, भले ही प्रत्येक घटक के लिए ग्रेड के आवंटित निशान एक नीरस रूप से बढ़ते हुए कार्य हों। लीड एसेसर का! मान लीजिए कि मूल्यांकन Q1 (A को 30/50, B 45/50 स्कोर करना चाहिए) और Q2 (A को 45/50, B 35/50 स्कोर करना चाहिए) के बीच विभाजित किया गया है। कल्पना कीजिए कि क्यू 1 (ग्रेड: ए 40/50, बी 50/50) पर ग्रेड बहुत उदार है, लेकिन Q2 पर कठोर (मनाया: A 42/50, 30/50), तो हम ए और 80 के लिए 82 के योग का निरीक्षण करते हैं। B. यदि आपको घटक स्कोर पर विचार करना है,
तर्क से यह एक उत्तर के बजाय एक विस्तारित टिप्पणी है, इस अर्थ में यह आपकी समस्या के मूल सीमा के भीतर एक विशेष समाधान का प्रस्ताव नहीं करता है। लेकिन अगर आपके ग्रेडर पहले से ही प्रत्येक के बारे में 55 पेपरों को पहले से ही संभाल रहे हैं, तो क्या उनके लिए अंशांकन प्रयोजनों के लिए पांच या दस और देखना कितना बुरा है? आपके पास पहले से ही छात्रों की क्षमताओं का एक अच्छा विचार है, इसलिए ग्रेड की श्रेणी में सही से कागजात का एक नमूना चुन सकते हैं। आप तब मूल्यांकन कर सकते हैं कि क्या आपको पूरे परीक्षण में या प्रत्येक घटक में ग्रेडर उदारता के लिए क्षतिपूर्ति करने की आवश्यकता है, और क्या ऐसा करना निरंतर जोड़ना / घटाना या कुछ और अधिक परिष्कृत जैसे प्रक्षेप (जैसे कि यदि आप गैर के बारे में चिंतित हैं) 100 के पास रैखिकता)। लेकिन प्रक्षेप पर चेतावनी का एक शब्द: मान लीजिए कि लीड असिस्टर ने पांच नमूना पत्र 70, 75, 80, 85 और 90 के रूप में चिह्नित किए हैं जबकि एक ग्रेडर उन्हें 80, 88, 84, 93 और 96 के रूप में चिह्नित करता है, इसलिए आदेश के बारे में कुछ असहमति है। आप शायद ९ ० से १०० के अंतराल पर ९ ६ से १०० तक के ग्रेड का नक्शा बनाना चाहते हैं, और ९ But से ९ ६ के अंतराल पर to५ से ९ ० के बीच ग्रेड का अवलोकन करते हैं। लेकिन इसके नीचे के अंकों के लिए कुछ सोचा जाना आवश्यक है। शायद Perhaps४ से ९ to तक मनाया गया ग्रेड ५ grades से to५ के अंतराल पर मैप किया जाना चाहिए? एक विकल्प एक (संभवतः बहुपद) प्रतिगमन "प्रेस्ड ग्रेड" से "अनुमानित सच ग्रेड" के लिए एक सूत्र प्राप्त करने के लिए होगा। शायद Perhaps४ से ९ to तक मनाया गया ग्रेड ५ grades से to५ के अंतराल पर मैप किया जाना चाहिए? एक विकल्प एक (संभवतः बहुपद) प्रतिगमन "प्रेस्ड ग्रेड" से "अनुमानित सच ग्रेड" के लिए एक सूत्र प्राप्त करने के लिए होगा। शायद Perhaps४ से ९ to तक मनाया गया ग्रेड ५ grades से to५ के अंतराल पर मैप किया जाना चाहिए? एक विकल्प एक (संभवतः बहुपद) प्रतिगमन "प्रेस्ड ग्रेड" से "अनुमानित सच ग्रेड" के लिए एक सूत्र प्राप्त करने के लिए होगा।