इसके दो भाग हैं: (ए) एक ग्राफ ( प्रायोगिक डिजाइन ) का चयन करना जो यह निर्धारित करता है कि छात्रों के कौन से निबंध पीयर ग्रेडिंग प्रक्रिया में मूल्यांकन करेंगे, और (बी) छात्र के पीयर ग्रेड के आधार पर सभी निबंधों को रैंकिंग देंगे, निर्धारित करें कि शिक्षक को किस पद पर होना चाहिए। मैं प्रत्येक के लिए कुछ तरीके सुझाऊंगा।
एक ग्राफ चुनना
समस्या का विवरण। पहला कदम एक ग्राफ उत्पन्न करना है। दूसरे शब्दों में, आपको सहकर्मी ग्रेडिंग अभ्यास के दौरान छात्रों को दिखाने के लिए निबंधों के कौन से जोड़े का चयन करना होगा।
सुझाया हुआ समाधान। इस कार्य के लिए, मेरा सुझाव है कि आप एक यादृच्छिक ग्राफ उत्पन्न करेंजी, सभी 3-नियमित (सरल) रेखांकन के सेट से यादृच्छिक पर समान रूप से चयनित।
औचित्य और विवरण। यह ज्ञात है कि एक यादृच्छिकघ-अनियमित ग्राफ एक अच्छा विस्तारक है। वास्तव में, नियमित रेखांकन में विषमतम रूप से इष्टतम विस्तार कारक होता है। इसके अलावा, क्योंकि ग्राफ यादृच्छिक है, इससे ग्रेडिंग को कम करने के जोखिम को समाप्त करना चाहिए। यादृच्छिक पर एक समान रूप से एक ग्राफ का चयन करके, आप यह सुनिश्चित कर रहे हैं कि आपका दृष्टिकोण सभी छात्रों के लिए समान रूप से उचित है। मुझे संदेह है कि एक समान रूप से यादृच्छिक 3-नियमित ग्राफ आपके उद्देश्यों के लिए इष्टतम होगा।
यह प्रश्न उठाता है: हम 3-नियमित (सरल) ग्राफ़ का चयन कैसे करते हैं n अनियमित, समान रूप से यादृच्छिक पर?
सौभाग्य से, ऐसा करने के लिए ज्ञात एल्गोरिदम हैं। मूल रूप से, आप निम्न कार्य करते हैं:
सृजन करना 3 एनअंक। आप इसे प्रत्येक की 3 प्रतियों के रूप में सोच सकते हैंnकोने। समान रूप से, इन पर एक यादृच्छिक परिपूर्ण मिलान उत्पन्न करें3 एनअंक। (दूसरे शब्दों में, निम्नलिखित प्रक्रिया को सभी तक दोहराएं3 एन बिंदुओं को जोड़ा जाता है: किसी भी अनपेक्षित बिंदु का चयन करें, और इसे अन्य बिंदुओं के साथ जोड़कर एकतरफा बिंदुओं के सेट से यादृच्छिक रूप से समान रूप से चुना जाता है।)
प्रत्येक दो बिंदुओं के लिए जो मिलान से मेल खाते हैं, इसी कोने के बीच एक किनारा खींचें (कि वे एक प्रति हैं)। यह आपको एक ग्राफ देता हैn कोने।
अगला, परीक्षण करें यदि परिणामी ग्राफ सरल है (यानी, इसमें कोई स्व-छोर नहीं है और कोई दोहराया किनारों नहीं है)। यदि यह सरल नहीं है, तो ग्राफ को त्यागें और चरण 1 पर वापस जाएं। यदि यह सरल है, तो आप कर रहे हैं; इस ग्राफ को आउटपुट करें।
यह ज्ञात है कि यह प्रक्रिया 3-नियमित (सरल) रेखांकन के सेट पर एक समान वितरण उत्पन्न करती है। इसके अलावा, यह ज्ञात है कि चरण 3 में आपको परिणामस्वरूप ग्राफ को स्वीकार करने की निरंतर संभावना है, इसलिए औसतन एल्गोरिथ्म क्या करेगाओ ( 1 ) परीक्षण - तो यह बहुत कुशल है (उदाहरण के लिए, बहुपद चल रहा समय)।
मैंने इस दृष्टिकोण को बोलोबस, बेंडर और कैनफील्ड को श्रेय दिया है। दृष्टिकोण को संक्षेप में विकिपीडिया पर भी संक्षेप में प्रस्तुत किया गया है । आप इस ब्लॉग पोस्ट पर एक चर्चा भी पा सकते हैं ।
तकनीकी रूप से, इसके लिए यह आवश्यक है कि संख्या n हो (अन्यथा कोई 3-नियमित ग्राफ़ नहीं है) nकोने)। हालांकि, इससे निपटना आसान है। उदाहरण के लिए, यदिnविषम है, आप बेतरतीब ढंग से एक निबंध चुन सकते हैं, इसे अलग सेट कर सकते हैं, शेष निबंधों पर एक यादृच्छिक 3-नियमित ग्राफ़ उत्पन्न कर सकते हैं, फिर सेट-निबंध से 3 और किनारों को 3 यादृच्छिक रूप से चुने गए अन्य निबंधों में जोड़ सकते हैं। (इसका मतलब है कि 3 निबंध होंगे जो वास्तव में 4 बार वर्गीकृत किए जाते हैं, लेकिन इससे कोई नुकसान नहीं होना चाहिए।)
सभी निबंधों की रैंकिंग
समस्या का विवरण। ठीक है, तो अब आपके पास एक ग्राफ है, और आपने सहकर्मी ग्रेडिंग अभ्यास के दौरान ग्रेड के लिए छात्रों को निबंध के इन जोड़े (जैसा कि ग्राफ में किनारों द्वारा इंगित किया गया है) प्रस्तुत किया है। आपके पास निबंधों की प्रत्येक तुलना के परिणाम हैं। अब आपका काम सभी निबंधों पर एक रेखीय रैंकिंग का अनुमान लगाना है, जिससे आपको यह निर्धारित करने में मदद मिल सके कि शिक्षक का मूल्यांकन किसके पास है।
समाधान। मैंने आपको ब्राडली-टेरी मॉडल का उपयोग करने का सुझाव दिया है । यह एक गणितीय दृष्टिकोण है जो इस समस्या को हल करता है। यह खिलाड़ियों के कुछ जोड़े के बीच मैचों के परिणामों के आधार पर, किसी खेल में खिलाड़ियों की रैंकिंग के लिए बनाया गया था। यह मानता है कि प्रत्येक खिलाड़ी के पास एक अज्ञात (अज्ञात) ताकत है, जिसे एक वास्तविक संख्या के रूप में मात्राबद्ध किया जा सकता है, और ऐलिस की पिटाई की संभावना उनकी ताकत के अंतर के कुछ सुचारू फ़ंक्शन द्वारा निर्धारित की जाती है। फिर, जोड़ीदार जीत / हानि रिकॉर्ड को देखते हुए, यह प्रत्येक खिलाड़ी की ताकत का अनुमान लगाता है।
यह आपके लिए एकदम सही होना चाहिए। आप प्रत्येक निबंध को एक खिलाड़ी के रूप में मान सकते हैं। दो निबंध (सहकर्मी ग्रेडिंग प्रक्रिया के दौरान) के बीच की तुलना उनके बीच एक मैच के परिणाम की तरह है। ब्रैडले-टेरी मॉडल आपको उस सभी डेटा को लेने की अनुमति देगा, और प्रत्येक निबंध के लिए एक ताकत का अनुमान लगाएगा, जहां उच्च ताकत बेहतर निबंधों के अनुरूप हैं। अब आप सभी निबंधों को रैंक-ऑर्डर करने के लिए उन शक्तियों का उपयोग कर सकते हैं।
विवरण और चर्चा। वास्तव में, ब्रैडले-टेरी मॉडल उससे भी बेहतर है जो आपने पूछा था। आपने एक रेखीय रैंकिंग के लिए कहा, लेकिन ब्रैडली-टेरी मॉडल वास्तव में प्रत्येक निबंध को एक (वास्तविक संख्या) रेटिंग देता है। इसका मतलब है कि आप न केवल निबंध जानते हैंमैं निबंध से अधिक मजबूत है जे, लेकिन के एक मोटे अनुमान कैसे ज्यादा मजबूत यह है। उदाहरण के लिए, आप इसका उपयोग अपने निबंध को रैंक करने के लिए चयन करने के लिए कर सकते हैं।
आपके पास मौजूद डेटा को देखते हुए, सभी निबंधों के लिए रेटिंग या रैंकिंग का अनुमान लगाने के वैकल्पिक तरीके हैं। उदाहरण के लिए, एलो विधि एक और है। मैं उनमें से कई को एक अलग प्रश्न के उत्तर में संक्षेप में प्रस्तुत करता हूं ; अधिक विवरण के लिए उस उत्तर को पढ़ें।
एक अन्य टिप्पणी: ब्रैडले-टेरी मॉडल मानती है कि दो खिलाड़ियों के बीच प्रत्येक तुलना का परिणाम एक जीत या हानि (यानी, एक द्विआधारी परिणाम) है। हालांकि, ऐसा लगता है कि आपके पास वास्तव में अधिक विस्तृत डेटा होगा: आपका स्लाइडर एक मोटा अनुमान लगाएगा कि सहकर्मी ग्रेडर ने दूसरे की तुलना में एक निबंध कितना बेहतर मूल्यांकन किया। सबसे सरल तरीका यह होगा कि प्रत्येक स्लाइडर को बाइनरी रिजल्ट में मैप करें। हालाँकि, यदि आप वास्तव में चाहते हैं, तो आप अधिक परिष्कृत विश्लेषण का उपयोग करके, सभी डेटा का उपयोग करने में सक्षम हो सकते हैं। ब्रैडली-टेरी मॉडल में लॉजिस्टिक रिग्रेशन करना शामिल है। यदि आप सामान्य रूप से आदेशित लॉग का उपयोग करने के लिए कहते हैं , तो मैं शर्त लगाता हूं कि आप प्रत्येक स्लाइडर से आपके पास मौजूद अतिरिक्त जानकारी का लाभ उठा सकते हैं, यह देखते हुए कि स्लाइडर्स से परिणाम बाइनरी नहीं हैं, लेकिन कई संभावनाओं में से एक हैं।
शिक्षक का कुशल उपयोग
आप शिक्षक को मैन्युअल रूप से सभी निबंधों के शीर्ष X% और निचले X% को ग्रेड करने का सुझाव देते हैं (सहकर्मी के ग्रेडिंग के परिणाम से अनुमान लगाई गई रैंकिंग का उपयोग करके)। यह काम कर सकता है, लेकिन मुझे संदेह है कि यह शिक्षक के सीमित समय का सबसे कुशल उपयोग नहीं है। इसके बजाय, मैं एक वैकल्पिक दृष्टिकोण का सुझाव देना चाहूंगा।
मेरा सुझाव है कि आपके पास शिक्षक ग्रेड निबंधों का एक सबसेट है, सबसेट के साथ ध्यान से चुने गए सभी निबंधों के लिए सर्वोत्तम संभव अंशांकन प्रदान करने का प्रयास करें जो शिक्षक द्वारा वर्गीकृत नहीं किए गए थे। इसके लिए, मुझे लगता है कि यदि आप ऐसे निबंधों के नमूने का चयन कर सकते हैं जो संभावित उत्तरों की सीमा को कवर करते हैं (तो हर निबंध के लिए, कुछ शिक्षक-निबंध निबंध हैं जो इससे बहुत दूर नहीं हैं)। इसके लिए, मैं दो दृष्टिकोणों के बारे में सोच सकता हूँ जिन्हें आप आज़मा सकते हैं:
क्लस्टरिंग। रेटिंग्स लें जो टेरी-ब्रैडली मॉडल द्वारा निर्मित हैं। यह एक सेट हैnवास्तविक संख्या, प्रति निबंध एक वास्तविक संख्या। अब उन्हें क्लस्टर करें। मान लीजिए आप शिक्षक ग्रेड लेना चाहते हैंकनिबंध। एक दृष्टिकोण का उपयोग करना होगाकनिबंध को क्लस्टर करने के लिए (इन एक आयामी डेटा बिंदुओं पर) क्लस्टरिंग क क्लस्टर, और फिर शिक्षक के ग्रेड के लिए प्रत्येक क्लस्टर से यादृच्छिक रूप से एक निबंध का चयन करें - या प्रत्येक क्लस्टर के "क्लस्टर हेड" शिक्षक ग्रेड है।
सबसे पहले-बिंदु। एक विकल्प के एक सबसेट का चयन करने का प्रयास करना हैकनिबंध जो एक दूसरे से यथासंभव अलग हैं। "फर्स्ट-पॉइंट-प्रथम" (एफपीएफ) एल्गोरिथ्म इसके लिए एक स्वच्छ दृष्टिकोण है। मान लें कि आपके पास कुछ दूरी समारोह हैघ(इमैं,इजे) इससे आप दो निबंधों के बीच की दूरी निर्धारित कर सकते हैं इमैं तथा इजे: एक छोटी दूरी का मतलब है कि निबंध समान हैं, एक बड़ी दूरी का मतलब है कि वे भिन्न हैं। एक सेट दियाएस निबंध के, चलो घ( ई , एस) =मिनटइ'∈ एसघ( ई ,इ') में निकटतम निबंध से की दूरी हो । सबसे पहले बिंदु पर एल्गोरिथ्म निबंध, एक सूची की गणना करता है , इस प्रकार है: वह निबंध है जो (सभी निबंधों में से)इएसकइ1,इ2, … ,इकइमैं + 1घ( ई , {इ1,इ2, … ,इमैं} )इ ऐसा है कि ई ∉ {इ1,इ2, … ,इमैं})। इस एल्गोरिदम का एक सेट उत्पन्न करता हैक निबंध जो एक-दूसरे से यथासंभव भिन्न हैं - जिसका अर्थ है कि शेष निबंधों में से प्रत्येक कम से कम एक के समान सुंदर है क। इसलिए, शिक्षक ग्रेड होना उचित होगाक एफपीएफ एल्गोरिथ्म द्वारा चयनित निबंध।
मुझे संदेह है कि इनमें से किसी भी दृष्टिकोण में शिक्षक ग्रेड के शीर्ष X% और नीचे X% से अधिक सटीक अंक हो सकते हैं - क्योंकि बहुत अच्छे और सबसे खराब निबंध संभवतः बीच में निबंधों के द्रव्यमान के प्रतिनिधि नहीं हैं।
दोनों दृष्टिकोणों में, आप एक अधिक परिष्कृत दूरी फ़ंक्शन का उपयोग कर सकते हैं जो न केवल सहकर्मी ग्रेडिंग के आधार पर ताकत के अनुमानों को ध्यान में रखता है, बल्कि निबंध से प्राप्त अन्य कारक भी हैं। टेरी-ब्रैडली मॉडल के परिणाम को ध्यान में रखते हुए सबसे सरल संभव दूरी समारोह, यानीघ(इ1,इ2) = ( रों (इ1) - s (इ2))2 कहाँ पे s ( e ) निबंध की ताकत है इजैसा कि सहकर्मी ग्रेडिंग के परिणामों के आधार पर टेरी-ब्रैडली मॉडल द्वारा अनुमान लगाया गया है। हालाँकि, आप कुछ अधिक परिष्कृत कर सकते हैं। उदाहरण के लिए, आप निबंध के बीच सामान्यीकृत लेवेंसहाइट संपादित दूरी की गणना कर सकते हैंइ1 तथा इ2(उन्हें टेक्स्ट स्ट्रिंग्स के रूप में मानते हुए, संपादित दूरी की गणना, और दो के बड़े भाग से विभाजित) और उपयोग करें कि दूरी फ़ंक्शन में एक और कारक के रूप में। आप निबंधों में शब्दों पर एक बैग-ऑफ-वर्ड मॉडल का उपयोग करते हुए फ़ीचर वैक्टर की गणना भी कर सकते हैं, और इन फ़ंक्शन वैक्टर (tf-idf का उपयोग करके सामान्यीकृत सुविधाओं के साथ) के बीच L2 दूरी का उपयोग करें। आप एक दूरी फ़ंक्शन का उपयोग कर सकते हैं जो कि ताकत में अंतर का एक भारित औसत है (टेरी-ब्रैडली अनुमानों के आधार पर), सामान्यीकृत संपादित दूरी, और कुछ और जो मददगार लगता है। इस तरह के अधिक परिष्कृत दूरी समारोह से क्लस्टरिंग एल्गोरिथ्म का चयन करने में मदद करने का एक बेहतर काम करने में मदद मिल सकती है जो सबसे अच्छे हैंक शिक्षक ग्रेड के लिए निबंध।