सवाल:
मेरे पास परीक्षा के सवालों (सही / गलत) पर बाइनरी डेटा है। कुछ व्यक्तियों के पास प्रश्नों और उनके सही उत्तरों के सबसे पहले उपयोग हो सकता है। मैं नहीं जानता कि कौन, कितने या कौन से हैं। अगर कोई धोखा थे, लगता है मुझे आइटम के लिए एक सही प्रतिक्रियाओं की संभावना को मॉडल हैं के रूप में , जहां सवाल कठिनाई का प्रतिनिधित्व करता है और व्यक्ति की अव्यक्त की क्षमता है। यह एक बहुत ही सरल आइटम प्रतिक्रिया मॉडल है जिसे आरटी में ltm के rasch () जैसे कार्यों के साथ अनुमान लगाया जा सकता है। अव्यक्त चर के अनुमानों के अलावा (जहां इंडेक्स व्यक्तियों), मेरे पास अलग-अलग अनुमानों तक पहुंच है एक ही अव्यक्त चर जो दूसरे डेटासेट से प्राप्त किया गया था जिसमें धोखा देना संभव नहीं था।
लक्ष्य उन व्यक्तियों की पहचान करना है जो संभावना को धोखा देते हैं और जिन वस्तुओं को उन्होंने धोखा दिया है। कुछ दृष्टिकोण क्या आप ले सकते हैं? कच्चे डेटा के अलावा, , , और सभी उपलब्ध हैं, हालांकि पहले दो में धोखा होने के कारण कुछ पूर्वाग्रह होंगे। आदर्श रूप से, समाधान संभाव्य क्लस्टरिंग / वर्गीकरण के रूप में आएगा, हालांकि यह आवश्यक नहीं है। औपचारिक विचारों के रूप में व्यावहारिक विचारों का बहुत स्वागत किया जाता है। क्ष j
अब तक, मैंने उच्च बनाम निम्न स्कोर (जहां साथ व्यक्तियों के जोड़े के लिए प्रश्न स्कोर के सहसंबंध की तुलना की है संभावना है कि वे धोखा दिया की एक मोटा सूचकांक)। उदाहरण के लिए, मैंने व्यक्तियों को \ hat {q} _j - \ hat {z} _j द्वारा सॉर्ट किया और फिर व्यक्तियों के प्रश्न स्कोर के क्रमिक जोड़े के सहसंबंध को तैयार किया। मैंने उन व्यक्तियों के लिए स्कोर के औसत सहसंबंध की साजिश रचने की कोशिश की, जिनकी \ _ टोपी {q} _j - \ hat {z} _j मान n से अधिक थे ^ {th} का मात्रात्मक \ _ {q} _j - \ टोपी {z }_j , एन के एक समारोह के रूप में । किसी भी दृष्टिकोण के लिए कोई स्पष्ट पैटर्न नहीं। क्ष जे - जेड जे क्ष जे - जेड जे क्ष जे - जेड जेएनटीएच क्यू जे - जेड जेएन
अद्यतन करें:
मैंने @SheldonCooper और सहायक फ़्रीकोनॉमिक्स पेपर से विचारों के संयोजन को समाप्त किया जो @whuber ने मुझे इंगित किया। अन्य विचारों / टिप्पणियों / आलोचनाओं का स्वागत है।
चलो व्यक्ति के सवाल पर द्विआधारी स्कोर । आइटम रिस्पांस मॉडल अनुमान लगाएं जहां आइटम की सहजता पैरामीटर है और z_j एक अव्यक्त क्षमता चर है; (अधिक जटिल मॉडल को प्रतिस्थापित किया जा सकता है; I मेरे आवेदन में 2PL का उपयोग कर रहा हूँ)। जैसा कि मैंने अपने मूल पोस्ट में उल्लेख किया है, मेरे पास अलग-अलग डेटासेट \ {y_ {ij} \} (अलग-अलग आइटम, एक ही व्यक्ति) से क्षमता चर का अनुमान \ hat {q_j} है। जो धोखा देना संभव नहीं था। विशेष रूप से, \ hat {q_j} ऊपर समान आइटम प्रतिक्रिया मॉडल से अनुभवजन्य बेस अनुमान हैं। जे मैं एल ओ जी मैं टी ( पी आर ( एक्स मैं j = 1 | z जे ) = β मैं + z j , β मैं जेड j ^ क्ष ञ { y मैं j } ^ क्ष j
अवलोकन किए गए स्कोर की संभावना , आइटम की सहजता और व्यक्ति की क्षमता पर सशर्त, लिखा जा सकता है जहां भविष्यवाणी की संभावना है एक सही प्रतिक्रिया, और प्रतिलोम है। फिर, मद और व्यक्ति विशेषताओं पर सशर्त, संयुक्त संभावना है कि व्यक्ति टिप्पणियों है है और इसी तरह, उस आइटम संयुक्त संभाव्यता टिप्पणियों है पी मैं j = पी आर ( एक्स मैं j = एक्स मैं j | ^ β मैं , ^ क्ष ञ ) = पी मैं j ( ^ β मैं , ^ क्ष ञ ) एक्स मैं j ( 1 - पी मैं j ( ^ β i , ^ q j ) ) 1 - xपीमैंj( ^ β मैं , ^ क्ष ञ )=मैंएलओजीमैंटी( ^ β मैं + ^ क्ष ञ )मैंएलओजीमैंटीजेएक्सजेपीजे= Π मैंपीमैंj,मैंएक्समैंपीमैं= Π जेपीमैंजे।
एक अतिरिक्त कदम मैंने कोशिश की है कि कम से कम संभावना वाले व्यक्तियों का% (यानी छंटे हुए p_j मानों के सबसे कम r% वाले व्यक्ति) लेने के लिए, उनके देखे गए स्कोर x_j के बीच औसत दूरी की गणना करें (जो कि निम्न आर वाले व्यक्तियों के लिए सहसंबद्ध होना चाहिए, जो संभव थिएटर हैं), और इसे r = 0.001, 0.002, ..., 1.000 के लिए प्लॉट करें। माध्य दूरी r = 0.001 से r = 0.025 तक बढ़ जाती है, अधिकतम तक पहुँच जाती है, और फिर r = 1. पर धीरे-धीरे कम से कम गिरावट आती है। ठीक वैसा ही जैसा मैं उम्मीद कर रहा था।