आइटम प्रतिक्रिया सिद्धांत और क्या सॉफ़्टवेयर का उपयोग करने के साथ आरंभ करने के लिए कैसे?

21

प्रसंग

मैं आइटम प्रतिक्रिया सिद्धांत के बारे में पढ़ रहा हूं, और मुझे यह आकर्षक लगता है। मेरा मानना है कि मैं मूल बातें समझता हूं, लेकिन मैं यह सोचकर बचा हूं कि क्षेत्र से संबंधित सांख्यिकीय तकनीकों को कैसे लागू किया जाए। नीचे दो लेख दिए गए हैं, जो उस क्षेत्र के समान हैं जिनमें मैं आईटीआर लागू करना चाहता हूं:

दूसरा मैं वास्तव में इस बिंदु पर विस्तार करना चाहता हूं।

मैंने jMetrik नाम से एक फ्री प्रोग्राम डाउनलोड किया है, और यह बहुत अच्छा काम कर रहा है। मुझे लगता है कि यह बहुत बुनियादी हो सकता है जहां तक आईआरटी जाता है, लेकिन मैं अनिश्चित हूं।

मुझे पता है कि "सबसे अच्छा" तरीका संभवतः आर सीखने में शामिल होगा; हालाँकि, मुझे नहीं पता कि क्या मैं उस सीखने की अवस्था से निपटने के लिए समय बचा सकता हूँ। ध्यान दें कि सॉफ्टवेयर खरीदने के लिए हमारे पास कुछ धनराशि है, लेकिन जो मैं देखता हूं, वहां से कोई भी महान आईआरटी कार्यक्रम नहीं लगता है।

प्रशन

जेमेट्रिक की प्रभावशीलता पर आपके विचार क्या हैं?
आप कैसे सुझाव देंगे कि मैं IRT लगाने में आगे बढ़ूं?
आईआरटी लागू करने के लिए सबसे अच्छे कार्यक्रम क्या हैं?
क्या आप में से कोई भी नियमित रूप से आईआरटी का उपयोग करता है? यदि हां, तो कैसे?

psychometrics latent-variable irt

— Behacad
स्रोत

1

वर्तमान में आप किस सॉफ्टवेयर का उपयोग करते हैं?

— StasK

मैं jMetrik का उपयोग कर रहा हूं। यह काफी नया है और ऐसा लग रहा है कि मेरी दिलचस्पी बहुत कुछ कर रही है!

— बेहकाद

2

क्या यह स्क्रिप्ट मोड में काम करता है? यदि आपके पास केवल GUI है, तो आपके परिणाम पुन: पेश करने में बहुत मुश्किल होंगे। एक स्क्रिप्ट मोड किसी भी गंभीर सॉफ्टवेयर के लिए जरूरी है।

— StasK

22

आईआरटी के लिए एक अच्छे स्टार्टर के रूप में, मैं हमेशा आइटम प्रतिक्रिया सिद्धांत के लिए एक दृश्य गाइड पढ़ने की सलाह देता हूं ।

उपलब्ध सॉफ्टवेयर का एक सर्वेक्षण www.rasch.org पर पाया जा सकता है ।

अपने अनुभव से, मैंने ज्यादातर मामलों में रास्कैस्ट (और संबद्ध) स्टैटा कमांड (एस) को बहुत ही उपयोगी पाया, जहां एक-पैरामीटर मॉडल को फिट करने में रुचि है। अधिक जटिल डिजाइन के लिए, कोई GLLAMM का सहारा ले सकता है ; डी बोके और विल्सन की पुस्तक, व्याख्यात्मक आइटम और प्रतिक्रिया मॉडल (स्प्रिंगर, 2004) के आधार पर एक अच्छा काम करने वाला उदाहरण है ।

आर के बारे में विशेष रूप से, पिछले पांच वर्षों में बहुत सारे पैकेज उपलब्ध हैं, उदाहरण के लिए संबंधित सीआरएएन टास्क व्यू देखें । उनमें से ज्यादातर एक में चर्चा कर रहे हैं विशेष अंक के सांख्यिकीय सॉफ्टवेयर के जर्नल (vol। 20, 2007)। जैसा कि एक अन्य प्रतिक्रिया में चर्चा की गई है, ltm और eRm IRT मॉडल की एक विस्तृत श्रृंखला को फिट करने की अनुमति देते हैं। जैसा कि वे आकलन के विभिन्न तरीकों पर भरोसा ltmकरते eRmहैं --- सशर्त दृष्टिकोण का उपयोग करते समय सीमांत दृष्टिकोण का उपयोग करते हैं --- एक या दूसरे को चुनना मुख्य रूप से उस मॉडल का मामला है जिसे आप फिट करना चाहते हैं (eRm फिट नहीं होता है 2- या 3-पैरामीटर मॉडल) और माप का उद्देश्य जो आप अनुसरण करते हैं: व्यक्ति मापदंडों के सशर्त आकलन में कुछ अच्छे साइकोमेट्रिक गुण हैं जबकि एक सीमांत दृष्टिकोण आपको आसानी से मिश्रित-प्रभाव मॉडल पर स्विच करने देता है, जैसा कि निम्नलिखित दो पत्रों में चर्चा की गई है। :

डोरान, एच।, बेट्स, डी।, ब्लिस, पी। और डॉवलिंग, एम। (2007)। मल्टीलेवल रैश मॉडल का अनुमान लगाना: lme4 पैकेज के साथ । जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर , 20 (2)। आर-फोर्ज पर डग बेट्स की स्लाइड भी देखें
डी बोएक, पी।, बकर, एम।, ज़्विटेसर, आर।, निवार्ड, एम।, हॉफमैन, ए।, ट्यूरलिनक, एफ।, और पार्टचेव, आई। (2011)। R में lme4 पैकेज से lmer फंक्शन के साथ आइटम रिस्पांस मॉडल का अनुमान । सांख्यिकीय सॉफ्टवेयर जर्नल , 39 (12)। उपरोक्त डी बोके की हैंडबुक और इस हैंडआउट को भी देखें

वहाँ भी कुछ संभावनाएं, एमसीएमसी तरीकों का उपयोग कर रैश मॉडल फिट देखना जैसे करने के लिए कर रहे हैं MCMCpack पैकेज (या WinBUGS / Jags , लेकिन देखना वस्तु प्रतिक्रया के लिए बग संहिता , जेएसएस (2010) 36)।

मुझे आईआरटी मॉडलिंग के लिए एसएएस के साथ कोई अनुभव नहीं है, इसलिए मैं इसे किसी ऐसे व्यक्ति को दे दूंगा जो एसएएस प्रोग्रामिंग में अधिक पारंगत है।

अन्य समर्पित सॉफ्टवेयर (ज्यादातर शैक्षिक मूल्यांकन में उपयोग किया जाता है) में शामिल हैं: RUMM, विजय, Winsteps, BILOG / MULTILOG, Mplus ( विकिपीडिया पर पहले से उपलब्ध सूची का हवाला नहीं देते )। कोई भी उपयोग करने के लिए स्वतंत्र है, लेकिन उनमें से कुछ के लिए समय-सीमित प्रदर्शन संस्करण प्रस्तावित है। मैंने पाया jMetrik बहुत सीमित है जब मैं इसे करने की कोशिश (एक साल पहले), और सभी कार्यक्षमताओं पहले से ही उपलब्ध आर में इसी तरह कर रहे हैं, ConstructMap सुरक्षित रूप से बदला जा सकता है lme4 के रूप में दिखाया गया है, हैंडआउट ऊपर लिंक। mdltmवॉन डेविअर और कोल द्वारा मिक्स रस्च मॉडल्स के लिए मुझे (मल्टीडायमेंशनल डिसक्रेक्ट लेटेंट ट्रिट मॉडल्स) का भी उल्लेख करना चाहिए ।बहुभिन्नरूपी और मिश्रण वितरण रस्स मॉडल (स्प्रिंगर, 2007)।

— CHL
स्रोत

बहुत खुबस! बहुत व्यापक उत्तर के लिए धन्यवाद! इन दोनों जवाबों से मुझे अच्छी तरह से मदद मिलेगी, साथ ही किसी और को भी, जो इस क्षेत्र को आगे बढ़ाने में उत्सुक है, मुझे यकीन है। मेरा सुझाव है कि आप फिर से जेमेट्रिक पर एक नज़र डालें, और शायद मुझे अपने विचार दें। इसमें अब रैश मॉडलिंग, आईसीसी वक्र्स, कुछ आईआरटी वक्र्स, आईआरटी इक्वेटिंग (1PT, 2PT, 3PT मॉडल), और बहुत कुछ है।

— बेहकाद

मैं अद्यतन संस्करण को देखूंगा। लेकिन, ईमानदारी से, @Stask ने कहा कि अगर आप मापदंडों के आकलन और दृश्य रिपोर्टिंग से परे कुछ भी गंभीर करने की योजना बनाते हैं, तो यह याद रखने योग्य है। मुझे क्या मतलब है, इसका अंदाजा लगाने के लिए, R में एप्लिकेशन के साथ साइकोमेट्रिक थ्योरी का परिचय देखें । (यह कुछ हद तक "आधुनिक" साइकोमेट्रिक्स को कॉल करता है।)

— chl

@ साँची - मैं बहुत अलग परिणाम मिला जब मैंने IRT विश्लेषण आर में ltm का उपयोग करते हुए किया, जब मैंने Mplus में और फिर मल्टीगॉग में एक ही विश्लेषण चलाया था (जबकि Mplus और मल्टीगॉग में विश्लेषण समान थे)। मैंने ltm के लेखक के साथ काम करने की कोशिश की, लेकिन कोई प्रतिक्रिया नहीं मिली। क्या आपके पास अलग-अलग सॉफ़्टवेयर पैकेजों के विसंगतिपूर्ण परिणामों के साथ कोई समान अनुभव है?

— तोमर

ex5.5

θ_{p} - β_{i}

$\theta_p-\beta_i$

i = 1, \dots, k

$i=1,\dots,k$

p = 1, \dots, n

$p=1,\dots,n$

β_{i} - θ_{p}

$\beta_i-\theta_p$ यह मॉडल किया गया है, और अनुमान विधि (सीमांत बनाम सशर्त संभावना), और 2+ पैरामीटर मॉडल के लिए कि क्या थ्रेसहोल्ड केंद्रित हैं या नहीं।

— chl

@chi - प्रतिक्रिया में देरी के लिए खेद है, मैंने आपकी टिप्पणी पर ध्यान नहीं दिया है। पता नहीं कि यह अभी भी प्रासंगिक है, लेकिन मुझे भेदभाव मानकों (ए) के लिए 0.184 - 1.429 से भिन्नता मिली। उदाहरण के लिए, Mplus ने a = 5.084 दिया जबकि ltm ने समान आइटम a = 3.655 दिया। कुल मिलाकर, ltm ने mplus की तुलना में छोटा दिया। (मल्टीप्लग में एक ही विश्लेषण चलाने वाले ने Mplus से ए के अनुरूप दिया)। बी के और अधिक परिचित थे।

— Tormod

8

पहले सवाल पर, मुझे jMetrick के बारे में कोई जानकारी नहीं है।

आईआरटी को लागू करने में, (किसी भी अन्य सांख्यिकीय प्रक्रिया के साथ) पहला कदम इसका उपयोग संभव के रूप में कई अलग-अलग प्रकार के डेटा के साथ करना है। सीखने की अवस्था है, लेकिन मेरा मानना है कि यह इसके लायक है।

आईआरटी की एक महत्वपूर्ण विशेषता रस्च मॉडल और आईआरटी मॉडल के बीच भेदभाव है। उन्हें अलग-अलग लोगों द्वारा अलग-अलग उद्देश्यों के लिए विकसित किया गया था। कहा जा रहा है कि, IRT मॉडल रास्च मॉडल का सुपरसेट है।

रस्क मॉडल एक पैरामीटर मॉडल हैं - वे मानते हैं कि प्रश्नावली पर सभी आइटम अव्यक्त विशेषता के समान रूप से अनुमानित हैं।

आईआरटी मॉडल, हालांकि दो पैरामीटर मॉडल हैं जो प्रतिभागियों की क्षमता के बारे में जानकारी प्रदान करने की क्षमता में सवालों को अलग-अलग करने की अनुमति देते हैं।

इसके अलावा, तीन पैरामीटर मॉडल हैं जो आईआरटी मॉडल की तरह हैं, सिवाय इसके कि वे प्रतिभागियों द्वारा अनुमान लगाने की क्षमता के हिसाब से सही उत्तर प्राप्त करने के लिए अनुमान लगाने के लिए पैरामीटर की अनुमति देते हैं (यह व्यक्तित्व परीक्षणों के बजाय क्षमता में अधिक चिंता का विषय है)।

इसके अलावा, बहुआयामी आईआरटी है जो एक ही बार में कई अव्यक्त क्षमताओं का अनुमान लगाता है। मैं इसके बारे में ज्यादा नहीं जानता, लेकिन इसका एक क्षेत्र है जिसे मैं और अधिक जानने का इरादा रखता हूं।

डाइकोटोमस और पॉलीटोमस आईआरटी विधियों के बीच एक अंतर भी है। Dichotomous IRT मॉडल उन क्षमता परीक्षणों में उपयोग किए जाते हैं, जिनका सही और गलत उत्तर होता है। पॉलीटोमस आईआरटी मॉडल का उपयोग व्यक्तित्व परीक्षणों में किया जाता है, जहां कई उत्तर होते हैं, जो समान रूप से सही होते हैं (इस अर्थ में कि कोई सही उत्तर नहीं है)।

मैं व्यक्तिगत रूप से आइटम प्रतिक्रिया सिद्धांत के लिए आर का उपयोग करता हूं। मेरे द्वारा उपयोग किए जाने वाले दो मुख्य पैकेज हैं, eRmजो केवल रास्क मॉडल को फिट करता है, और ltmजो आइटम प्रतिक्रिया सिद्धांत मॉडल (दो और तीन पैरामीटर मॉडल) को फिट करता है। दोनों में अनुकरणीय कार्यक्षमता है, और दोनों द्विभाजित आईआरटी मॉडल के लिए अधिक दिनचर्या प्रदान करते हैं। मुझे नहीं पता कि आर आईआरटी के लिए "सर्वश्रेष्ठ" है, इसमें आईआरटी मॉडल की सभी भीड़ उपलब्ध नहीं है, लेकिन यह निश्चित रूप से सबसे अधिक एक्स्टेंसिबल है, इसमें कोई भी इन मॉडलों को अपेक्षाकृत आसानी से प्रोग्राम कर सकता है।

मैं आईआरटी का उपयोग केवल विशेष रूप से बहुपत्नी मॉडल के लिए करता हूं, आर में। मैं आम तौर पर mokkenमान्यताओं का परीक्षण करने के लिए गैर पैरामीट्रिक आईआरटी तरीकों (पैकेज में प्रदान ) के साथ शुरू करता हूं , और फिर एक रस्च मॉडल के साथ आगे बढ़ता हूं, जिससे अच्छे फिट होने के लिए और अधिक जटिलता बढ़ जाती है।

बहुआयामी IRT के लिए, पैकेज `mirt 'है, जो इस कार्यक्षमता को प्रदान करता है। मैंने इसका उपयोग नहीं किया है इसलिए मैं वास्तव में टिप्पणी नहीं कर सकता।

यदि आप इन पैकेजों को R में स्थापित करते हैं, और 'vignette ("packagename") फ़ंक्शन को कॉल करते हैं, तो आपको कुछ उपयोगी vignettes (निश्चित रूप से eRmऔर mokkenदूसरों के लिए संभवतः) प्राप्त करने चाहिए , जो आपके लिए उपयोगी साबित हो सकते हैं (आपके स्तर के आधार पर) गणितीय परिष्कार)।

अंत में, रैश और इर्ट मॉडल के लिए कई अच्छी किताबें उपलब्ध हैं। मनोवैज्ञानिकों के लिए आइटम प्रतिक्रिया सिद्धांत का उपयोग अक्सर किया जाता है (हालांकि मुझे शैली पसंद नहीं थी), और आगे तकनीकी परिष्कार श्रृंखला, दो बेहद व्यापक और उपयोगी पाठ्यपुस्तकें हैं - आधुनिक आइटम रिस्पॉन्स थ्योरी और रैश मॉडल की पुस्तिका : नींव, हाल विकास और अनुप्रयोग ।

आशा है कि ये आपकी मदद करेगा।

— richiemorrisroe
स्रोत

धन्यवाद! यह बहुत सराहना की है। मैं सॉफ्टवेयर विकल्पों के बारे में अधिक सुनना चाहूंगा अगर किसी को क्षेत्र में कुछ ज्ञान है।

— बेहाकड़

3

जेमेट्रिक आपके विचार से अधिक शक्तिशाली है। यह परिचालन कार्य के लिए डिज़ाइन किया गया है जहाँ शोधकर्ताओं को एकल एकीकृत ढांचे में कई प्रक्रियाओं की आवश्यकता होती है। वर्तमान में आप रैश, आंशिक क्रेडिट और रेटिंग स्केल मॉडल के लिए आईआरटी मापदंडों का अनुमान लगा सकते हैं। यह स्टॉकिंग-लॉर्ड, हेबारा और अन्य तरीकों के माध्यम से आईआरटी स्केल को जोड़ने की भी अनुमति देता है। क्योंकि इसमें एक एकीकृत डेटाबेस शामिल है, आईआरटी अनुमान से आउटपुट को डेटा फ़ाइलों को फिर से खोलने की आवश्यकता के बिना स्केल लिंकिंग में उपयोग किया जा सकता है। इसके अलावा, जेमेट्रिक या बाहरी कार्यक्रमों जैसे आर के अन्य तरीकों के साथ उपयोग के लिए सभी आउटपुट डेटाबेस में संग्रहीत किए जा सकते हैं।

आप इसे GUI के बजाय स्क्रिप्ट के साथ भी चला सकते हैं। उदाहरण के लिए, follwing कोड (a) डेटाबेस में डेटा आयात करेगा, (b) उत्तर कुंजी के साथ स्कोर आइटम, (c) रास मॉडल मापदंडों का अनुमान लगाता है, और (d) CSV फ़ाइल के रूप में डेटा निर्यात करता है। आप अंतिम विश्लेषण फ़ाइल को आगे के विश्लेषण के लिए R में इनपुट के रूप में उपयोग कर सकते हैं, या आप R का उपयोग सीधे jMetrik डेटाबेस से कनेक्ट करने और परिणामों के साथ काम करने के लिए कर सकते हैं।

#import data into database
import{
     delimiter(comma);
     header(included);
     options(display);
     description();
     file(C:/exam1-raw-data.txt);
     data(db = testdb1, table = EXAM1);
}

#conduct item scoring with the answer key
scoring{
     data(db = mydb, table = exam1);
     keys(4);
     key1(options=(A,B,C,D), scores=(1,0,0,0), variables=  (item1,item9,item12,item15,item19,item21,item22,item28,item29,item30,item34,item38,item42,item52,item55));
     key2(options=(A,B,C,D), scores=(0,1,0,0), variables=(item4,item6,item16,item18,item24,item26,item32,item33,item35,item43,item44,item47,item50,item54));
     key3(options=(A,B,C,D), scores=(0,0,1,0), variables=(item3,item5,item7,item11,item14,item20,item23,item25,item31,item40,item45,item48,item49,item53));
     key4(options=(A,B,C,D), scores=(0,0,0,1), variables=(item2,item8,item10,item13,item17,item27,item36,item37,item39,item41,item46,item51,item56));
}

#Run a Rasch models analysis.
#Item parameters saved as database table named exam1_rasch_output
#Residuals saved as a databse table named exam1_rasch_resid
#Person estimates saved to original data table. Person estimate in variable called "theta"
rasch{
     center(items);
     missing(ignore);
     person(rsave, pfit, psave);
     item(isave);
     adjust(0.3);
     itemout(EXAM1_RASCH_OUTPUT);
     residout(EXAM1_RASCH_RESID);
     variables(item1, item2, item3, item4, item5, item6, item7, item8, item9, item10, item11, item12, item13, item14, item15, item16, item17, item18, item19, item20, item21, item22, item23, item24, item25, item26, item27, item28, item29, item30, item31, item32, item33, item34, item35, item36, item37, item38, item39, item40, item41, item42, item43, item44, item45, item46, item47, item48, item49, item50, item51, item52, item53, item54, item55, item56);
     transform(scale = 1.0, precision = 4, intercept = 0.0);
     gupdate(maxiter = 150, converge = 0.005);
     data(db = testdb1, table = EXAM1);
}

#Export output table for use in another program like R
export{
     delimiter(comma);
     header(included);
     options();
     file(C:/EXAM1_RASCH_OUTPUT.txt);
     data(db = testdb1, table = EXAM1_RASCH_OUTPUT);
}

सॉफ्टवेयर अभी भी विकास के अपने शुरुआती चरण में है। मैं वर्तमान में खोजपूर्ण कारक विश्लेषण और अधिक उन्नत आइटम प्रतिक्रिया मॉडल जोड़ रहा हूं। कई अन्य आईआरटी कार्यक्रमों के विपरीत, जेमेट्रिक खुला स्रोत है। माप प्रक्रिया के सभी साइकोमेटिक्स लाइब्रेरी का उपयोग करते हैं जो वर्तमान में GitHub, https://github.com/meyerjp3/psychometrics पर उपलब्ध है । योगदान करने के इच्छुक किसी भी व्यक्ति का स्वागत किया जाता है।

— meyerjp3
स्रोत

0

आपके पास यहां प्रश्नों की एक विस्तृत सूची है, लेकिन कई शोधकर्ताओं के लिए काफी प्रासंगिक है!

मैं आपको आईआरटी में आगे बढ़ने की अत्यधिक सलाह देता हूं, लेकिन केवल तभी जब आपकी स्थिति आवश्यकताओं को पूरा करती है। उदाहरण के लिए, यह आपके द्वारा उपयोग किए जाने वाले परीक्षणों के प्रकार के साथ अच्छी तरह से फिट बैठता है, और शायद सबसे महत्वपूर्ण बात यह है कि आपके पास आवश्यक नमूना आकार हैं। डायकोटोमस मल्टीपल-चॉइस डेटा के लिए, मैं 3PL मॉडल ("वस्तुनिष्ठ माप" का रस्स तर्क) स्पष्टता से अनुपलब्ध है, और 500-1000 आमतौर पर न्यूनतम नमूना आकार है। अनुमान के बिना विचित्र डेटा, मनोवैज्ञानिक सर्वेक्षणों जैसे कि बयानों के लिए वाई / एन प्रतिक्रियाएं हैं, 2PL के साथ अच्छी तरह से काम करते हैं। यदि आपके पास रेटिंग स्केल या आंशिक क्रेडिट डेटा है, तो विशेष रूप से उन स्थितियों के लिए डिज़ाइन किए गए पॉलीटोमस मॉडल हैं।

IMT, IRT को लागू करने का सबसे अच्छा कार्यक्रम Xcalibre है। यह अपेक्षाकृत उपयोगकर्ता के अनुकूल (सरल जीयूआई के साथ-साथ कुछ कमांड-लाइन बैच-प्रकार है यदि आप इसे किसी कारण से चाहते हैं) और अत्यधिक पठनीय आउटपुट (व्यापक तालिकाओं और आंकड़ों के साथ एमएस वर्ड रिपोर्ट) का उत्पादन करता है। मैं विपरीत कारणों के लिए आर का उपयोग करने के खिलाफ सलाह देता हूं। बेशक, यह है कि यह मुफ़्त नहीं है, लेकिन आप जैसा कहते हैं, वैसा ही मिलता है। पूर्ण विवरण, उदाहरण आउटपुट, और एक नि: शुल्क परीक्षण www.assess.com पर उपलब्ध हैं ।

— Aeneas
स्रोत

क्या आप इस बारे में विस्तार से जानना चाहेंगे कि "वस्तुनिष्ठ माप" सेंसु रैस्च (या विशेष रूप से विशिष्ट उद्देश्य तुलना की संभावना) पर तर्क "हड़ताली अनसुना" क्यों है?

— मोमो

0

इस बीच में फ्रैंक बेकर, बेकर फ्रैंक बी, सेक-हो किम की एक नई किताब प्रकाशित हुई है । आर। स्प्रिंगर इंटरनेशनल पब्लिशिंग (2017) का उपयोग करके आइटम रिस्पांस थ्योरी की मूल बातें । यह आर पैकेज का उपयोग नहीं करता है लेकिन स्निपेट्स प्रदान करता है।

CRAN पर उपलब्ध विवरण के साथ IRT के लिए R संकुल की एक (भीड़ वाली) सूची उपलब्ध है ।

— मार्को स्टामाज़ा
स्रोत