क्या एक परीक्षा का परिणाम एक द्विपद है?


31

यहाँ एक सरल सांख्यिकी प्रश्न है जो मुझे दिया गया था। मुझे यकीन नहीं है कि मैं इसे समझता हूं।

एक्स = एक परीक्षा में एक्वायर्ड अंक की संख्या (बहुविकल्पी और एक सही उत्तर एक बिंदु है)। क्या एक्स द्विपदीय वितरित किया जाता है?

प्रोफेसर का जवाब था:

हां, क्योंकि केवल सही या गलत उत्तर हैं।

मेरा जवाब:

नहीं, क्योंकि प्रत्येक प्रश्न में एक अलग "सफलता-संभावना" है। जैसा कि मैंने समझा कि एक द्विपद वितरण बर्नौली-प्रयोगों की एक श्रृंखला है, जिसमें प्रत्येक में एक दिए गए सफलता-संभाव्यता p के साथ एक सरल परिणाम (सफलता या विफलता) है (और सभी पी के बारे में "समान" हैं)। जैसे, (निष्पक्ष) सिक्के को 100 बार लहराना, यह 100 बर्नौली-प्रयोग है और सभी में p = 0.5 है। लेकिन यहाँ सवाल अलग-अलग तरह के p सही हैं?


14
+1 बिंदु तक और भी अधिक: जब तक कि यह वास्तव में एक अजीब परीक्षा नहीं है, तब तक प्रश्नों की प्रतिक्रियाओं का जोरदार सहसंबंध होगा। यदि किसी व्यक्ति के लिए कुल अंक है , तो यह एक द्विपद वितरण को रोक देगा। क्या यह संभव हो सकता है कि सवाल एक "शून्य परिकल्पना" धारणा के तहत काम कर रहा है जिसमें सभी परीक्षार्थी स्वतंत्र रूप से और बेतरतीब ढंग से सभी उत्तरों का अनुमान लगा रहे हैं? X
whuber

2
कितना विरोधाभास है, मुझे इस पर आंशिक ऋण के लिए कम से कम पैरवी करनी होगी, लेकिन "जवाब" इसे पुरस्कृत करने के लिए एक असंतोष को दर्शाता है :) (मुझे लगता है कि आप यहीं हैं)।
एडम

1
हाँ, धन्यवाद: D, मुझे लगता है कि इसकी अधिक एक पॉइसन द्विपद वितरण (यदि कुछ भी हो)
पॉल

2
@Zahava आँकड़े देखें ।stackexchange.com/search ? q=poisson+binomial
whuber

2
मैं हर किसी से सहमत हूं कि प्रश्न खराब था, लेकिन यहां एक फ्रेमिंग मुद्दा है। यदि यह एक प्रारंभिक पाठ्यक्रम है और यह एक लघु-उत्तर प्रारूप है (ताकि आपको अपना तर्क समझाने का मौका मिले), तो मैं कहूंगा कि सबसे अच्छा उत्तर शायद "हाँ (प्रत्येक प्रश्न के लिए स्वतंत्रता और समान कठिनाई मानकर) है"; यह उस प्रोफेसर को संकेत देगा कि (1) आप प्रश्न की सीमाओं को समझते हैं और (2) आप स्मार्ट-गधा बनने की कोशिश नहीं कर रहे हैं।
बेन बोल्कर

जवाबों:


25

मैं आपके उत्तर से सहमत हूँ। आमतौर पर इस तरह का डेटा आजकल किसी तरह के आइटम रिस्पॉन्स थ्योरी मॉडल के साथ तैयार किया जाएगा । उदाहरण के लिए, यदि आप मॉडल का उपयोग करते हैं , तो बाइनरी उत्तर रूप में मॉडल किया जाएगाXni

Pr{Xni=1}=eβnδi1+eβnδi

जहाँ को व्यक्तियों की क्षमता और रूप में प्रश्न कठिनाई के रूप में सोचा जा सकता है। तो मॉडल आपको इस तथ्य को पकड़ने में सक्षम बनाता है कि विभिन्न व्यक्ति क्षमताओं में भिन्न होते हैं और प्रश्न कठिनाई में भिन्न होते हैं, और यह आईआरटी मॉडलों में सबसे सरल है।βnnδii

आपके प्रोफेसरों ने उत्तर दिया कि सभी सवालों में "सफलता" की समान संभावना है और स्वतंत्र हैं, क्योंकि द्विपद iid बर्नौली परीक्षणों के योग का एक वितरण है । यह ऊपर वर्णित दो प्रकार की निर्भरता को अनदेखा करता है।n

जैसा कि टिप्पणियों में देखा गया है, यदि आपने किसी विशेष व्यक्ति के उत्तर के वितरण पर ध्यान दिया है (इसलिए आपको व्यक्ति-व्यक्ति परिवर्तनशीलता के बारे में परवाह नहीं है), या एक ही आइटम पर विभिन्न लोगों के उत्तर हैं (इसलिए बीच में नहीं है- आइटम परिवर्तनशीलता), तो वितरण पोइसन-द्विपद होगा, यानी गैर-आईड बर्नौली परीक्षणों के योग का वितरण । वितरण द्विपद, या पॉइसन के साथ अनुमानित किया जा सकता है , लेकिन यह सब है। अन्यथा आप आईआईडी धारणा बना रहे हैं।n

यहां तक ​​कि अनुमान लगाने के बारे में "अशक्त" धारणा के तहत, यह मानता है कि अनुमान लगाने का कोई पैटर्न नहीं है, इसलिए लोग इस बात में भिन्न नहीं होते हैं कि वे कैसे अनुमान लगाते हैं और आइटम उनके द्वारा अनुमान किए जाने के तरीके में भिन्न नहीं होते हैं - इसलिए अनुमान लगाना विशुद्ध रूप से यादृच्छिक है।


यह समझ आता है! हालांकि मुझे लगता है कि आप एक प्रश्न की सफलता की संभावना की संभावना की गणना कर सकते हैं, लेकिन "व्यक्तियों की क्षमता" मुश्किल लगता है :) एक और विचार है कि मुझे यह बर्नुलि वितरण के योग के रूप में मॉडल करना था? जैसे हम कहते हैं कि 2 प्रश्न हैं, इसलिए 2 सफलता-संभावनाएं p1 और P2 हैं। एनालॉग दो चर एक्स 1 और एक्स 2 काउंटिंग (इसलिए 2 बर्नुलि-प्रयोग)। फिर उदाहरण के लिए 1 का कुल स्कोर पाने की संभावना P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-P2) + (p1) है -1) p2। क्या यह उचित है?
पॉल

2
@Paul दो Bernoulli के विभिन्न पी के साथ की राशि प्वासों-द्विपद है
टिम

4
"अशक्त" धारणा मूल रूप से एक गोलाकार-गाय की चीज है, आप हमेशा इस बात के बारे में समझ सकते हैं कि गाय कितनी गोलाकार है।
हांग ओई

5

इस समस्या का उत्तर प्रश्न के निर्धारण और जानकारी प्राप्त होने पर निर्भर करता है। कुल मिलाकर, मैं प्रोफेसर से सहमत हूं, लेकिन लगता है कि उसका उत्तर गलत है और प्रोफेसर के सवाल में अधिक जानकारी शामिल होनी चाहिए।

यदि आप संभावित परीक्षा के प्रश्नों की एक अनंत संख्या पर विचार करते हैं, और आप प्रश्न 1 के लिए यादृच्छिक पर एक ड्रा करते हैं, तो प्रश्न 2 के लिए यादृच्छिक पर एक ड्रा करें, आदि। फिर परीक्षा में जा रहे हैं:

  1. प्रत्येक प्रश्न के दो परिणाम होते हैं (सही या गलत)
  2. परीक्षणों की एक निश्चित संख्या है (प्रश्न)
  3. प्रत्येक परीक्षण को स्वतंत्र माना जा सकता है (प्रश्न दो में जा रहा है, इसे सही होने की आपकी प्रायिकता , प्रश्न एक में जाते समय समान है)p

इस ढांचे के तहत, एक द्विपद प्रयोग की धारणाओं को पूरा किया जाता है।

काश, बीमार-प्रस्तावित सांख्यिकीय समस्याएं केवल परीक्षा पर नहीं, बल्कि व्यवहार में बहुत आम हैं। मैं अपने प्रोफेसर को आपके तर्क का बचाव करने में संकोच नहीं करूँगा।


Jea मुझे लगता है कि सही भी है। सवाल सिर्फ "बुरा" है, क्योंकि आप दोनों तरीकों से बहस कर सकते हैं, चूंकि बहुत कम जानकारी दी जाती है। लेकिन मैं अपने प्रोफेसर के दिए गए जवाब से बहुत दुखी था।
पॉल

4
@Paul, अच्छे सांख्यिकीय प्रश्नों को लिखना वास्तव में बहुत कठिन है। मुझे पता है कि मैंने इसे कई मौकों पर भुनाया है।
गूँज - मोनिका

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- मुझे लगता है कि आपको यह धारणा स्पष्ट करनी चाहिए कि परीक्षा प्रश्न संभावित प्रश्नों के पूल से स्वतंत्र रूप से तैयार किए गए हैं। यह उनके लिए सहसंबद्ध होने के लिए अधिक यथार्थवादी होगा: यदि प्रश्न 1 आसान है, तो संभावना है कि आपको एक आसान परीक्षा दी जा रही है और यह प्रश्न 2 आसान होगा।
एड्रियन

0

यदि n प्रश्न हैं, और मैं प्रायिकता p के साथ किसी भी एक प्रश्न का सही उत्तर दे सकता हूं, और सभी प्रश्नों के उत्तर देने का प्रयास करने के लिए पर्याप्त समय है, और मैंने इनमें से 100 परीक्षण किए हैं, तो मेरे स्कोर np के माध्य से सामान्य रूप से वितरित किए जाएंगे।

लेकिन यह मेरे लिए 100 बार परीक्षा को दोहरा नहीं रहा है, यह 100 अलग-अलग उम्मीदवार हैं जो एक परीक्षण कर रहे हैं, प्रत्येक अपनी संभावना पी के साथ। इन पी का वितरण ओवरराइडिंग कारक होगा। आपके पास एक परीक्षण हो सकता है जहां p = 0.9 यदि आपने विषय का अच्छी तरह से अध्ययन किया है, तो p = 0.1 यदि आपने नहीं किया है, तो 0.1 और 0.9 के बीच बहुत कम लोग हैं। अंकों के वितरण में 0.1n और 0.9 n पर बहुत मजबूत मैक्सिमा होगी और सामान्य वितरण के पास कहीं नहीं होगी।

दूसरी ओर, ऐसे परीक्षण हैं जहां हर कोई किसी भी प्रश्न का उत्तर दे सकता है, लेकिन अलग-अलग समय ले सकता है, इसलिए कुछ सभी n प्रश्नों का उत्तर देंगे, और अन्य कम जवाब देंगे क्योंकि वे समय से बाहर भाग जाते हैं। यदि हम मान सकते हैं कि उम्मीदवारों की गति सामान्य वितरित है, तो अंक सामान्य वितरित के करीब होंगे।

लेकिन कई परीक्षणों में कुछ बहुत कठिन और कुछ बहुत ही आसान प्रश्न होंगे, जानबूझकर ताकि हम सबसे अच्छे उम्मीदवारों के बीच अंतर कर सकें (जो सभी प्रश्नों का उत्तर कुछ हद तक कठिनाई से देंगे) और सबसे खराब उम्मीदवार (जो केवल बहुत ही उत्तर देने में सक्षम होंगे सरल प्रश्न)। इससे अंकों के वितरण में काफी मजबूती आएगी।


2
आपके द्वारा यहाँ वर्णित सामान्य वितरण द्विपद का सामान्य सन्निकटन है। जाहिर है शून्य और की राशि सतत और के बीच सीमा नहीं होगा और
टिम

2
@Tim सामान्य वितरण पर अनावश्यक निर्भरता और 100 परीक्षणों को लेने के रहस्य के बावजूद, इस उत्तर में यह दिखाने का प्रयास किया गया है कि एक विशेष मामला स्पष्ट रूप से गैर-द्विपद वितरण कैसे हो सकता है। जैसे कि अगर इन तकनीकी मुद्दों को संबोधित किया जाता है तो उत्तरों में इसका बहुमूल्य योगदान हो सकता है।
whuber

0

परिभाषा के अनुसार, एक द्विपद वितरण स्वतंत्र और समान रूप से वितरित बर्नौली परीक्षणों का एक सेट है । एक बहु विकल्प परीक्षा के मामले में, में से प्रत्येक सवाल Bernoulli परीक्षणों में से एक होगा।n n

यहाँ समस्या यह है कि हम यथोचित रूप से यह नहीं मान सकते हैं कि प्रश्न:n

  • कर रहे हैं हूबहू वितरित । जैसा कि आपने कहा, संभावना है कि एक छात्र जानता है कि प्रश्न का उत्तर लगभग निश्चित रूप से वैसा ही नहीं होने वाला है जैसा कि वे उत्तर प्रश्न जानते हैं , और इसी तरह की संभावना ।12
  • कर रहे हैं स्वतंत्र । कई परीक्षाएं ऐसे प्रश्न पूछती हैं जो पिछले प्रश्न (नों) के उत्तरों पर बने होते हैं। यह सुनिश्चित करने के लिए कि इस प्रश्न में परीक्षा पर क्या नहीं होगा? ऐसे अन्य कारक हैं जो सवालों के जवाब एक दूसरे से स्वतंत्र नहीं होने के लिए बना सकते हैं, लेकिन मुझे लगता है कि यह सबसे सहज रूप से स्पष्ट है।

मैंने सांख्यिकी कक्षाओं में ऐसे प्रश्न देखे हैं जो मॉडल परीक्षाओं को द्विपद के रूप में प्रश्न करते हैं, लेकिन उनकी तर्ज पर कुछ लिखा जाता है:

बहुविकल्पी परीक्षा पर सही तरीके से दिए गए प्रश्नों की संख्या को किस संभावना वितरण से दर्शाया जाएगा, जहाँ हर प्रश्न के चार विकल्प होते हैं, और परीक्षा देने वाला छात्र हर उत्तर का यादृच्छिक रूप से अनुमान लगा रहा होता है?

इस परिदृश्य में, निश्चित रूप से इसे साथ द्विपद वितरण के रूप में दर्शाया जाएगा ।p=14


आपके तथ्यों के साथ कोई बात नहीं है, लेकिन तर्क गलत है: यह प्रदर्शित करने के लिए पर्याप्त नहीं है कि कुछ धारणाएं पकड़ नहीं सकती हैं, क्योंकि (तार्किक रूप से) वितरण किसी भी मामले में द्विपद हो सकता है। आपको यह भी प्रदर्शित करने की आवश्यकता है कि ये धारणा उन तरीकों में विफल हो सकती है जो स्कोर वितरण का कारण निश्चित रूप से गैर-द्विपद हैं।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.