20,000 टॉस से 10,000 हेड्स के लिए सांख्यिकीय तर्क अमान्य डेटा का सुझाव देता है


11

मान लें कि हम बार-बार एक उचित सिक्के को उछाल रहे हैं, और हम जानते हैं कि सिर और पूंछ की संख्या लगभग बराबर होनी चाहिए। जब हम कुल 20 टॉप्स के लिए 10 हेड्स और 10 टेल्स जैसे रिजल्ट देखते हैं, तो हम रिजल्ट्स को मानते हैं और यह मानते हैं कि सिक्का फेयर है।

जब आप कुल 20000 टॉस के लिए 10000 हेड्स और 10000 टेल्स जैसे रिजल्ट देखते हैं, तो मैं वास्तव में रिजल्ट की वैधता पर सवाल उठाऊंगा (एक्सपेरिमेंट फर्जी डेटा किया था), क्योंकि मुझे पता है कि यह परिणाम की तुलना में अधिक संभावना नहीं है, 10093 सिर और 9907 पूंछ।

मेरे अंतर्ज्ञान के पीछे सांख्यिकीय तर्क क्या है?

जवाबों:


21

एक उचित सिक्के को 10000 सिर और 10000 पूंछों का परिणाम मानते हुए, वास्तव में 10093 सिर और 9907 पूंछ के परिणाम की तुलना में अधिक संभावना है।

हालांकि, जब आप कहते हैं कि एक वास्तविक प्रयोगकर्ता को समान संख्या में सिर और पूंछ प्राप्त करने की संभावना नहीं है, तो आप बेयस प्रमेय का अनुमान लगा रहे हैं। एक वास्तविक प्रयोग के बारे में आपकी पूर्व धारणा यह है कि प्रोब (हेड्स की संख्या = 20000 टोस में = 10000 नहीं है। यह देखते हुए कि प्रयोगकर्ता फ़ेकिंग नहीं है) 0. के करीब है। इस प्रकार, जब आप एक वास्तविक परिणाम देखते हैं कि 'हेड्स की संख्या = 10000' आपके प्रोब के बारे में पीछे (एक्सपेरिमेंट फ़ेकिंग नहीं है। 10000 हेड्स के देखे गए परिणाम) भी 0. के करीब है। इस प्रकार, आप यह निष्कर्ष निकालते हैं कि एक्सपेरिमेंट डेटा को फ़ेक कर रहा है।


बहुत अच्छी तरह से समझाया! बायस प्रमेय दृष्टिकोण के लिए एक अद्भुत उदाहरण क्या है।
ताल गैलिली

1
@ श्रीकांत: कि पूर्व को औपचारिक रूप से परिभाषित नहीं किया जा सकता है। किसी भी मामले में, प्रो (हेड्स की संख्या = एक्स। प्रयोगकर्ता फीका नहीं है) हमेशा शून्य के आसपास होता है जब एन = 20000, कोई बात नहीं एक्स का मूल्य और कोई फर्क नहीं पड़ता कि आपके पूर्व। तो किसी भी संख्या के लिए आपका पश्च भाग भी हमेशा 0 के करीब होता है। मुझे नहीं लगता कि बेयस प्रमेय के साथ इसका क्या करना है।
जोरिस मेय्स

यह सब उस लड़के से था जिसे भगवान साबित करने की कोशिश में होली हुई थी। सुरुचिपूर्ण, वास्तव में।
ब्रैंडन बर्टेल्सन

1
इसे अधिक सामान्य परिप्रेक्ष्य में रखते हुए, बिंदु, जिसके साथ मैं सहमत हूं, यह है कि बेयस प्रमेय यहां काम पर है। विशेष रूप से धोखा देने के लिए और ईमानदार प्रयोग करने वालों के लिए वैकल्पिक संभावनाएं (अलग-अलग सामान्य प्रक्रियाओं के अनुरूप) हैं। धोखा देना स्थापित करना सहज ज्ञान के संबंध में पश्चाताप है और इसलिए अनैतिक रूप से धोखेबाज़ चीटर प्रक्रिया है।
संयुक्ताक्षरी

1
@ श्रीकांत @ शुभंकर: कॉम्बिनेटरियल ... आप सही कह रहे हैं। मैंने एक समान संभावना से शुरुआत की, जो इस मामले में बिल्कुल बकवास है। मेरा बुरा
जोरिस मे

12

मुझे श्रीकांत का स्पष्टीकरण पसंद है, और मुझे लगता है कि इस तरह की समस्या से निपटने के लिए बायेसियन विचार शायद सबसे अच्छा तरीका है। लेकिन यहाँ बेय्स के बिना इसे देखने का एक और तरीका है: (आर में)

dbinom(10, size = 20, prob = 0.5)/dbinom(10000, 20000, 0.5)

जो मेरे सिस्टम पर लगभग 31.2 है। दूसरे शब्दों में, यह २० में से १०,००० को देखने की तुलना में २० में से १० को देखने की तुलना में ३० गुना अधिक है, दोनों मामलों में उचित सिक्के के साथ भी। नमूना आकार बढ़ने पर यह अनुपात बिना किसी बाध्यता के बढ़ जाता है।

यह एक प्रकार का संभावना अनुपात दृष्टिकोण है, लेकिन फिर से, मेरे पेट में यह ऐसा महसूस होता है जैसे कि बायेसियन निर्णय कॉल कुछ और की तुलना में अधिक है।


अनुपात क्यों? केवल यह क्यों नहीं बताया गया कि उस सटीक ड्रा की संभावना बेहद कम है?
एंडी डब्ल्यू

5
इस बात की पुष्टि कि एक विशेष संभावना कम है संदर्भ से बाहर नहीं है। संभावना यह है कि मैं अपनी ऊंचाई के बराबर लंबा हूं (जो कुछ भी हो सकता है) शून्य है। और, हाँ, यह अनंत परिशुद्धता के साथ ऊंचाई को परिभाषित करने के लिए समस्याग्रस्त है, यादा, यादा, यादा ... मेरी बात यह है कि अस्तित्व का मैलास्ट्रोम हर समय होने वाली असीम संभावना की घटनाओं के साथ मंथन करता है! 20,000 में से 10,000 - संदर्भ से बाहर - मुझे बिल्कुल भी आश्चर्यचकित नहीं करता है। बावजूद इसके संख्यात्मक संभावना क्या हो सकती है।

9

एक विषयवादी बेयसियन तर्क व्यावहारिक रूप से एकमात्र तरीका है (एक सांख्यिकीय दृष्टिकोण से) आप अपने अंतर्ज्ञान को समझने के बारे में जा सकते हैं , जो है - ठीक से बोलना - एक मनोवैज्ञानिक जांच का विषय , न कि एक सांख्यिकीय। हालाँकि, यह अनुचित रूप से अनुचित है - और इसलिए अमान्य है - एक बायेसियन दृष्टिकोण का उपयोग करने के लिए यह तर्क देने के लिए कि एक अन्वेषक ने डेटा को नकली कर दिया। इस के तर्क पूरी तरह से परिपत्र है: यह कह रही है करने के लिए नीचे आता है "परिणाम के बारे में मेरी पूर्व विश्वासों के आधार पर, मैं अपने परिणाम अविश्वसनीय लगता है, और इसलिए आप चाहिए धोखा दिया है।" इस तरह का एक अतार्किक स्व-सेवारत तर्क स्पष्ट रूप से एक कठघरे में या एक सहकर्मी की समीक्षा प्रक्रिया में नहीं खड़ा होता।

इसके बजाय, हम मेंडल के प्रयोगों के रोनाल्ड फिशर की आलोचना से एक टिप ले सकते हैं और एक औपचारिक परिकल्पना परीक्षण कर सकते हैं। बेशक यह परिणाम के आधार पर पोस्ट हॉक परिकल्पना का परीक्षण करने के लिए अमान्य है । लेकिन प्रयोगों को मानना ​​होगा: कि वैज्ञानिक पद्धति का एक सिद्धांत है। इसलिए, एक परिणाम को देखकर हमें लगता है कि शायद यह गलत हो गया है, हम भविष्य (या अतिरिक्त) परिणामों का परीक्षण करने के लिए एक उपयुक्त परिकल्पना तैयार कर सकते हैं । इस मामले में महत्वपूर्ण क्षेत्र अपेक्षा के बेहद करीब परिणाम का एक सेट शामिल होगा। उदाहरण के लिए, में एक परीक्षणα= 5% का स्तर 9,996 और 10,004 के बीच किसी भी परिणाम को संदिग्ध के रूप में देखेगा, क्योंकि (ए) यह संग्रह अदालत में दोषी साबित होने तक बिना किसी फ़ेकिंग (निर्दोष ) की अशक्त परिकल्पना के तहत हमारे परिकल्पित "फेक" परिणामों और (बी) के करीब है !) , इस सीमा के परिणामस्वरूप केवल 5% (वास्तव में 5.07426%) होने की संभावना है। इसके अलावा, हम इस प्रतीत होता है तदर्थ दृष्टिकोण एक ची-वर्ग संदर्भ (एक ला फिशर) में मनाया अनुपात और अपेक्षित अनुपात के बीच विचलन को बढ़ाकर कर सकते हैं, फिर एक-पूंछ वाले परीक्षण में नेमन-पियरसन लेम्मा को लागू कर सकते हैं । कम पूंछ और द्विपद वितरण के लिए सामान्य सन्निकटन लागू करना ।

यद्यपि इस तरह की परीक्षा फ़ेकरी साबित नहीं हो सकती है, यह उस रिपोर्ट से भविष्य की रिपोर्टों पर लागू की जा सकती है , जो कि आपके अंतर्ज्ञान के आधार पर अकेले अपने अंतर्ज्ञान के आधार पर , बिना किसी दावे और विश्वसनीयता के आकलन के लिए उनके दावों की विश्वसनीयता का आकलन कर सकती है। यह बहुत अधिक निष्पक्ष और कठोर है जो किसी ऐसे व्यक्ति को फंसाने के लिए बायेसियन तर्क को लागू करता है जो पूरी तरह से निर्दोष हो सकता है और सिर्फ इतना अशुभ हुआ कि उन्हें एक सुंदर प्रयोगात्मक परिणाम मिला!


5

मुझे लगता है कि आपका अंतर्ज्ञान त्रुटिपूर्ण है। ऐसा लगता है कि आप एक एकल, "बहुत विशेष" परिणाम (बिल्कुल 10000 सिर) की तुलना कई परिणामों के एक सेट के साथ कर रहे हैं (सभी "गैर-विशेष" संख्याओं की संख्या लगभग 10000)। हालांकि, "विशेष" की परिभाषा हमारे मनोविज्ञान पर आधारित एक मनमाना विकल्प है। बाइनरी 10000000000000 (दशमलव 8192) या हेक्स एबीसी (दशमलव 2748) के बारे में कैसे - क्या यह संदिग्ध रूप से भी विशेष होगा? जैसा कि जोरिस मेयस ने टिप्पणी की, बेयस तर्क अनिवार्य रूप से किसी भी एक प्रमुख के लिए समान होगा, जिसका अर्थ है कि प्रत्येक परिणाम संदिग्ध होगा।

तर्क को थोड़ा विस्तारित करने के लिए: आप एक परिकल्पना ("प्रयोगकर्ता फ़ेकिंग है") का परीक्षण करना चाहते हैं, और फिर आप एक परीक्षण सांख्यिकीय (प्रमुखों की संख्या) चुनते हैं। अब, क्या यह परीक्षण सांख्यिकीय आपकी परिकल्पना के बारे में कुछ बताने के लिए उपयुक्त है? मेरे लिए, ऐसा लगता है कि चयनित परीक्षण आँकड़ा सूचनात्मक नहीं है (परिकल्पना में एक निश्चित मूल्य के रूप में निर्दिष्ट पैरामीटर का एक फ़ंक्शन नहीं है)। यह उस प्रश्न पर वापस जाता है जिसका अर्थ है "धोखा"। यदि इसका मतलब है कि प्रयोगकर्ता इच्छा पर सिक्के को नियंत्रित करता है, तो यह परीक्षण सांख्यिकीय में परिलक्षित नहीं होता है। मुझे लगता है कि आपको मात्रात्मक संकेतक खोजने के लिए अधिक सटीक होने की आवश्यकता है, और इस प्रकार प्रश्न को एक सांख्यिकीय परीक्षा के लिए उत्तरदायी बनाया जाएगा।


+1, लेकिन मैं आश्वस्त नहीं हूं। 10,000 के बारे में जो खास बात है वह यह है कि सिक्का निष्पक्ष होने की परिकल्पना के तहत प्रमुखों की अपेक्षित संख्या के बराबर है। यह तथ्य किसी भी मनोविज्ञान या संख्या प्रतिनिधित्व की प्रणाली से स्वतंत्र है। इस प्रतिक्रिया में विश्लेषण एक स्थिति में कुछ अंतर्दृष्टि प्रदान कर सकता है, जहां कहते हैं, 20,005 सिक्के फ़्लिप किए गए थे और 10,000 सिर (और इसलिए 10,005 पूंछ) नोट किए गए थे और किसी के "अंतर्ज्ञान" का सुझाव दिया गया था कि फकीरी ​​हुई थी।
whuber

मैं इस बात से पूरी तरह सहमत हूं कि - जैसा कि आप अपने उत्तर में बताते हैं - यह सब परिकल्पना की प्राथमिकता-पूर्व परिभाषा पर निर्भर करता है: यदि आप पहले से परिभाषित करते हैं कि "फ़ेकिंग द एक्सपेरिमेंट" से आपका मतलब है कि "सिर की संख्या के लिए एक परिणाम प्राप्त करना" अपेक्षित मूल्य के करीब ", तो यह एक सांख्यिकीय परीक्षण के लिए एक आधार है" टेस्ट हेड के रूप में "सिर की संख्या"। हालांकि, इस तरह की प्राथमिकता वाले स्पष्टीकरण के बिना, "फ़ेकिंग" और "प्रमुखों की संख्या के लिए विशेष मूल्य" का अर्थ बादल रहता है, और यह स्पष्ट नहीं है कि उन्हें एक-दूसरे के साथ क्या करना है।
काराकाल

4

आप जो निष्कर्ष निकालते हैं, वह धोखा देने की संभावना के लिए आपके द्वारा चुने गए पूर्व और निर्भरता पर निर्भर करेगा, जिसे देखते हुए फ्लिपर झूठ बोल रहा है, एक्स हेड्स की सूचना दी जाती है।

पी पर सबसे अधिक द्रव्यमान डालना (10000 सिर की सूचना दी गई है) मेरे विचार में थोड़ा काउंटर सहज है। जब तक रिपोर्टर अनुभवहीन न हो, मैं किसी को भी इस तरह की गलत सूचना देने की कल्पना नहीं कर सकता (मूल पोस्ट में आपके द्वारा बताए गए कारणों से काफी हद तक; यह ज्यादातर लोगों के लिए बहुत ही संदिग्ध है।) यदि सिक्का वास्तव में अनुचित है और फ्लिपर को रिपोर्ट करना था। गलत डेटा, तो मुझे लगता है कि रिपोर्ट किए गए परिणामों से पहले एक और अधिक उचित (और बहुत अनुमानित) एक असतत वर्दी से पहले हो सकता है P (X सिर की रिपोर्ट की गई। झूठ) = 1/201 के लिए पूर्णांक {9900, ..., 10100} पी (एक्स सिर की सूचना दी। झूठ बोल रहा है) = 0 अन्य सभी एक्स के लिए। मान लीजिए कि आपको लगता है कि झूठ बोलने की पूर्व संभावना 0.5 है। इसके बाद कुछ संभावित संभावनाएँ हैं:

पी (झूठ बोलना | 9900 सिर की सूचना दी) = पी (झूठ बोलना 10100 सिर की सूचना दी) = 0.70;

पी (झूठ बोलना | 9950 सिर की सूचना दी) = पी (झूठ बोलना | 10050 सिर की सूचना) = 0.54;

पी (झूठ बोलना 10000 सिर की सूचना) = 0.47।

एक उचित सिक्के से रिपोर्ट किए गए प्रमुखों की अधिकांश उचित संख्या संदेह का परिणाम देगी। बस यह दिखाने के लिए कि आपके पुरोहितों के लिए कितनी संवेदनशील संभावनाएं हैं, अगर धोखा देने की पूर्व संभावना 0.10 से कम है, तो बाद की संभावनाएं बन सकती हैं:

पी (झूठ बोलना | 9900 सिर की सूचना) = पी (झूठ बोलना 10100 सिर की सूचना) = 0.21;

पी (झूठ बोल रहा है। 9950 सिर की सूचना दी) = पी (झूठ बोल 100100 सिर की सूचना दी) = 0.11;

पी (झूठ बोलना | 10000 सिर की सूचना दी) = 0.09।

इसलिए मुझे लगता है कि मूल (और अत्यधिक मूल्यांकित उत्तर) को थोड़ा बढ़ाया जा सकता है; किसी भी तरह से आपको यह निष्कर्ष नहीं निकालना चाहिए कि पूर्व सूचना पर पूरी तरह से विचार किए बिना डेटा गलत है। इसके अलावा, बस इस बारे में सहजता से सोचने पर, ऐसा लगता है कि झूठ बोलने की पूर्ववर्ती संभावनाएं झूठ बोलने की पूर्व संभावना से अधिक प्रभावित होने की संभावना है, बजाए जाने वाले प्रमुखों के पूर्व वितरण द्वारा सूचित किया गया है कि फ्लिपर झूठ बोल रहा है (पुजारियों को छोड़कर) सिर की एक छोटी संख्या पर उनके द्रव्यमान ने बताया कि फ्लिपर झूठ बोल रहा है, जैसे कि मेरे उदाहरण में।)


मुझे लगता है कि यह एक बहुत अच्छा जवाब है, लेकिन मैं आपके दूसरे पैराग्राफ से असहमत हूं। मुझे नहीं लगता कि श्रीकांत की मूल सशर्त संभावना जवाबी है, और सिर्फ इसलिए कि यह एक कठिन सवाल है जिसका जवाब देना कठिन है। मुझे यह भी नहीं लगता कि 9900 से 10100 के भीतर झूठ बोलने की आपकी समान संभावना बिल्कुल भी समझ में आती है, हालांकि यह प्रदर्शन उद्देश्यों के लिए उपयोगी है।
एंडी डब्ल्यू

2

बेयसियन स्पष्टीकरण के लिए, आपको एक झूठे सिक्का फ्लिपर द्वारा रिपोर्ट किए गए परिणामों पर एक पूर्व संभाव्यता वितरण की आवश्यकता होती है, साथ ही झूठ बोलने की पूर्व संभावना भी। जब आप एक मूल्य देखते हैं जो यादृच्छिक फ़्लिप एक की तुलना में झूठे वितरण के तहत बहुत अधिक संभावना है, जो आपके झूठ बोलने की संभावना को बहुत अधिक बढ़ा देता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.