अगर 1000 में से 900 लोग कहते हैं कि एक कार नीली है, तो क्या संभावना है कि यह नीली है?


114

यह शुरू में प्राकृतिक पाठ को वर्गीकृत करने के लिए हम एक मॉडल के लिए कर रहे कुछ काम के संबंध में उत्पन्न हुआ था, लेकिन मैंने इसे सरल बना दिया है ... शायद बहुत अधिक।

आपके पास एक नीली कार है (कुछ उद्देश्य वैज्ञानिक उपाय - यह नीला है)।

आप इसे 1000 लोगों को दिखाएं।

900 का कहना है कि यह नीला है। 100 नहीं है।

आप यह जानकारी किसी ऐसे व्यक्ति को दें जो कार नहीं देख सकता है। वे सभी जानते हैं कि 900 लोगों ने कहा था कि यह नीला था, और 100 नहीं था। आप इन लोगों (1000) के बारे में अधिक नहीं जानते हैं।

इसके आधार पर, आप उस व्यक्ति से पूछते हैं, "क्या संभावना है कि कार नीली है?"

इसने मेरे द्वारा पूछे गए मतों के बीच एक बहुत बड़ा परिवर्तन उत्पन्न किया है! एक है, तो सही उत्तर क्या है?


162
मुझे आश्चर्य है कि अगर आपने कार को ड्रेस में बदल दिया तो क्या जवाब होगा ।
user1717828

13
तो लोगों को क्या सवाल है? "क्या कार नीली है?" या "कार किस रंग की है?"
कोन साइक

13
कार के नीले होने का क्या मतलब है? यदि कुछ लोग कहते हैं कि कार नीली नहीं है, तो यह संभावना है कि यह एक रंग है जिसे कुछ लोग नीले रंग में कहते हैं और अन्य लोग एक अलग नाम से पुकारते हैं। इसका मतलब यह नहीं है कि वे रंग पर असहमत हैं इसका मतलब है कि वे रंग के नाम पर असहमत हैं।
बेन

7
मुझे लगता है कि यदि आपने अलग-अलग अलग-अलग राय दी हैं, तो प्रश्न में बहुत सुधार होगा। जैसा कि यह अब खड़ा है, उत्तर केवल संभावना क्षेत्र से लेकर रंग सिद्धांत या यहां तक ​​कि जीव विज्ञान (कलर ब्लाइंडनेस) तक पूरे क्षेत्र का पता लगा सकते हैं, और मुझे नहीं लगता कि यह वास्तव में आपकी मदद कैसे करेगा।
एनओई

32
समस्या वर्णन में कुछ कमी है। 100 लोग इनकार करते हैं कि कार नीले रंग की है जब यह निश्चित रूप से नीला होता है तो बहुत से लोग होते हैं, आप बस उन्हें यादृच्छिक त्रुटियों के रूप में नहीं छोड़ सकते।
Aksakal

जवाबों:


117

टीएल; डीआर: जब तक आप मानते हैं कि लोग कार के रंग को देखते हुए अनुचित रूप से खराब हैं, या कि नीली कारें अनुचित रूप से दुर्लभ हैं, तो आपके उदाहरण में बड़ी संख्या में लोगों की संभावना का मतलब है कि कार का नीला होना मूल रूप से 100% है।

मैथ्यू Drury पहले से ही सही जवाब दिया था, लेकिन मैं सिर्फ कुछ संख्यात्मक उदाहरणों के साथ जोड़ना चाहूंगा, क्योंकि आपने अपने नंबर को ऐसे चुना है कि आप वास्तव में विभिन्न पैरामीटर सेटिंग्स की एक विस्तृत श्रृंखला के लिए बहुत समान उत्तर प्राप्त करते हैं। उदाहरण के लिए, मान लेते हैं, जैसा कि आपने अपनी एक टिप्पणी में कहा था, कि लोगों द्वारा कार के रंग को सही ढंग से पहचानने की संभावना 0.9 है। वह है: और भी पी ( यह नीला नहीं है कार नीला नहीं है ) = 0.9 = 1 - p ( कहते हैं कि यह नीला है ( कार नीला नहीं है )

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

परिभाषित करने के बाद, हमें जो शेष बात तय करनी है, वह है: कार के नीले होने की पूर्व संभावना क्या है? चलो देखते हैं कि क्या होता है, बहुत कम संभावना है, और कहते हैं कि , अर्थात सभी कारों का केवल 0.1% नीला है। फिर बाद की संभावना है कि कार नीली है, इसकी गणना इस प्रकार की जा सकती है:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

यदि आप भाजक को देखते हैं, तो यह स्पष्ट है कि उस राशि में दूसरा शब्द नगण्य होगा, क्योंकि योग में शर्तों के सापेक्ष आकार से के अनुपात से हावी है , जो के आदेश पर है । और वास्तव में, यदि आप इस गणना को कंप्यूटर पर करते हैं (संख्यात्मक अंडरफ़्लो मुद्दों से बचने के लिए देखभाल करते हैं) तो आपको एक उत्तर मिलता है जो 1 (मशीन परिशुद्धता के भीतर) के बराबर है। 0.1 900 10 580.99000.19001058

पूर्व की संभावनाएं वास्तव में यहां बहुत मायने नहीं रखती हैं क्योंकि आपके पास एक संभावना (कार नीली) बनाम एक और के लिए बहुत सारे सबूत हैं। यह संभावना अनुपात द्वारा परिमाणित किया जा सकता है , जिसे हम इस रूप में गणना कर सकते हैं:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

इसलिए पहले की संभावनाओं पर विचार करने से पहले, सबूत बताते हैं कि एक विकल्प पहले से ही खगोलीय रूप से दूसरे की तुलना में अधिक संभावना है, और किसी भी अंतर को बनाने के लिए पहले नीली कारों को अनुचित रूप से, मूर्खतापूर्ण दुर्लभ (इतना दुर्लभ) होना होगा कि हम उम्मीद करेंगे पृथ्वी पर 0 नीली कारों का पता लगाएं)।

तो क्या होगा अगर हम बदलते हैं कि कार के रंग के विवरण में लोग कितने सटीक हैं? बेशक, हम इसे चरम सीमा तक ले जा सकते हैं और कह सकते हैं कि उन्हें यह केवल 50% समय ही मिलेगा, जो कि सिक्का उछालने से बेहतर नहीं है। इस मामले में, बाद की संभावना यह है कि कार नीली है, बस पूर्व संभावना के बराबर है, क्योंकि लोगों के जवाब ने हमें कुछ नहीं बताया। लेकिन निश्चित रूप से लोग उससे कम से कम थोड़ा बेहतर करते हैं, और भले ही हम कहते हैं कि लोग केवल 51% समय के लिए सटीक हैं, संभावना अनुपात अभी भी ऐसे काम करता है कि यह कार के लिए लगभग गुना अधिक होने की संभावना है नीला होना।1013

यह आपके उदाहरण में चुनी गई बड़ी संख्याओं का परिणाम है। अगर कार के नीले होने की बात करें तो यह 9/10 लोग थे, यह एक बहुत अलग कहानी होती, भले ही लोगों का समान अनुपात एक शिविर बनाम दूसरे में हो। क्योंकि सांख्यिकीय साक्ष्य इस अनुपात पर निर्भर नहीं करते हैं, बल्कि विरोधी गुटों के बीच संख्यात्मक अंतर पर निर्भर करते हैं। वास्तव में, संभावना अनुपात (जो साक्ष्य की मात्रा निर्धारित करता है) में, 100 लोग जो कहते हैं कि कार नीली नहीं है, 100 में से 100 लोगों को रद्द कर देता है जो कहते हैं कि यह नीला है, इसलिए यह वैसा ही है जैसे कि आप 800 लोग सभी सहमत थे यह नीला था। और यह स्पष्ट रूप से बहुत स्पष्ट सबूत है।

(संपादित करें: जैसा कि सिल्वरफ़िश ने बताया है , मैंने यहाँ जो धारणाएँ बनाई हैं, वे वास्तव में निहित हैं कि जब भी कोई व्यक्ति गैर-नीले रंग की कार का गलत तरीके से वर्णन करता है, तो वे इसे नीला कहने के लिए डिफ़ॉल्ट होंगे। यह वास्तव में यथार्थवादी नहीं है, क्योंकि वे वास्तव में कोई भी रंग कह सकते हैं। , और नीले रंग को केवल कुछ समय के लिए कहेंगे। इससे निष्कर्षों पर कोई फर्क नहीं पड़ता है, हालांकि, चूंकि कम संभावना है कि लोग नीले रंग के लिए एक गैर-नीले रंग की कार की गलती करते हैं, इस बात का सबूत जितना मजबूत होता है कि यह नीले रंग का होता है जब वे कहते हैं इसलिए। यदि कुछ भी है, तो ऊपर दी गई संख्या वास्तव में केवल प्रो-ब्लू सबूत पर कम बाध्य है।)


11
+1। वास्तव में, ओपी के आंकड़ों को देखते हुए, MLE अनुमान लगाता है कि लोग कितनी बार सटीक होते हैं 900/1000 = 90%।
अमीबा

5
कार का रंग 50% सही होना एक सिक्का उछालने के समान नहीं है। सब के बाद, वहाँ सिर्फ दो उपलब्ध रंगों की तुलना में अधिक हैं। इसके अलावा, शायद कुछ "नीली" या "नीला" के बजाय "नीला" कहते हैं? वास्तव में, माया लोग गलत तरीके से "नीला" कहेंगे जब सही उत्तर होगा "कुछ फैंसी और फैशनेबल पेटेंट वाला रंग जो लगभग नीला जैसा दिखता है"
हेगन वॉन एटिजन

10
मुझे पता है कि ये केवल उदाहरण के आंकड़े हैं, लेकिन अगर "संभावना है कि लोग कार के रंग को सही ढंग से जज करते हैं तो 0.9 है", तब तक, जब तक कि नीले रंग के बारे में कुछ खास नहीं है, मुझे नहीं लगता कि पी का दावा करना उचित है (कहते हैं यह नीला है (कार नीला नहीं है) = 0.1। अगर हम सोचते हैं कि 90% समय में, लोग सही रंग की पहचान करते हैं, तो p (लाल कहो। कार लाल है) = (सफेद कहते हैं। कार सफेद है) = p (हरा कहो | कार हरी है) = 0.9 और इसलिए सभी संभव कार रंगों के लिए। लेकिन क्यों पी (कहना नीला है। कार लाल है) = पी (नीला कहो। सफेद है) = पी (कहते हैं। कार हरी है) = 0.1? यह उदाहरण के लिए p होगा (सफेद कहते हैं | कार लाल है) = 0।
सिल्वरफ़िश

2
@PatMolloy: जरूरी नहीं। यह इस बात पर निर्भर करता है कि क्या संभावनाएं सममित हैं: क्या यह समान रूप से संभावना है कि कोई व्यक्ति गैर-नीले रंग की कार के लिए नीले रंग की गलती करता है, क्योंकि यह है कि कोई नीले रंग की कार के लिए गैर-नीले रंग की गलती करता है? यदि ऐसा है, तो एक 500/500 का फैसला सिक्का उछाल के रूप में बिल्कुल जानकारी देता है। लेकिन अगर लोगों को एक गैर-नीले रंग की कार नीले रंग की कहने की संभावना कम है, तो वे कहते हैं कि एक नीली कार नीले रंग की नहीं है, तो 500 नीले-नीले लोगों को समझाने की तुलना में मुश्किल है कि नीली-नीली कार नहीं है, नीली परिकल्पना नहीं। तो उस स्थिति में सबूत का संतुलन नीले रंग की ओर झुकाव होगा।
रुबेन वैन बर्गन

3
रंग धारणा एक मुश्किल बात है .. अगर दस में से नौ लोग कहते हैं कि एक पोशाक सफेद और सोने की है, तो यह नीला और काला होने की संभावना क्या है?
Glen_b

73

सही उत्तर समस्या पर निर्दिष्ट जानकारी पर निर्भर करता है, आपको एकल, निश्चित उत्तर प्राप्त करने के लिए कुछ और अनुमान लगाने होंगे:

  • पूर्व संभावना कार नीली है, यानी आपका विश्वास है कि कार नीली है जिसे आपने अभी तक किसी से नहीं पूछा है।
  • संभावना है कि कोई आपको बताता है कि कार नीले रंग की है जब वह वास्तव में नीली है, और संभावना है कि वे आपको बताएं कि कार नीली है जब वह वास्तव में नीली नहीं है
  • संभावना यह है कि कार वास्तव में नीली है जब कोई कहता है कि यह है, और संभावना यह है कि कार नीली नहीं है, जब कोई कहता है कि यह नीली है।

जानकारी के इन टुकड़ों के साथ, हम बेयस के फार्मूले के साथ पूरी चीज को तोड़ सकते हैं ताकि कार के नीले होने की संभावना कम हो। मैं उस मामले पर ध्यान केंद्रित करूंगा जहां हम केवल एक व्यक्ति से पूछते हैं, लेकिन उसी तर्क को उस मामले पर लागू किया जा सकता है जहां आप लोगों से पूछते हैं।1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

हमें आगे को आगे जारी रखने की आवश्यकता है , यह वह जगह है जहाँ पूर्व आता है:P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

तो बेयस नियम के दो आवेदन आपको वहां मिलेंगे। आपको विशिष्ट स्थिति के बारे में या कुछ उचित मान्यताओं के बारे में जानकारी के आधार पर अनिर्दिष्ट मानकों को निर्धारित करने की आवश्यकता होगी।

इसके आधार पर आप क्या धारणा बना सकते हैं, इसके कुछ अन्य संयोजन हैं:

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

शुरुआत में, आप इनमें से किसी भी चीज को नहीं जानते हैं। तो आपको उनमें से तीन के बारे में कुछ उचित धारणाएं बनानी चाहिए, और फिर चौथे को वहां से निर्धारित किया जाएगा।


5
अक्सर ऐसा ही होता है। फिर आपके पास दो विकल्प हैं, नीले रंग को नहीं मानकर अपने ज्ञान की कुल कमी को व्यक्त करें और नीले रंग की समान संभावना नहीं है। क्षेत्र का त्वरित सर्वेक्षण करें, कुछ इस तरह से मदद कर सकता है: en.wikipedia.org/wiki/Car_colour_popularity
मैथ्यू ड्र्यू

18
@ "नीले और नीले रंग के समान समस्या की संभावना नहीं है" यह संगत नहीं है; यदि हम प्रत्येक संभावित कार रंगों में समान तर्क लागू करते हैं, तो हम इस दावे के साथ समाप्त होते हैं कि वे सभी एक साथ 50% संभावना (संभावना के नियमों द्वारा दो से अधिक रंगों के साथ असंभव) और 50% से कम मौका (जब आप करते हैं) नीले रंग में "सफेद नहीं" और "लाल नहीं" को देखें, जो विरोधाभास की ओर भी ले जाता है क्योंकि किसी भी रंग की संभावना कई मान नहीं ले सकती है)
Glen_b

2
इस से अधिक अनिर्दिष्ट जानकारी है क्योंकि लोगों के उत्तर को स्वतंत्र होने की आवश्यकता नहीं है (वास्तव में, हम आशा करते हैं कि वे उद्देश्य रंग के साथ दृढ़ता से सहसंबद्ध हैं, इसलिए स्वतंत्र से बहुत दूर हैं)। क्या होगा यदि उत्तर "अति" निर्भर हैं? कहो, हम बस दस यादृच्छिक पैदल यात्रियों से पूछते हैं, लेकिन उनमें से प्रत्येक ने 100 बार उत्तर दिया है?
हेगन वॉन एटिजन

2
@ हेगनवोनएटजेन और मैथ्यूड्रीन। वास्तव में, आपको जो मानने की आवश्यकता है वह स्वतंत्रता नहीं है, बल्कि सशर्त स्वतंत्रता है । दूसरे शब्दों में । P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
लुका सिटी

15
@ गलेन_ बी: दुनिया में केवल दो रंग हैं, नीला और नीला नहीं। निश्चित रूप से दोनों विभिन्न प्रकार के रंगों में आते हैं, विशेष रूप से नीला नहीं।
psmears

13

एक महत्वपूर्ण धारणा है कि आपके 1000 मत एक व्यवस्थित पूर्वाग्रह को साझा नहीं करते हैं। जो यहां एक उचित धारणा है, लेकिन अन्य मामलों में महत्वपूर्ण हो सकती है।

उदाहरण हो सकते हैं:

  • वे सभी एक समान कलरब्लिंडनेस (उदाहरण के लिए एक आबादी में आनुवंशिकी) साझा करते हैं,
  • वे सभी रात में नारंगी सोडियम स्ट्रीट लाइटिंग के तहत कार देखते थे,
  • वे सभी एक सामान्य संस्कृति साझा करते हैं जिसमें नीला वर्जित है या जादुई रूप से जुड़ा हुआ है (जो पूर्वाग्रह करता है कि क्या वे किसी वस्तु को नीले रंग के रूप में वर्णित करते हैं या सांस्कृतिक व्यंजना का उपयोग करते हैं या इसके बजाय जो कुछ भी हो)।
  • उन्हें सभी को बताया गया है (या एक सामान्य विश्वास साझा करें) कि अगर वे कुछ विशिष्ट तरीके से उत्तर नहीं देते हैं, तो कुछ अच्छा / बुरा उनके लिए होगा .....

यह इस मामले में होने की संभावना नहीं है, लेकिन अन्य मामलों में इसकी एक महत्वपूर्ण निहित धारणा है। इसका मतलब यह नहीं है कि यह चरम है - अपने प्रश्न को किसी अन्य डोमेन में स्थानांतरित करें और यह एक वास्तविक कारक होगा।

प्रत्येक के लिए उदाहरण जहां आपका जवाब एक साझा पूर्वाग्रह से प्रभावित हो सकता है:

  • पूछें कि क्या एक लंबा पतला कांच वास्तव में समान छोटे वसा वाले गिलास से अधिक है, लेकिन आपके 1000 उत्तरदाता बहुत छोटे बच्चे (साझा गलत धारणा) हैं।
  • 1000 लोगों से पूछें कि सीढ़ी के नीचे चलना खतरनाक है (सामान्य सांस्कृतिक विश्वास)
  • 1000 विवाहित लोगों से पूछें कि क्या वे अपने साथी से प्यार करते हैं / उनका अफेयर रहा है, ऐसे हालात में जब उन्हें विश्वास होता है कि उनके साथी को उनके जवाब का पता होगा। संदर्भ टीवी शो या पार्टनर से पूछा जा सकता है, आदि (परिणाम के बारे में आम धारणा)

यह कुछ संरचनात्मक समान प्रश्नों की कल्पना करना मुश्किल नहीं होगा जहां 900: 100 प्रतिक्रिया विश्वासों और ईमानदारी, या कुछ और का एक उपाय था, और सही उत्तर की ओर इशारा नहीं करता है। इस मामले में संभावना नहीं है लेकिन अन्य मामलों में - हां।


11

विभिन्न लोगों से अलग-अलग उत्तर प्राप्त करने का एक कारण यह है कि इस प्रश्न की व्याख्या अलग-अलग तरीकों से की जा सकती है, और यह स्पष्ट नहीं है कि आपके यहाँ "संभावना" से क्या मतलब है। प्रश्न का बोध कराने का एक तरीका यह है कि मैथ्स के उत्तर में बेयर्स नियम का उपयोग करके पुजारी और कारण बताए जाएं।

संभावितों के लिए पूछने से पहले, आपको यह तय करना होगा कि यादृच्छिक के रूप में क्या है और क्या नहीं है। यह सार्वभौमिक रूप से स्वीकार नहीं किया जाता है कि अज्ञात लेकिन निश्चित मात्रा में पुजारियों को सौंपा जाना चाहिए। यहाँ आपके लिए एक समान प्रयोग है जो प्रश्न के साथ समस्या पर प्रकाश डालता है:

Xii=1,,1000p=0.5Xii=11000Xi=900

pp


1
इसलिए, यदि आप यह अनुमान हटा देते हैं कि कार नीले रंग की है, और बाकी समान है, तो 900 लोग कहते हैं कि नीली है और 100 का कहना है कि नहीं, उस स्थिति में संभावना 0.9 होगी?
उपयोगकर्ता

नहीं, यह 1. के बहुत करीब है। यह बहुत ही कम संभावना है कि 1000 में से 900 लोगों का रंग गलत होगा।
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.यह "संभावना" की समझ के अनुरूप नहीं है क्योंकि मैं इससे परिचित हूं। यह थोड़ा सा लगता है जैसे "एक्स हो सकता है या नहीं हो सकता है, इसलिए संभावना 50% होनी चाहिए"। क्या आप इसे उस वाक्य से थोड़ा और स्पष्ट कर सकते हैं कि आपका क्या मतलब है?
AoE

2
@ पैरामीटर और यादृच्छिक चर के बीच का अंतर समान है। यह इस सवाल की सेटिंग में दिया गया है कि कार एक तथ्यपूर्ण नीले रंग के लिए है, यह रंग यादृच्छिक प्रयोग का परिणाम नहीं है। यह अनिवार्य रूप से एक निरंतरवादी वी। बायेसियन व्याख्या है। यदि आप एक सिक्का 1000 बार फ्लिप करते हैं और 900 सिर का निरीक्षण करते हैं, तो क्या संभावना है कि सिक्का उचित है? यदि आप लगातार (या निरर्थक) हैं तो यह एक या शून्य है; हम मापदंडों को संभाव्यता नहीं देते हैं।
इक्वल

@user नहीं, मैंने अपनी बात स्पष्ट करने के लिए उत्तर को अपडेट कर दिया है।
इक्वल

7

सरल व्यावहारिक उत्तर:

संभावना आपकी मान्यताओं के आधार पर आसानी से 0% से 100% तक हो सकती है

हालांकि मुझे वास्तव में मौजूदा उत्तर पसंद हैं, व्यवहार में यह मूल रूप से इन दो सरल परिदृश्यों को उबालता है:

परिदृश्य 1: लोगों को माना जाता है कि नीला होने पर नीले रंग को पहचानना बहुत अच्छा होता है ... 0%

इस मामले में, बहुत सारे लोग बताते हैं कि कार नीली नहीं है, यह बहुत कम संभावना नहीं है कि कार वास्तव में नीली है। इसलिए, संभावना 0% तक पहुंच जाती है।

परिदृश्य 2: लोगों को माना जाता है कि वे नीले नहीं होने पर नीले रंग को पहचानने में बहुत अच्छे हैं ... 100%

इस मामले में, बहुत सारे लोग बताते हैं कि कार नीली है, यह बहुत संभावना है कि यह वास्तव में नीला है। इसलिए संभावना 100% तक पहुंच जाती है।


निश्चित रूप से एक गणितीय कोण से इस पर आने से आप कुछ सामान्य से शुरू करेंगे जैसे कि 'हमें यह मान लेना चाहिए कि प्रासंगिक संभावनाएं हैं ...', जो कि काफी अर्थहीन है क्योंकि ऐसी चीजें आमतौर पर किसी भी यादृच्छिक परिस्थिति के लिए नहीं जानी जाती हैं। इसलिए मैं इस विचार को समझने के लिए चरम सीमा पर पहुंचने की वकालत करता हूं कि दोनों प्रतिशतों को सरल और यथार्थवादी मान्यताओं के साथ आसानी से उचित ठहराया जा सकता है, और इसलिए इसका कोई एक सार्थक जवाब नहीं है।


2
यदि "लोगों को नीले रंग को पहचानने में बहुत अच्छा माना जाता है", तो जब यह परिदृश्य 1 में नहीं होगा तो वे इसे नीला क्यों मानेंगे? आप झूठी स्थिति और झूठी नकारात्मक के संदर्भ में अपने परिदृश्यों को व्यक्त करना चाहते हैं।
हाईड

@id ने अस्पष्टता को दूर करने के लिए परिदृश्यों को फिर से परिभाषित किया
डेनिस जहरुद्दीन


5

आपको अनुमान के कुछ ढांचे को विकसित करने की आवश्यकता है। कुछ सवाल जो आप पूछ सकते हैं

  1. कितने रंग हैं वहाँ? क्या हम दो रंगों की बात कर रहे हैं? या इंद्रधनुष के सभी रंग?

  2. रंग कितने अलग हैं? क्या हम नीले और नारंगी बात कर रहे हैं? या नीला, सियान और फ़िरोज़ा?

  3. नीला होने का क्या मतलब है? क्या सियान और / या फ़िरोज़ा नीले हैं? या सिर्फ नीला ही?

  4. रंग का अनुमान लगाने में ये कितने अच्छे हैं? क्या वे सभी ग्राफिक डिजाइनर हैं? या वे रंग अंधा कर रहे हैं?

विशुद्ध रूप से सांख्यिकीय दृष्टिकोण से, हम पिछले एक के रूप में कुछ अनुमान लगा सकते हैं। पहले, हम जानते हैं कि कम से कम 10% लोग गलत प्रतिक्रिया का चयन कर रहे हैं। यदि केवल दो रंग हैं (पहले प्रश्न से), तो हम कह सकते हैं कि वहाँ है

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

एक त्वरित जांच के रूप में, यदि हम एक साथ जोड़ते हैं, तो हमें 100% मिलता है। आप @MatthewDrury उत्तर पर इसका अधिक गणितीय अंकन देख सकते हैं ।

हम तीसरे में 90% कैसे प्राप्त करते हैं? यह है कि कितने लोगों ने नीले रंग में कहा, लेकिन गलत था अगर यह नहीं है क्योंकि केवल दो रंग हैं, ये सममित हैं। यदि दो से अधिक रंग थे, तो गलत विकल्प का रंग नीला होने की संभावना है जब उन्होंने कहा कि कुछ और कम होगा।

वैसे भी, अनुमान का यह तरीका हमें 90% नीला देता है। इसमें ब्लू कहने वाले लोगों का 81% मौका शामिल है और यह कहते हुए 9% लोगों का मौका है कि ऐसा नहीं है। यह संभवतः निकटतम है जो हम मूल प्रश्न का उत्तर देने के लिए आ सकते हैं, और इसके लिए हमें दो अलग-अलग चीजों का अनुमान लगाने के लिए डेटा पर भरोसा करना होगा। और यह मानने के लिए कि नीले रंग के चुने जाने की संभावना वही है, जो नीले रंग के सही होने की संभावना है।

यदि दो से अधिक रंग हैं, तो तर्क थोड़ा बदलने वाला है। पहली दो पंक्तियाँ समान रहती हैं, लेकिन अंतिम दो पंक्तियों में हम समरूपता खो देते हैं। उस मामले में, हमें अधिक इनपुट की आवश्यकता है। हम अनुमान लगा सकते हैं कि नीले रंग को सही ढंग से कहने का मौका 81% है, लेकिन हमें इस बात का कोई अंदाज़ा नहीं है कि रंग क्या नीला है जब कोई कहता है कि यह नहीं है।

हम दो रंग अनुमान पर भी सुधार कर सकते हैं। प्रत्येक रंग की कारों की सांख्यिकीय रूप से महत्वपूर्ण संख्या को देखते हुए, हम सांख्यिकीय रूप से महत्वपूर्ण संख्या में लोगों को देख सकते हैं और उन्हें वर्गीकृत कर सकते हैं। तब हम गिन सकते थे कि प्रत्येक रंग पसंद करने पर लोग कितनी बार सही होते हैं और प्रत्येक रंग पसंद के लिए वे कितनी बार सही होते हैं। तब हम लोगों की वास्तविक पसंद को देखते हुए अधिक सटीक अनुमान लगा सकते थे।

आप पूछ सकते हैं कि 90% गलत कैसे हो सकते हैं। विचार करें कि क्या होता है अगर तीन रंग हैं: नीला, नीला और नीलम। कोई भी इन तीनों को नीला मान सकता है। लेकिन हम और अधिक चाहते हैं। हम सटीक छाया चाहते हैं। लेकिन दूसरे शेड्स के नामों को कौन याद रखता है? बहुत से लोग नीले रंग का अनुमान लगा सकते हैं क्योंकि यह एकमात्र मिलान छाया है जो वे जानते हैं। और फिर भी गलत हो सकता है जब यह अज़ूर हो जाए।


जैसा कि पहले की टिप्पणियों में से एक में उल्लेख किया गया है, निश्चित रूप से केवल दो प्रासंगिक रंग 'नीला' और 'नीला नहीं' हैं इसलिए कई रंगों के बारे में भाग की आवश्यकता नहीं होनी चाहिए।
डेनिस जहरुद्दीन

4

आपके द्वारा प्रदान की जाने वाली जानकारी के साथ एक सटीक, गणितीय, सही / गलत संभावना की गणना नहीं की जा सकती है

हालांकि, वास्तविक जीवन में ऐसी जानकारी निश्चितता के साथ कभी उपलब्ध नहीं होती है। इसलिए, हमारे अंतर्ज्ञान का उपयोग करके (और जहां मेरे सभी पैसे चले जाएंगे अगर हम सट्टेबाजी कर रहे थे), कार निश्चित रूप से नीला है। (कुछ का मानना ​​है कि यह अब आँकड़े नहीं हैं, लेकिन ठीक है, विज्ञान के काले / सफेद विचार बहुत उपयोगी नहीं हैं)

तर्क सरल है। मान लें कि कार नीली नहीं है। तब 90% लोग (!) गलत थे। वे केवल मुद्दों की सूची के कारण गलत हो सकते हैं जिनमें शामिल हैं:

चूंकि उपरोक्त स्पष्ट रूप से औसत यादृच्छिक जनसंख्या के 90% को प्रभावित करने की संभावना नहीं है (जैसे रंग अंधापन लगभग 8% पुरुषों और 0.6% महिलाओं को प्रभावित करता है, जो कि 1000 में से 43 लोग हैं), यह जरूरी है कि कार है नीला। (यह है कि मेरे सारे पैसे वैसे भी चले जाते थे)।


यह मेरे लिए सहज रूप से सही लगता है। मुझे लगता है कि मूल प्रश्न की आलोचना पर्याप्त जानकारी नहीं देती है और कुछ निश्चित धारणाएँ बनानी पड़ती हैं .. ठीक है, क्या यह लगभग हमेशा वास्तविक दुनिया में नहीं होता है ???
पैट मोलॉय

@PatMolloy यह एक सटीक सही / गलत परिष्कृत गणितीय उत्तर प्रदान करने के लिए पर्याप्त जानकारी नहीं देता है (जो निश्चित रूप से इस साइट से प्राप्त करने के लिए कई प्रश्नों का लक्ष्य है)। हालांकि, आपके द्वारा दी गई कम जानकारी, जब यह सट्टेबाजी के पैसे की बात आती है, तो यह उत्तर है (100%) लोगों को चुना जाएगा।
ल्यूकोनाचो

1
मुझे लगता है कि आप सबसे प्रशंसनीय विकल्पों में से कुछ को कवर करने में विफल रहे हैं - जो कि आपके निष्कर्ष को संशोधित करने के लिए आपके कारण होना चाहिए। इनमें शामिल हैं (ए) लोग नीले रंग को पहचानने में असमर्थ हैं; (बी) प्रश्नकर्ता और उत्तरदाताओं के बीच "ब्लू" की कोई आम समझ नहीं है; (c) "ब्लू" का "वैज्ञानिक" अर्थ उन लोगों से भिन्न होता है जिन्हें लोग आमतौर पर "ब्लू" के रूप में समझते हैं। महत्वपूर्ण रूप से, क्योंकि आप इन विकल्पों में से किसी को भी निर्धारित नहीं कर सकते हैं , और न ही उन लोगों में से अधिकांश, जिन्हें आप सूचीबद्ध करते हैं, आप उत्तर की संभावना को निर्धारित करने की संभावना को कैसे उचित ठहरा सकते हैं? यह आँकड़े नहीं है!
whuber

"चूंकि उपरोक्त स्पष्ट रूप से औसत यादृच्छिक जनसंख्या के 90% को प्रभावित करने की संभावना नहीं है" इस बारे में इतना सुनिश्चित न करें। याद रखें कि हम आम तौर पर मनुष्यों पर चर्चा करते समय औसत के संदर्भ में बात करते हैं। तो यकीन है, केवल कुछ प्रतिशत में रंग अंधापन होता है (औसत की तुलना में), लेकिन कुछ अलग हो सकते हैं जिनकी बेहतर दृष्टि हो, जैसे टेट्राक्रोमैट।
NPSF3000

2
मैं हमेशा एलसीडी के प्रभाव में हूँ
एलेक्स

2

मैं इस तथ्य के आधार पर मल नहीं खाऊंगा कि अरबों मक्खियाँ गलत नहीं हो सकतीं। कार के नीले होने की वजह से 1000 में से 900 लोगों के धोखा देने के दर्जनों अन्य कारण हो सकते हैं। आखिरकार, यह जादुई चाल का आधार है, लोगों को वास्तविकता से हटाकर कुछ सोचने के लिए प्रेरित करता है। यदि 1000 में से 900 लोग एक जादूगर को उसके सहायक को छुरा मारते हुए देखते हैं, तो वे तुरंत जवाब देंगे कि सहायक को छुरा घोंपा गया था, क्योंकि मंच पर एक हत्या कितनी अनुचित थी। एक चिंतनशील कार पेंट पर एक नीली बत्ती, कोई भी?


2

सवाल का सही जवाब देने के लिए मतदान कैसे किया गया था, इस बारे में प्रश्नकर्ता बहुत कम जानता है। जहां तक ​​उनका संबंध है, चुनाव कई समस्याओं से ग्रस्त हो सकता है:

मतदान करने वाले लोग पक्षपाती हो सकते थे:

  1. ऑप्टिकल भ्रम के कारण कार नीली दिख रही थी

  2. कार का रंग किसी कारण के लिए मुश्किल था, और लोगों को किसी कारण से इस से पहले बहुत सारी नीली कार दिखाई गई थी, जिससे उनमें से अधिकांश का मानना ​​था कि यह कार शायद नीली थी।

  3. आपने उन्हें यह कहने के लिए भुगतान किया था कि कार नीली है।

  4. आप किसी को यह विश्वास दिलाने में सम्मोहित थे कि कार नीले रंग की है।

  5. उन्होंने झूठ बोलने और मतदान में तोड़फोड़ करने के लिए एक समझौता किया था।

मतदान के दौरान लोगों के बीच इस बात को लेकर विवाद हो सकता है कि वे कैसे चुने गए या क्योंकि वे एक-दूसरे को प्रभावित करते हैं:

  1. आपने गलती से एक ही तरह के रंग अंधापन वाले लोगों के लिए एक सामूहिक बैठक में मतदान किया।

  2. आपने किंडरगार्टन में मतदान किया; लड़कियों को कार में कोई दिलचस्पी नहीं थी और ज्यादातर लड़कों का रंग उनके पसंदीदा रंग के रूप में नीला था, जिससे उन्हें कल्पना हुई कि कार नीले रंग की थी।

  3. पहला व्यक्ति जिसे कार दिखाई गई थी, वह नशे में था और उसने नीले रंग की दिख रही थी, चिल्लाया "IT IS BLUE", और सभी को यह सोचकर प्रभावित किया कि कार नीली थी।

इसलिए, जब कार पूरी तरह से सही ढंग से मतदान कर रही है, तो संभावना बहुत अधिक है (जैसा कि रूबेन वैन बर्गन के उत्तर में बताया गया है), पोल की विश्वसनीयता से समझौता किया गया हो सकता है जो इस बात का मौका देता है कि कार नीली नहीं है तुच्छ। यह प्रश्नकर्ता कितना बड़ा अनुमान लगाता है यह अंततः उसके अनुमानों पर निर्भर करता है कि यह कितनी संभावना है कि परिस्थितियों ने चुनाव के साथ खराब कर दिया है और आप चुनावों को पूरा करने में कितने अच्छे हैं (और वह आपको कितना शरारती समझते हैं)।


2

"ब्लू" की परिभाषा क्या है?

विभिन्न संस्कृतियों और भाषाओं में नीले रंग की अलग-अलग धारणाएँ हैं। IIRC, कुछ संस्कृतियों में हरे रंग की धारणा शामिल है!

किसी भी प्राकृतिक भाषा के शब्द की तरह, आप केवल यह मान सकते हैं कि चीजों को "नीला" कहने के लिए (और कब नहीं) पर कुछ सांस्कृतिक सम्मेलन है।

कुल मिलाकर, भाषा में रंग आश्चर्यजनक रूप से व्यक्तिपरक है (नीचे दी गई टिप्पणियों से लिंक, धन्यवाद @Count Ibilis)

यहां छवि विवरण दर्ज करें


7
प्रश्न के संदर्भ में, मेरा मानना ​​है कि यह विशेष पहलू बहुत ही अप्रासंगिक है - मेरा मानना ​​है कि ओपी ने "ब्लू" शब्द को एक बहुत ही सामान्य शब्द के रूप में चुना और न कि "एज़्योर", "टोरकॉइज़" आदि जैसे कुछ, जहां लोग अनिश्चित हो सकते हैं। इसके अलावा, कारें आमतौर पर संभव / सामान्य रंगों के बहुत सीमित पैलेट का उपयोग करती हैं। अंत में, सवाल यह नहीं है कि "100 लोगों ने गैर-नीला क्यों कहा", लेकिन "क्या संभावना है कि कार वास्तव में नीले रंग की है"।
AnoE


एक सटीक परिभाषा "मुख्य रूप से वर्तमान पर्यावरणीय वातावरण में 475nm प्लसमिनस ~ 10-20nm के तरंग दैर्ध्य वाले प्रकाश को विकिरण करती है" होगी। यह आमतौर पर नीले रंग के रूप में स्वीकार किया जाता है।
रैकडैंबिनमैन 20

हां, लेकिन प्रमुख तरंगदैर्घ्य को मापने के लिए कितने लोग एक उपकरण के साथ जाते हैं? आप गैर-दृश्यमान तरंगदैर्ध्य को बाहर करना भी भूल गए।
Anony-Mousse

1
ऐसा लगता है कि अज्ञात अंशांकन के लोगों के एक समूह का उपयोग सांख्यिकीय रूप से तरंग दैर्ध्य मीटर के रूप में किया जा रहा है :)
रैकैंडबॉमनमैन

1

संभावना अधिक परिष्कृत पूर्व शर्त के आधार पर हो सकती है, कई अलग-अलग मूल्य हो सकते हैं, लेकिन 99.995% वह है जो मेरे लिए सबसे अधिक समझ में आता है।

हम जानते हैं कि परिभाषा के अनुसार, कार नीली है (जो कि 100% है), लेकिन यह अच्छी तरह से निर्दिष्ट नहीं है कि इसका वास्तव में क्या मतलब है (जो कुछ दार्शनिक शर्त लगाएगा)। मैं मान सकता हूं कि कोई चीज वास्तव में नीले-से-दिखने वाले नीले रंग की है।

हम यह भी जानते हैं कि 90% परीक्षण विषयों ने इसे नीला बताया है।

हमें नहीं पता कि क्या पूछा गया था या मूल्यांकन कैसे किया गया था, और कार की रोशनी की स्थिति क्या थी। रंग के नाम के बारे में पूछे जाने पर, कुछ विषयों ने उदाहरण के लिए कहा हो सकता है कि प्रकाश की स्थिति के कारण "हरा-नीला" और मूल्यांकनकर्ता हो सकता है। नहीं गिना है कि "नीले" के रूप में। यदि प्रश्न "क्या यह नीला है?" मैं मान लूंगा कि आपने अपनी परीक्षा के विषयों को दुर्भावनापूर्ण तरीके से धोखा देने का इरादा नहीं किया था।

हम जानते हैं कि ट्रिटैनोपी की घटना लगभग 0,005% है, जिसका अर्थ है कि अगर कार को वास्तव में नीले रंग में देखा जा सकता है , तो 99.995% परीक्षण विषयों ने वास्तव में नीले रंग के रूप में देखा। हालांकि, इसका मतलब है कि 9.995% परीक्षण विषयों ने नीले रंग की रिपोर्ट नहीं की जब उन्होंने स्पष्ट रूप से नीले रंग को देखा। उन्होंने जो देखा, उसके बारे में झूठ बोल रहे थे। यह वही है जो आपका जीवन अनुभव आपको बताता है: लोग हमेशा ईमानदार नहीं होते हैं (लेकिन, जब तक कि कोई मकसद न हो, वे आमतौर पर होते हैं)।

इस प्रकार, गैर-अवलोकन करने वाला व्यक्ति भारी प्रमाण के साथ यह मान सकता है कि कार नीली है। यह 100% होगा

सिवाय ... इसके अलावा कि अगर गैर-अवलोकन करने वाला व्यक्ति स्वयं ट्रिटैनोपी से पीड़ित है, तो उस स्थिति में वह कार को नीले रंग के रूप में नहीं देखेगा, भले ही बाकी सभी (या बल्कि, उनमें से 90%) ऐसा कहते हैं। यहाँ यह फिर से दार्शनिक हो जाता है: यदि हर किसी ने एक पेड़ गिरने की बात सुनी, लेकिन मैंने ऐसा नहीं किया, क्या यह गिर गया?

मैं हिम्मत करता हूं कि सबसे उचित, व्यावहारिक उत्तर होगा: यदि गैर-अवलोकन करने वाला व्यक्ति त्रिकोप (0.005% मौका) होता है, तो यह पुष्टि करते हुए कि क्या अनुमानित रंग और वास्तविक रंग जैसा दिखता है, वही गलत होगा। इस प्रकार, संभावना 100% के बजाय 99.995% है।

इसके अलावा, बोनस के रूप में, जब से हमें पता चला कि 9.995% परीक्षण विषय झूठे हैं, और यह ज्ञात है कि सभी क्रेटन झूठे हैं , हम यह निष्कर्ष निकाल सकते हैं कि हम क्रेते में नहीं हैं!


1

आपके पास एक नीली कार है (कुछ उद्देश्य वैज्ञानिक उपाय - यह नीला है)।

...

"क्या संभावना है कि कार नीली है?"

यह 100% नीला है।

वे सभी जानते हैं कि 900 लोगों ने कहा था कि यह नीला था, और 100 नहीं था। आप इन लोगों (1000) के बारे में अधिक नहीं जानते हैं।

इन संख्याओं (बिना किसी संदर्भ के) का उपयोग करना पूरी तरह से बकवास है। यह सभी प्रश्न की व्यक्तिगत व्याख्या को उबालता है। हमें इस रास्ते से नीचे नहीं जाना चाहिए और विट्गेन्स्टाइन का उपयोग करना चाहिए: "वोवन मैन निच्च् स्प्रेचेन कन्न, डार्बर मूस मैन स्च्वाइजेन।"


तुलना के लिए निम्नलिखित प्रश्न की कल्पना करें:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

यह मूल रूप से एक ही (सूचना कम) समस्या है, लेकिन यह बहुत अधिक स्पष्ट है कि हम कार के रंग के बारे में जो सोचते हैं वह ज्यादातर (यदि पूरी तरह से नहीं) परिस्थितिजन्य है।


लंबे समय में, जब हमें कई संबद्ध प्रश्न मिलते हैं, तो हम ऐसे अधूरे प्रश्नों के उत्तर का अनुमान लगाने में सक्षम होते हैं। यह टिट-फॉर-टॉट एल्गोरिथ्म के लिए समान है जो एक मामले के लिए काम नहीं करता है, लेकिन यह लंबे समय में काम करता है । इसी अर्थ में विट्गेन्स्टाइन अपने प्रधान अन्वेषणों के साथ अपने पहले के काम से वापस आए । हम इन सवालों का जवाब देने में सक्षम हैं, लेकिन हमें अधिक जानकारी / परीक्षण / प्रश्नों की आवश्यकता है। यह एक प्रक्रिया है।


0

अगर हम यह मान लें कि कार नीली है, तो 1,000 में से 100 का कहना है कि यह नीला नहीं है। शायद आप केवल रंग-अंधा लोगों का नमूना ले रहे थे। यदि हम मानते हैं कि कार नीली नहीं है, तो नमूना पूर्वाग्रह और भी बदतर है। तो हम सभी दिए गए डेटा से निष्कर्ष निकाल सकते हैं कि नमूना बहुत पक्षपाती है, और चूंकि हमें नहीं पता है कि यह कैसे पक्षपाती था, हम कार के रंग के बारे में कुछ भी निष्कर्ष नहीं निकाल सकते हैं।


उम्म, निश्चित रूप से तथ्य यह है कि 900 लोगों ने कहा था कि यह कुछ के लिए अच्छा था? क्या हम यह निष्कर्ष नहीं निकाल सकते कि यह नीला होने की अधिक संभावना है ?? याद रखें उत्तरदाता केवल 900 और 100 की संख्या जानता है। इसलिए क्या वे वास्तव में पूर्वाग्रह के बारे में कुछ भी कह सकते हैं?
पैट मोलॉय

0

कुछ जवाब आए हैं। मैं किसी भी तरह से एक गणित गुरु नहीं हूँ, लेकिन यहाँ मेरा है।

केवल 4 संभावनाएं हो सकती हैं:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

सवाल से, आप जानते हैं कि केस 1 और केस 4 का योग 900 लोग (90%) है, और केस 2 और केस 3 का योग 100 लोग (10%) है। हालांकि यहां यह पकड़ है: जो आप नहीं जानते हैं वह इन 2 केस जोड़े के भीतर वितरण है। हो सकता है कि केस 1 और 4 का योग पूरी तरह से केस 1 (जिसका मतलब कार नीला है) से बना है, या शायद पूरी राशि केस 4 (जिसका मतलब कार नीला नहीं है) से बनी है। समान मामले 2 + 3 के लिए जाता है। तो ... क्या आप की जरूरत है मामले sums के भीतर वितरण की भविष्यवाणी करने के लिए किसी तरह के साथ आने के लिए है। प्रश्न में कोई अन्य संकेत नहीं होने के साथ (कहीं यह नहीं कहता कि लोग अपने रंग या इस तरह के किसी भी चीज़ को जानने के लिए 80% निश्चित हैं) ऐसा कोई तरीका नहीं है जिससे आप एक निश्चित, निश्चित उत्तर के साथ आ सकें।

यह कहने के बाद ... मुझे संदेह है कि अपेक्षित उत्तर कुछ इस तरह है:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

जहां शेष 50% बस अज्ञात है, उसे त्रुटि मार्जिन कहें।


0

X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

{xi}{yi|x}


-3

जो व्यक्ति कार नहीं देख सकता है वह यह नहीं जानता कि यह वैज्ञानिक रूप से नीला साबित होता है। वह / वह कार नीले रंग की संभावना 50/50 है (यह नीला है, या यह नहीं है)। अन्य लोगों को मतदान करना इस व्यक्ति की राय को प्रभावित कर सकता है लेकिन यह इस संभावना को नहीं बदलता है कि एक अनदेखी कार या तो नीला है, या नहीं।

उपरोक्त सभी गणित इस संभावना को निर्धारित करते हैं कि आपका नमूना सेट यह निर्धारित कर सकता है कि क्या यह नीला है।


मुझे यकीन नहीं है कि यह सच है कि यह नीला होने की संभावना 50/50 है। वास्तव में, यह 50 से कम तरीका है, क्योंकि यह लाल, सफेद, पीला, आदि हो सकता है। यादृच्छिक रूप से ली गई कार नीले होने की संभावना 50% से कम है।
उपयोगकर्ता
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.