विफलता नहीं होने की संभावना को कैसे बताएं?


50

मैं सोच रहा था कि क्या 1 वर्ष के लिए क्षेत्र में 100,000 उत्पाद हैं और असफलताओं के साथ कुछ विफलता (किसी उत्पाद) की संभावना बताने का कोई तरीका है? बिकने वाले अगले 10,000 उत्पादों में से एक की संभावना क्या है?


4
कुछ मुझे बताता है कि यह वास्तविक विश्वसनीयता समस्या नहीं है। इतनी कम विफलता दर वाले उत्पाद नहीं हैं।
अक्कल

वास्तविक सफलता / विफलता दरों के लिए संभाव्यता के आँकड़ों से कुछ भी अनुमान लगाने से पहले आपको संभावित सफलता / विफलता दरों के वितरण के लिए एक मॉडल की आवश्यकता होगी। आपका विवरण बहुत कम आधार देता है जिससे इस तरह के वितरण का अनुमान / अनुमान लगाया जा सके।
RBarryYoung 16

1
@RBryYYoung प्रदान किए गए उत्तरों की जाँच करें - वे समस्या के लिए कुछ दिलचस्प और मान्य दृष्टिकोण प्रदान करते हैं। यदि आप उन दृष्टिकोणों से सहमत नहीं हैं तो बेझिझक उन पर टिप्पणी करें या अपना जवाब दें।
टिम

2
@ अक्षल - इतनी कम विफलता दर असंभव नहीं लगती है यदि यह उच्च मूल्य के साथ एक साधारण उत्पाद है और विफलता की स्थिति में ऐसा उच्च जोखिम है (जैसे कि एक सर्जिकल उपकरण) जो कि परीक्षण और निरीक्षण के स्तरों से गुजरता है (और संभवतः स्वतंत्र प्रमाणन) रिलीज से पहले। बेशक, विपरीत सच हो सकता है, उत्पाद का इतना कम मूल्य हो सकता है कि अंत उपयोगकर्ताओं को दोषपूर्ण उत्पादों के साथ समस्याओं की रिपोर्ट नहीं कर रहे हैं (निश्चित रूप से gumball बनाती है एक 1/100000 से कम रिपोर्ट दोष दर?), उपभोक्ता सिर्फ डिस्क यह और एक नया प्रयास करता है।
जॉनी

@Johnny, जब मोटोरोला के साथ आया था 6σ वे यह है कि प्रति 100 मिलियन उत्पादों, या ऐसा ही कुछ 3 विफलताओं दावा करते थे।
अक्कल

जवाबों:


43

संभावना है कि एक उत्पाद विफल हो जाएगा निश्चित रूप से समय और उपयोग का एक कार्य है। हमारे पास उपयोग पर कोई डेटा नहीं है, और केवल एक वर्ष के साथ कोई विफलताएं नहीं हैं (बधाई!)। इस प्रकार, इस पहलू ( अस्तित्व समारोह कहा जाता है ), आपके डेटा से अनुमानित नहीं किया जा सकता है।

यद्यपि आप एक वर्ष के भीतर एक द्विपदीय वितरण से आ रही विफलताओं के बारे में सोच सकते हैं । आपके पास अभी भी कोई विफलता नहीं है, लेकिन यह अब एक आम समस्या है। एक सरल समाधान 3 के नियम का उपयोग करना है , जो बड़े (जो आपके पास निश्चित रूप से है) के साथ सटीक है । विशेष रूप से, आप एक-पक्षीय 95% विश्वास अंतराल (यानी, निचली सीमा 0 है ) की ऊपरी सीमा को एक वर्ष में 3 / एन के रूप में विफलता की सच्ची संभावना पर प्राप्त कर सकते हैं । आपके मामले में, आप 95% आश्वस्त हैं कि दर 0.00003 से कम है । N03/N0.00003

आपने यह भी पूछा कि अगले 10k में से एक या अधिक असफलता की संभावना की गणना कैसे करें। उपरोक्त विश्लेषण का विस्तार करने के लिए एक त्वरित और सरल (यद्यपि चरम) तरीका केवल अंतर्निहित संभावना के रूप में ऊपरी बाउंड का उपयोग करना है और संभाव्यता प्राप्त करने के लिए संबंधित द्विपद सीडीएफ का उपयोग करना है कि विफलताएं नहीं होंगी । कोड का उपयोग करना , हम कर सकते हैं: जो अगले 10k उत्पादों में एक या एक से अधिक विफलताओं को देखने का मौका देता है। ऊपरी बाध्य का उपयोग कर लेने से, यह कम से कम एक विफलता होने की संभावना के इष्टतम बिंदु अनुमान नहीं है, बल्कि आप कह सकते हैं यह बहुत संभावना नहीं है कि की संभावना 1 विफलता से भी अधिक है 26 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(यह पहचानते हुए कि यह कुछ हद तक-हैंड-वेवी ’फ्रेमिंग है)। उत्तराधिकार के लाप्लास नियम से अनुमान के @ अमीबा के सुझाव का उपयोग करने की एक और संभावना है । उत्तराधिकार का नियम बताता है कि विफलता की अनुमानित संभावना ( एफ + 1 ) / ( एन + 2 ) है , जहां एफ विफलताओं की संख्या है। उस मामले में, पी = 9.9998 × 10 - 06 , और की भविष्यवाणी की संभावना के लिए गणना 1 + अगले 10,000 में विफलताओं है , उपज , या(F+1)/(N+2)Fp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210%


3
+1। मैंने पहले "3 के ​​नियम" के बारे में नहीं सुना है। मुझे आश्चर्य है कि क्या 3 और "लाप्लास के उत्तराधिकार के नियम" के बीच कोई संबंध है? उत्तरार्द्ध के अनुसार (यदि मैं इसे सही तरीके से लागू करता हूं), तो विफलता की संभावना रूप में अनुमानित की जा सकती है । 1/(N+2)
अमीबा का कहना है कि मोनिका

14
@amoeba 3 का यह नियम 95% एक-पक्षीय विश्वास सीमा है। मान लें कि विफलता की संख्या में एक द्विपद वितरण है। फिर कोई असफलता देखने का मौका नहीं है ( 1 - पी ) एन । कि एक से अधिक बनाने के लिए 5 % , का समाधान ( 1 - पी ) n0.05 के लिए पी । का उपयोग लॉग ( 1 - पी ) - पी छोटे के लिए पी , समाधान है पी - लॉग(n,p)(1p)n5%(1p)n0.05plog(1p)pp । के बाद से 0.05 = 1 / 20 3 , हम प्राप्त पी 3 / n । वह "3 का नियम" है। यह जानने लायक है क्योंकि अब आप जानते हैं कि "3" को कैसे अलग किया जाए यदि आप आत्मविश्वास स्तर को समायोजित करना चाहते हैं और आप पी या अधिक से अधिकदर का पता लगाने के लिए आवश्यकन्यूनतम एन को खोजने के लिए इसे उल्टा भी कर सकते हैं। plog(0.05)/n0.05=1/20e3p3/nnp
whuber

1
@ बोमबा जैसा कि मैंने उल्लेख किया है, मैंने विफलता की संभावना से पहले एक समान लिया। मेरा मानना ​​है कि एक अलग पूर्व में काफी अलग परिणाम होंगे।
यार दून

1
आपका संपादन अच्छी प्रगति (+1) है। हालाँकि, यह व्याख्या के मुद्दों को उठाता है। हम "निश्चित" नहीं हैं, मौका से अधिक नहीं है क्योंकि हम सही अंतर्निहित अवसर से पूरी तरह से निश्चित नहीं हैं। हमारे पास पी पर "ऊपरी बाध्य" नहीं है , लेकिन केवल एक ऊपरी विश्वास सीमा है। जब आप एक भविष्य की घटना के लिए एक भविष्यवाणी देते हैं, तो आपको (ए) इसका अनुमान लगाने की आवश्यकता है और (बी) उस पर सीमा प्रदान करते हैं। इस तरह इसे देखो: हम पर सीमा दे Y जब एक्स ~ द्विपद ( एन , पी ) , वाई ~ द्विपद ( मीटर , पी ) स्वतंत्र रूप से, पर सशर्त26%pYXBinomial(n,p)YBinomial(m,p) । वे सीमाएँ X के आधार पर Y के लिएएकपूर्वानुमान अंतराल हैंX=0YX
whuber

2
"तीन का नियम" के लिए याय। मैंने कई साल पहले "अमेरिकन मेडिकल एसोसिएशन के जर्नल" jama.jamanetwork.com/article.aspx?articleid=385438
DWin

25

आप एक बायसीयन दृष्टिकोण ले सकते हैं। द्वारा विफलता की संभावना को निरूपित करें और इसे एक यादृच्छिक चर के रूप में सोचें। एक प्रायोरी, इससे पहले कि आप प्रयोगों के परिणामों को देखते हैं, आपको लगता है कि हो सकता है कि Θ ~ यू ( 0 , 1 ) । आप इस उत्पाद विश्वसनीय बनाने के लिए इंजीनियरों विश्वास करते हैं, हो सकता है आप ले जा सकते हैं Θ ~ यू ( 0 , 0.1 ) या तो। यह आप पर निर्भर करता है। उसके बाद, आप का पिछला वितरण की गणना करने के Bayes के सिद्धांत का उपयोग कर सकते हैं θ । निरूपित एक घटना है कि आप (मनाया गया है n शून्य विफलताओं के साथ प्रयोग)।ΘΘU(0,1)Θ~यू(0,0.1)θn

सब कुछ सरल है:Θएकसमान है, इसलिएp(Θ)कुछ स्थिर है। जब से तुम चलानेnप्रयोगों,पी(एक|θ)बस कोई की संभावना हैविफलताओंमेंnविफलता की संभावना के साथ bernouli परीक्षणोंθ

पी(Θ=θ|)=पी(|Θ=θ)पी(Θ=θ)पी()=पी(|θ)पी(θ)पी(|θ)पी(θ)θ
Θपी(θ)nपी(|θ)nθ

एक बार जब आप है आप सोने कर रहे हैं: आप किसी भी घटना की संभावना की गणना कर सकते बी integrateion द्वारा: पी ( बी ) = पी ( बी | θ ) पी ( θ | एक ) θपी(θ|)बीपी(बी)=पी(बी|θ)पी(θ|)θ

नीचे, मैं उपर्युक्त दृष्टिकोण के बाद एक विस्तृत समाधान के माध्यम से काम करता हूं। मैं कुछ मानक शॉर्टकट ले लूँगा।

पूर्व को । तब: पी ( θ | एक ) α पी ( एक | θ ) 1 = ( 1 - θ ) n सामान्य निरंतर पी ( ) = पी ( एक | θ ) पी ( θ ) θ पाई जाती है बी ( 1 , nयू(0,1)

पी(θ|)αपी(|θ)1=(1-θ)n
पी()=पी(|θ)पी(θ)θ - विकिपीडिया पेजबीटा फ़ंक्शनऔरबीटा वितरण देखें। तो, पी ( θ | एक ) = ( 1 - θ ) nबी(1,n+1) , जो मापदंडों1,एन+1 केसाथ एक बीटा वितरण है।p(θ|A)=(1θ)nB(1,n+1)1,n+1

बी द्वारा अगले वर्ष में उत्पादों में कोई विफलताओं की संभावना को अस्वीकार करें । कम से कम एक विफलता की संभावना 1 है - पी ( बी ) । फिर 1 - पी ( बी ) = 1 - ( 1 - θ ) मीटर ( 1 - θ ) nmB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

जो लगभग , n = 100 , 000 , m = 10 , 000 का उपयोग करते हुए । बहुत प्रभावशाली नहीं है? मैंने विफलता की संभावना पर एक समान वितरण लिया। शायद आपको अपने इंजीनियरों पर बेहतर विश्वास है।0.1n=100,000,m=10,000


3
इस तरह की एक साधारण समस्या के लिए वास्तविक समाधान का इतना कम गिरना अजीब लगता है, खासकर जब विधि इतनी आशाजनक दिखती है। क्या आप सुझाव दे रहे हैं कि गणना कठिन है?
whuber

2
@ जब मैं इसे नहीं भूल गया, मुझे लगा कि यह अंतिम चरण स्पष्ट है। "अम्प्रेसिव" से मेरा तात्पर्य यह है कि असफलता की 10% संभावना अभी भी बड़ी है, जब पहले 100,000 रन में कोई असफलता नहीं है। इसके अलावा, संयुग्म जोड़े के बारे में टिप्पणी के लिए धन्यवाद, मैंने सोचा कि यह ओपी को भ्रमित कर सकता है और उन्हें महत्वपूर्ण से विचलित कर सकता है, इसलिए इसे छोड़ दें।
यार दून

3
जाहिर है, हाँ - लेकिन जब आप 0.9 के मान के साथ समाप्त होते हैं, तो वह संख्या जो लोग देखेंगे, लगभग कोई फर्क नहीं पड़ता कि आप पूर्ववर्ती पाठ में इसके बारे में क्या कहते हैं। ताकि आपको गलतफहमी न हो, आप जो जवाब दे रहे हैं उसके बारे में स्पष्ट होना हमेशा मददगार होता है। (+1 बेहतर जवाब के लिए, BTW)
whuber

3
दरअसल, अपने इंजीनियरों में अपना विश्वास की परवाह किए बिना, यह वास्तव में बहुत ही आश्चर्य की बात यह है कि, अगर आप का पालन n1 बिना किसी असफलता के साथ परीक्षणों का अगले k n परीक्षणों के भीतर विफलताओं के बारे में औसत उम्मीद करनी चाहिए, और इस प्रकार कम से कम एक उम्मीद करनी चाहिए संभावना के साथ विफलता 1 - - कश्मीर , जो लगभग है कश्मीर छोटा सा के लिए कश्मीर । इस प्रकार, १,००,००० सफल परीक्षणों से अगले १०,००० परीक्षणों के भीतर कम से कम एक विफलता की संभावना लगभग १०% हो जाती है। kkn1ekkk
इल्मरी करोनें

2
@ हमारी पूरी धारणा है कि शून्य-विफलताओं के मामले में पहले की बात सच नहीं है। यह शून्य के निकट ढलान पर बहुत अधिक निर्भर करता है, उदाहरण के लिए पहले फ्लैट वर्दी (बीटा 1,1) और जेफ्रीस पूर्व (बीटा 0.5, 0.5) एक अलग रूप से भिन्न रूप देगा।
एरिक

12

प्रायिकता की गणना करने के बजाय, यह अनुमान न लगाएं कि कितने उत्पाद विफल हो सकते हैं?

प्रेक्षणों की मॉडलिंग करना

हैं उत्पादों के क्षेत्र में और एक अन्य मीटर = 10000 विचाराधीन। मान लें कि उनकी असफलताएँ प्रायिकता p के साथ सभी स्वतंत्र और स्थिर हैं ।n=100000m=10000p

हम इस स्थिति को एक द्विपद प्रयोग के माध्यम से मॉडल कर सकते हैं: एक अज्ञात अनुपात वाले टिकटों के बॉक्स से "विफलता" टिकट और 1 - पी "सफलता" टिकट के पी के, एम + एन = 110000 टिकट (प्रतिस्थापन के साथ)ड्रा करें, ताकि असफलता का मौका वही रहता है)। पहले n टिकटोंमें विफलताओं की गणना करें - बतादें कि X - और शेष M टिकटोंमें विफलताओं की गणना करें, जो कि Y कहलाती हैंp1pm+n=110000nXmY

प्रश्न तैयार करना

सिद्धांत रूप में, और 0 वाई मीटर कुछ भी हो सकता है। हम जिस चीज में रुचि रखते हैं, वह मौका है कि Y = u ने उस X + को दिया0Xn0YmY=u ( { 0 , 1 , , m } में किसी भी संख्या केसाथ u ) दिया है। चूंकि सभी n + m टिकटोंमें विफलताएं कहीं भी हो सकतीहैं, हर संभव कॉन्फ़िगरेशन समान मौका होने के साथ, यह यू की संख्या को विभाजित करके पाया जाता है।X+Y=uu{0,1,,m}n+muकी -subsets की संख्या से बातें यू सब से -subsets n + मीटर बातें:mun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

तुलनीय सूत्रों का उपयोग गणना के लिए किया जा सकता है जब X=1,2,.

एक ऊपरी भविष्यवाणी सीमा1α (UPL) उन आखिरी में विफलताओं की संख्या के लिए टिकट, टी α ( एक्स , n , मी ) , छोटी से छोटी द्वारा दिया जाता हैmtα(X;n,m) (के आधार पर एक्स ) जिसके लिए पी ( यू ; n , मीटर ) अल्फाuXp(u;n,m)α

व्याख्या

यूपीएल को का उपयोग करने के जोखिम के संदर्भ में व्याख्या की जानी चाहिए , क्योंकि एक्स या वाई से पहले मूल्यांकन किया जाता है। दूसरे शब्दों में, मान लें कि यह एक साल पहले है और आपको पहले n उत्पादों को देखने के बाद अगले मी उत्पादों में विफलताओं की संख्या का अनुमान लगाने के लिए एक प्रक्रिया की सिफारिश करने के लिए कहा जा रहा है। आपका ग्राहक पूछता हैtαXYmn

क्या मौका है कि आपकी प्रक्रिया देगी ? आपके पास अधिक डेटा होने के बाद भविष्य में मेरा मतलब नहीं है; मेरा मतलब अभी है, क्योंकि मुझे अभी फैसले लेने हैं और मेरे पास मेरे पास जो एकमात्र मौके उपलब्ध होंगे, वही इस समय परिकलित किए जा सकते हैं। ''Y

आपकी प्रतिक्रिया हो सकती है,

अभी मौका से अधिक नहीं है , लेकिन यदि आप एक छोटी भविष्यवाणी का उपयोग करने की योजना बनाते हैं, तो मौका α से अधिक होगा ।αα

परिणाम

के लिए n=105 , , और एक्स = 0 हम गणना कर सकते हैं किm=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

इस प्रकार, X = 0 का अवलोकन करने परX=0 ,

  • अप करने के लिए के लिए आत्मविश्वास (जो है, जब 9.1 % अल्फा ), अनुमान है वहाँ ज्यादा से ज्यादा है टी अल्फा ( 0 ; n1α=90.9%9.1%α अगले में विफलता 10 , 000 उत्पादों।tα(0;n,m)=110,000

  • के लिए अप करने के लिए आत्मविश्वास (जो है, जब 0.8 % अल्फा < 9.1 % ), वहाँ ज्यादा से ज्यादा कर रहे हैं भविष्यवाणी टी अल्फा ( 0 ; n99.2%0.8%α<9.1% अगले में विफलताओं 10 , 000 उत्पादों।tα(0;n,m)=210,000

  • आदि।


टिप्पणियाँ

यह दृष्टिकोण कब और क्यों लागू होगा? मान लीजिए आपकी कंपनी बहुत सारे विभिन्न उत्पाद बनाती है। क्षेत्र में प्रत्येक के के प्रदर्शन को देखने के बाद , यह गारंटी का उत्पादन करना पसंद करता है, जैसे "एक वर्ष के भीतर किसी भी विफलता का पूर्ण-लागत प्रतिस्थापन।" संख्या के लिए भविष्यवाणी सीमा होने सेnविफलताओं के आप उन गारंटियों को वापस करने की कुल लागत को नियंत्रित कर सकते हैं। क्योंकि आप कई उत्पाद बनाते हैं, और असफलताओं की अपेक्षा करते हैं कि आपके नियंत्रण से परे यादृच्छिक परिस्थितियों के कारण, प्रत्येक उत्पाद का अनुभव स्वतंत्र होगा। यह लंबे समय में आपके जोखिम को नियंत्रित करने के लिए समझ में आता है। हर बार एक समय में आपको उम्मीद से अधिक दावों का भुगतान करना पड़ सकता है, लेकिन अधिकांश समय आप कम भुगतान करेंगे। यदि घोषित से अधिक भुगतान करना विनाशकारी हो सकता है, तो आप को बहुत छोटा कर देंगे (और आप संभवतः अधिक परिष्कृत विफलता मॉडल का उपयोग करेंगे!)। अन्यथा, यदि लागतें मामूली हैं, तो आप कम आत्मविश्वास (उच्च α ) के साथ रह सकते हैं । ये गणना दर्शाती है कि आत्मविश्वास और जोखिमों को कैसे संतुलित किया जाए।αα

ध्यान दें कि हमें पूर्ण प्रक्रिया गणना करने की आवश्यकता नहीं है । हम तब तक प्रतीक्षा करते हैं जब तक कि एक्स का अवलोकन नहीं किया जाता है और फिर उस विशेष एक्स (यहां,) के लिए गणना की जाती है ।tXX ) के, जैसा कि ऊपर दिखाया गया है। सिद्धांत रूप में, हालांकि, हमशुरुआतमें X के सभी संभावित मूल्यों के लिए गणना कर सकते थे।X=0X

एक बायेशियन दृष्टिकोण (अन्य उत्तरों में वर्णित) आकर्षक है और अच्छी तरह से काम करेगा बशर्ते कि परिणाम पूर्व पर बहुत अधिक निर्भर न हों। दुर्भाग्य से, जब विफलता की दर इतनी कम होती है कि बहुत कम (या कोई विफलता नहीं) देखी जाती है, तो परिणाम पूर्व की पसंद के प्रति संवेदनशील होते हैं।


+1, लेकिन सही नहीं लगता है। p(0,n,m)=1
अमीबा का कहना है कि

1
@COOLSerdash, क्योंकि , और के लिए शर्तों यू = 1 , 2 ... शून्य के बराबर नहीं कर रहे हैं। up(u,n,m)=1u=1,2...
अमीबा का कहना है कि

1
कारण है कि आप हो रही है , @amoeba नोटों के रूप में है, क्योंकि अपने पी ( यू ; n , मी ) = ( मीटरup(u;n,m)>1 वास्तव मेंPr(Y=u|X=0) नहीं है, बल्किPr(Y=u|X+Y=u)=Pr(X=0|X+Y=u)(और चाहिए)इस प्रकार वास्तव में के रूप में दर्शाया जाता है जैसेपी(0;n,मीटर,p(u;n,m)=(mu)(n+mu)Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)या कुछ इस तरह का)। मुझे कुछ परेशानी हो रही है जो आप बाद में उस पर करते हैं, लेकिन मुझे पूरा यकीन है कि, जो भी हो, यह दुर्भाग्य से समस्या का एक सही समाधान नहीं है जैसा कि पूछा गया है।
इल्मरी करोनें २४'१५ को १२:१२

1
@IlmariKaronen आपकी टिप्पणियों के लिए धन्यवाद। आप सही है कि मैं होती है चाहिए एक छोटे से अधिक स्पष्ट रूप से, क्योंकि इस पर एक प्रायिकता वितरण नहीं है यू -यह एक सशर्त संभावना है - लेकिन मेरा मानना है कि इस सवाल का जवाब ही फिर भी सही है और मैं बहुत विश्वास है कि कंप्यूटिंग भविष्यवाणी की सीमा के लिए यह दृष्टिकोण सही और पारंपरिक दोनों है। मैं इन बिंदुओं को स्पष्ट करने के लिए इस पोस्ट को संपादित करूंगा। p(u;n,m)u
whuber

1
@ इल्मरी मैंने पहले ही एडिट कर दी थी - आप इसे एडिट हिस्ट्री में देख सकते हैं। मैं कोई पुजारी नहीं मानता हूं और केवल इस समस्या के लिए एक भविष्यवाणी अंतराल की परिभाषा को लागू करता हूं । यदि आप चुनौती देना चाहते हैं कि क्या यह "सांख्यिकीय रूप से सार्थक है", तो आप खुद को इस मानक निर्माण को चुनौती देते हुए पाएंगे। उदाहरण के लिए, हैन एंड मीकर, सांख्यिकीय अंतराल (जे। विले 1991) देखें।
whuber

9

निम्नलिखित एक बायेसियन उत्तर है "10,000 नए उत्पादों में से, कितने असफल होने की उम्मीद है अगर सभी पूर्व में उत्पादित 100,000 असफल नहीं हुए?", लेकिन आपको विभिन्न पुजारियों के लिए संवेदनशीलता पर विचार करना चाहिए।

मान लीजिए कि सशर्त स्वतंत्र और समान रूप से वितरित, यह देखते हुए हैं Θ = θ , ऐसी है कि एक्स 1 | Θ = θ ~ बी आर एन यू एल एल मैं ( θ ) , और संयुग्मी उपयोग से पहले Θ ~ बी टी ( , बी ) , , बी > 0 के साथX1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

के लिए , हम [ एन Σ मैं = मीटर + 1 एक्स मैंm<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

के लिए , हम [ एक्स मैं | एक्स 1 = 0 , ... एक्स मीटर = 0 ]m+1in जिसमें हम इस्तेमाल कियाΘ|एक्स1=0,...,एक्समीटर=0~बीटीएक(एक,मीटर+)

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

अपने संख्या में प्लग करने से एक वर्दी पहले (के साथ, ) यदि आप एक असफलता की दर उम्मीद के आसपास 10 % है, जबकि एक जेफ्रेय्स की तरह से पहले ( एक = 1 / 2 , = 1 / 2 ) यदि आप एक विफलता देता है 5 % के करीब दरa=1,b=110%a=1/2,b=1/25%

यह भविष्य कहनेवाला उम्मीद एक अच्छे सारांश की तरह नहीं दिखता है, क्योंकि भविष्य कहनेवाला वितरण अत्यधिक तिरछा है। हम आगे जा सकते हैं और भविष्य कहनेवाला वितरण की गणना कर सकते हैं। चूंकि के रूप में हमने किया कंडीशनिंग से पहले हमारे पास पीआर ( एन Σ मैं = मीटर + 1 एक्स मैं = टी

i=m+1nXi|Θ=θBin(nm+2,θ),
के लिएटी=0,1,...,n-मीटर+2
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

मैं इसे बाद में एक भविष्य कहनेवाला अंतराल कंप्यूटिंग हूँ ।95%


3
+1 यह प्रदर्शित करने के लिए कि परिणाम 0. के निकट पूर्व के आकार के प्रति संवेदनशील है (यह ध्यान देने योग्य है, क्योंकि संभावना फ़ंक्शन शून्य के पास दृढ़ता से केंद्रित है mBeta(a,b)am+a+bamabU(0,1)U(0,0.01)U(0.01,1)

6

लाप्लास के सूर्योदय समस्या दृष्टिकोण का उपयोग करते हुए , हमें यह संभावना मिलती है कि एक वर्ष भीतर एक उत्पाद विफल हो जाएगा

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87 , काफी उच्च है, वास्तव में।

बेशक, आपको अपने डेटा को अपडेट करते रहना चाहिए जबकि अधिक उत्पाद बेचे जाते हैं, अंततः एक विफल हो जाएगा।


10,000से 200,000200000/1000012

@whuber, इसे ठीक किया
अक्कल

1
0.865


5

इस प्रश्न के लिए कई अच्छे उत्तर दिए गए थे, लेकिन हाल ही में मुझे इस विषय पर कुछ संसाधनों की समीक्षा करने का मौका मिला और इसलिए मैंने परिणाम साझा करने का निर्णय लिया।

k=0n

(1)P(K=k)=kn=0

इस तरह का अनुमान इस तथ्य के बजाय असंतोषजनक है कि हमने देखा कि हमारे नमूने में कोई विफलता नहीं है, शायद ही साबित होता है कि वे सामान्य रूप से असंभव हैं। डेटा आउट-ऑफ-आउट ज्ञान बताता है कि कुछ है असफलता की संभावना है, भले ही गैर देखी गई हो (अभी तक)। एक प्राथमिक ज्ञान होने से हमें बेली (1997), रज्जागी (2002), बसु एट अल (1996) और लुडब्रुक और ल्यू (2009) द्वारा समीक्षा की गई बेसेसियन विधियों का उपयोग करने की ओर अग्रसर किया गया है।

सरल अनुमानकों में "ऊपरी बंधे" अनुमानक जो मानते हैं (बेली, 1997)

यह शून्य-विफलता मामले में पी के लिए एक अनुमानक के लिए तर्कसंगत नहीं होगा कि एक-विफलता के मामले में अधिकतम संभावना अनुमानक द्वारा भविष्यवाणी की गई संभावना से अधिक उपज की संभावना है, एक उचित ऊपरी सीमा

के रूप में परिभाषित किया गया है

(2)1n

उल्लेख किया जा सकता है। जैसा कि लुडब्रुक और ल्यू (2009) द्वारा समीक्षा की गई है, अन्य संभावनाएं "शासन का नियम" हैं (सीएफ यहां , विकिपीडिया , या ईपासच एट अल, 1995)

(3)3n

या अन्य विविधताएँ:

(4)3n+1

Newcombe और Altman (या 3.6) द्वारा "3.7 का नियम":

(5)3.7n

"चार का नया नियम":

(6)4n+4

लेकिन जैसा कि लुडब्रुक और ल्यू (2009) द्वारा निष्कर्ष निकाला गया था, "थ्रेश का नियम" "बेकार के बगल में" और "3.6 का नियम" (और 3.7) "की गंभीर सीमाएं हैं - वे सकल गलत हैं यदि प्रारंभिक नमूना आकार 50 से कम है" और वे तरीकों की सिफारिश नहीं करते हैं (3) - (6), उचित बायेसियन अनुमानकों का उपयोग करने के बजाय सुझाव दें (नीचे देखें)।

बेइज़ियन अनुमानकों में कई अलग-अलग उल्लेख किए जा सकते हैं। बेली (1997) द्वारा सुझाया गया पहला ऐसा अनुमानक है

(7)1-0.51n

वर्दी के नीचे मंझले का अनुमान लगाने से पहले

(8)1-0.51n+1

या ऐसे पूर्व के तहत मतलब का अनुमान लगाने के लिए

(9)1n+2

अभी तक एक और दृष्टिकोण निरंतर विफलता दर (पॉइसन वितरण) पैदावार के साथ घातीय विफलता पैटर्न मान रहा है

(10)1/3n

अगर हम मापदंडों से पहले बीटा का उपयोग करते हैं तथा हम सूत्र का उपयोग कर सकते हैं (देखें रज्जी, 2002):

(1 1)++n

के तहत ==1पूर्व में वर्दी की ओर जाता है (9)। जेफ्री के साथ पहले मानते हुए==0.5 का कारण है

(12)12(n+1)

आम तौर पर, बायेसियन सूत्र (7) - (12) की सिफारिश की जाती है। बसु एट अल (1996) पूर्व सूचनात्मक के साथ (11) की सिफारिश करता है, जब कुछ प्राथमिक ज्ञान उपलब्ध होता है। चूंकि कोई एकल सर्वोत्तम विधि मौजूद नहीं है, इसलिए मैं आपके विश्लेषण से पहले साहित्य की समीक्षा करने का सुझाव दूंगा, खासकर जबn छोटा है।


बेली, आरटी (1997)। शून्य-विफलता डेटा से अनुमान। जोखिम विश्लेषण, 17 , 375-380।

रज्जागी, एम। (2002)। नमूना में शून्य घटना के साथ द्विपद सफलता की संभावना के अनुमान पर। जर्नल ऑफ मॉडर्न एप्लाइड स्टैटिस्टिक मेथड्स, 1 (2), 41।

लुडब्रुक, जे।, और ल्यू, एमजे (2009)। दुर्लभ जटिलताओं के जोखिम का अनुमान लगाना: 'तीन'गुड का नियम पर्याप्त है? " एएनजेड जर्नल ऑफ सर्जरी, 79 (7‐8), 565-570।

इयपास, ई।, लेफ़रिंग, आर।, कुम, सीके, और ट्रॉइडल, एच। (1995)। प्रतिकूल घटनाओं की संभावना जो अभी तक नहीं हुई है: एक सांख्यिकीय अनुस्मारक। बीएमजे 311 (7005): 619–620।

बसु, एपी, गेलर, डीडब्ल्यू, और चेन, जेजे (1996)। एक नमूने में शून्य घटना के साथ एक दुर्लभ कैंसर के लिए ट्यूमर की घटना की संभावना का अनुमान लगाना। नियामक विष विज्ञान और फार्माकोलॉजी, 23 (2), 139-144।


1
वहाँ क्या है की उत्कृष्ट समीक्षा!
एलेफसिन

W / "बेयसियन अनुमानकों के बीच कई ..." टिप्पणी शुरू करने के लिए, यह आमतौर पर स्पष्ट नहीं है कि क्या दी गई टिप्पणी इसके ऊपर या नीचे के सूत्र से संबंधित है। क्या आप इसे स्पष्ट कर सकते हैं?
गुंग - मोनिका फिर से बहाल करें

2

आपको वास्तव में अपने उत्पादों के डिजाइनरों के पास वापस जाने की आवश्यकता है। यह एक मौलिक इंजीनियरिंग समस्या है जो एक अवलोकन सांख्यिकीय नहीं है। उनके पास प्रत्येक घटक की विफलता की संभावना और कुल इकट्ठे उत्पाद की शुद्ध विफलता संभावना होगी। वे आपको उत्पाद के पूरे डिजाइन जीवन में विफलताओं की अपेक्षित संख्या दे सकते हैं।

एक सिविल इंजीनियर 120 साल के डिजाइन जीवन के लिए एक पुल डिजाइन करता है। पुल के प्रत्येक घटक में विफलता की थोड़ी संभावना है। प्रत्येक लोडिंग के पार होने की थोड़ी संभावना है। पुल को बनाने के लिए आर्थिक बनाने के लिए, कुल पतन केवल 2400 वर्षों में एक बार होगा जो कि पुल की तुलना में बहुत लंबा है। यह आश्चर्य की बात नहीं है कि पुल वर्ष 1 में विफल नहीं होता है, न ही वर्ष 2 से 120 वर्ष तक। यह ढह नहीं गया है आपको बहुत कम बताता है। समय के साथ विफलता की इसकी विभिन्न संभावनाएं केवल मूल डिजाइनरों द्वारा अनुमानित की जा सकती हैं।


0

यह एक समस्या के समान है जिसका हमने सामना किया जब हमने उत्पादन में विफलता को खत्म करने के लिए एक नई विनिर्माण प्रक्रिया शुरू की।

नई प्रणाली ने कोई असफलता नहीं पैदा की इसलिए लोग एक ही सवाल पूछ रहे थे: हम विफलता दर की भविष्यवाणी कैसे करते हैं? आपके मामले में, क्योंकि आपने एक ऐसी अवधि निर्धारित की है जिस पर विफलता उस समय के लिए कोई चिंता नहीं हो सकती जब विफलता उस अवधि के भीतर होती है, अस्थायी प्रभाव हटा दिए गए हैं। और यह बस एक मामला है कि कुछ विफल हुआ या नहीं। उस उत्तर के साथ - मेरे उत्तर के साथ।

सहज रूप से, ऐसा लगता है कि हमें विफलता दर की गणना करने में सक्षम होने के लिए कम से कम एक विफलता की आवश्यकता है। हालाँकि, इस धारणा के भीतर एक अंतर्निहित गलती है। हम विफलता दर की गणना कभी नहीं करेंगे। ऐसा इसलिए है क्योंकि हम एक नमूने के साथ काम कर रहे हैं। इस प्रकार हम केवल संभावित विफलता दर की एक सीमा का अनुमान लगा सकते हैं। ऐसा करने का तरीका विफलता दर के लिए वितरण खोजना है। इस उदाहरण में कार्य करने वाला वितरण एक बीटा वितरण है जहां पैरामीटर हैं: α = n + 1 और β = N - n 1

नोट: N नमूना आकार है और n विफलताओं की संख्या है (आपके मामले में 0)

आपके परिदृश्य के लिए, विफलता दर का वितरण नीचे दिखाया गया है। यहाँ छवि विवरण दर्ज करें

फिर आप उस वितरण को संबंधित द्विपद संभाव्यता सूत्र में एक इकाई की विफलता की संभावना के लिए वितरण प्राप्त करने के लिए (विश्लेषणात्मक रूप से या मोंटे कार्लो का उपयोग करके किया जा सकता है) खिलाएंगे। मुझे संदेह है कि संख्या बहुत कम होगी।

ध्यान दें कि यह प्रक्रिया आपके मुट्ठी के सेट में विफलताओं की संख्या पर लागू नहीं होती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.