अस्वीकृति नमूना असाधारण रूप से अच्छा काम करेंगे जब और के लिए उचित है ग घ ≥ exp ( 2 ) ।cd≥exp(5)cd≥exp(2)
गणित को थोड़ा सरल करने के लिए, , x = a लिखें , और ध्यान देंk=cdx=a
f(x)∝kxΓ(x)dx
के लिए । स्थापना एक्स = यू 3 / 2 देता हैx≥1x=u3/2
च( यू ) ∝ केयू3 / 2Γ(u3/2)u1/2du
के लिए । जब कश्मीर ≥ exp ( 5 ) , इस वितरण अत्यंत सामान्य के करीब है (और के रूप में करीब ले आती है कश्मीर बड़ा हो जाता है)। विशेष रूप से, आप कर सकते हैंu≥1k≥exp(5)k
संख्यात्मक रूप से के मोड का पता लगाएं (उपयोग करना, उदाहरण के लिए, न्यूटन-राफसन)।f(u)
इसके मोड के बारे में दूसरे क्रम में का विस्तार करें ।logf(u)
यह एक लगभग अनुमानित सामान्य वितरण के मापदंडों को पैदावार देता है। उच्च सटीकता के लिए, यह अनुमानित नॉर्मल अत्यधिक पूंछों को छोड़कर पर हावी है । (जब के < एक्सप ( 5 ) , आपको वर्चस्व को आश्वस्त करने के लिए सामान्य पीडीएफ को थोड़ा बड़ा करने की आवश्यकता हो सकती है।)f(u)k<exp(5)
किसी भी मूल्य के लिए यह प्रारंभिक कार्य किया है , और एक निरंतर M > 1 (जैसा कि नीचे वर्णित है) का अनुमान लगाया है , एक यादृच्छिक रूपांतर प्राप्त करना एक बात है:kM>1
वर्चस्व वाले सामान्य वितरण जी ( यू ) से एक मान ड्रा करें ।ug(u)
अगर या एक नया वर्दी variate यदि एक्स से अधिक है च ( यू ) / ( एम जी ( यू ) ) , चरण 1 के लिए वापसी।u<1Xf(u)/(Mg(u))
सेट ।x=u3/2
G और f के बीच विसंगतियों के कारण के मूल्यांकन की अपेक्षित संख्या केवल 1 से थोड़ी अधिक है (कुछ अतिरिक्त मूल्यांकन 1 से कम चर के अस्वीकार के कारण उत्पन्न होंगे , लेकिन तब भी जब k 2 के आवृत्ति के अनुसार कम हो। घटनाएँ छोटी हैं।)fgf1k2
यह कथानक k = exp ( 5 ) के लिए u के कार्य के रूप में g और f के लघुगणक को दर्शाता है । क्योंकि रेखांकन इतने करीब हैं, हमें यह देखने के लिए कि क्या चल रहा है, उनके अनुपात का निरीक्षण करने की आवश्यकता है:k=exp(5)
यह लॉग अनुपात ; M = exp ( 0.004 ) का कारक यह सुनिश्चित करने के लिए शामिल किया गया था कि वितरण के मुख्य भाग में लघुगणक सकारात्मक है; यह है कि, आश्वस्त करने के लिए एम जी ( यू ) ≥ च ( यू ) नगण्य संभावना के क्षेत्रों में संभवतः छोड़कर। करके एम पर्याप्त रूप से बड़े आप गारंटी ले सकते हैं कि एम ⋅ जीलॉग( ऍक्स्प( 0.004 ) जी( यू ) / एफ( यू ) )म= ऍक्स्प( 0.004 )मजी( यू ) ≥ एफ( यू )मम⋅ जीसभी में हावी है लेकिन सबसे चरम पूंछ (जो व्यावहारिक रूप से वैसे भी सिमुलेशन में चुने जाने की कोई संभावना नहीं है)। हालांकि, जितना बड़ा एम होता है, उतने अधिक बार अस्वीकृति होगी। जैसा कि k बड़ा होता है, M को 1 के बहुत करीब चुना जा सकता है , जो व्यावहारिक रूप से कोई दंड नहीं देता है।चमकम1
एक समान दृष्टिकोण लिए भी काम करता है , लेकिन M के काफी बड़े मूल्यों की आवश्यकता हो सकती है, जब exp ( 2 ) < k < exp ( 5 ) , क्योंकि f ( u ) काफ़ी असममित होता है। उदाहरण के लिए, के साथ कश्मीर = exp ( 2 ) , एक यथोचित सही पाने के लिए जी हम निर्धारित करने की आवश्यकता एम = 1 :k > एक्सप( २ )मexp( २ ) < के < एक्सप( ५ )च( यू )के = एक्सप( २ )जीम=1
ऊपरी लाल वक्र का ग्राफ है, जबकि निचला नीला वक्र लॉग ( एफ ( यू ) ) का ग्राफ है । ऍक्स्प ( 1 ) जी के सापेक्ष एफ नमूने की अस्वीकृति नमूने के सभी परीक्षण ड्रॉ के 2/3 को खारिज कर दिया जाएगा, इस प्रयास को तीन बार: अभी भी बुरा नहीं है। सही पूंछ ( यू > 10 या एक्स > 10 3 / 2 ~ 30log(exp(1)g(u))log(f(u))fexp(1)gu>10x>103/2∼30) अस्वीकृति के नमूने में अंडर-प्रतिनिधित्व किया जाएगा (क्योंकि अब वहाँ एफ पर हावी नहीं होता है), लेकिन उस पूंछ में एक्सपोजर ( - 20 ) से कम कुल ∼ 10 - 9 शामिल हैं।exp(1)gfexp(−20)∼10−9
संक्षेप में, मोड की गणना करने के लिए प्रारंभिक प्रयास के बाद और मोड के चारों ओर की शक्ति श्रृंखला के द्विघात शब्द का मूल्यांकन करने के लिए - एक प्रयास जिसमें अधिकांश पर कुछ दसियों फ़ंक्शन मूल्यांकन की आवश्यकता होती है - आप अस्वीकृति नमूने का उपयोग कर सकते हैं 1 और 3 के बीच की अनुमानित लागत (या तो) प्रति संस्करण मूल्यांकन। लागत गुणक तेजी से 1 से k = c d 5 से आगे बढ़ता है।f(u)k=cd
यहां तक कि जब से सिर्फ एक ड्रॉ की जरूरत होती है, तो यह विधि उचित है। यह अपने आप में आता है जब कश्मीर के समान मूल्य के लिए कई स्वतंत्र ड्रॉ की आवश्यकता होती है , तब के लिए प्रारंभिक गणना के ओवरहेड को कई ड्रॉ से अधिक परिशोधित किया जाता है।fk
परिशिष्ट
@ कार्डिनल ने कहा है कि, यथोचित, हाथ से लहराते हुए विश्लेषण के समर्थन के लिए। विशेष रूप से, क्यों परिवर्तन करना चाहिए मेकअप वितरण लगभग सामान्य?x=u3/2
बॉक्स-कॉक्स परिवर्तनों के सिद्धांत के प्रकाश में , प्रपत्र (निरंतर α के लिए , उम्मीद से बहुत अलग नहीं है) के कुछ बिजली परिवर्तन की तलाश करना स्वाभाविक है जो वितरण को "अधिक" सामान्य कर देगा। याद रखें कि सभी सामान्य वितरणों की विशेषता है: उनके pdfs के लघुगणक विशुद्ध रूप से द्विघात होते हैं, जिसमें शून्य रेखीय शब्द और कोई उच्च क्रम शब्द नहीं होते हैं। इसलिए हम किसी भी pdf को ले सकते हैं और इसकी लॉगरिथम को उसके (उच्चतम) शिखर के चारों ओर एक शक्ति श्रृंखला के रूप में विस्तारित करके एक सामान्य वितरण से तुलना कर सकते हैं । हम α का एक मूल्य चाहते हैं जो तीसरा (कम से कम) बनाता हैx=uαααशक्ति गायब हो जाती है, कम से कम लगभग: यही कारण है कि हम सबसे अधिक उम्मीद कर सकते हैं कि एक एकल मुक्त गुणांक पूरा करेगा। अक्सर यह अच्छी तरह से काम करता है।
लेकिन इस विशेष वितरण पर एक हैंडल कैसे प्राप्त करें? बिजली परिवर्तन को प्रभावित करने पर, इसका पीडीएफ है
f(u)=kuαΓ(uα)uα−1.
इसका लघुगणक लें और स्टर्लिंग के के विषम विस्तार का उपयोग करें ( ar ) :log(Γ)
log(f(u))≈log(k)uα+(α−1)log(u)−αuαlog(u)+uα−log(2πuα)/2+cu−α
(के छोटे मूल्यों के लिए , जो है नहीं निरंतर)। यह प्रदान किया गया कार्य α सकारात्मक है, जिसे हम मामला मानेंगे (अन्यथा हम विस्तार के शेष की उपेक्षा नहीं कर सकते)।cα
इसकी तीसरी व्युत्पत्ति की गणना करें (जो, जब विभाजित हो !, शक्ति श्रृंखला में यू की तीसरी शक्ति का गुणांक होगा ) और इस तथ्य का फायदा उठाएं कि चरम पर, पहला व्युत्पन्न शून्य होना चाहिए। यह तीसरे व्युत्पन्न को बहुत सरल करता है, दे रहा है (लगभग, क्योंकि हम सी के व्युत्पन्न की अनदेखी कर रहे हैं )3!uc
−12u−(3+α)α(2α(2α−3)u2α+(α2−5α+6)uα+12cα).
जब बहुत छोटा नहीं है, तो u वास्तव में शिखर पर बड़ा होगा। क्योंकि α सकारात्मक है, इस अभिव्यक्ति में प्रमुख शब्द 2 α शक्ति है, जिसे हम इसके गुणांक को गायब करके शून्य पर सेट कर सकते हैं:kuα2α
2α−3=0.
यही कारण है कि है काम करता है इतनी अच्छी तरह से: इस विकल्प के साथ, की तरह बर्ताव करता है शिखर के आसपास घन अवधि के गुणांक यू - 3 है, जो के करीब है exp ( - 2 कश्मीर ) । एक बार जब कश्मीर में 10 से अधिक है या ऐसा है तो आप व्यावहारिक रूप से इसके बारे में भूल सकता है, और यह भी के लिए यथोचित छोटे है कश्मीर 2. करने के लिए नीचे उच्च शक्तियों, चौथे पर से, एक भूमिका की और कम से कम खेलने के रूप में कश्मीर , बड़े हो जाता है क्योंकि उनके गुणांकों बढ़ने आनुपातिक रूप से छोटा, भी। संयोग से, एक ही गणना ( एल ओ जी के दूसरे व्युत्पन्न पर आधारित) ( एफα = 3 / 2यू- 3exp( - 2 k )ककक अपने चरम पर) इस सामान्य सन्निकटन के मानक विचलन 2 से थोड़ा कम हैएल ओ जी( च( यू ) ),एक्सपी(-के/२) केलिए आनुपातिक त्रुटि के साथ।23exp( के / ६ )exp( - के / 2 )