कोड में टिप्पणियों को अनिवार्य रूप से दो को अनिवार्य रूप से परिभाषित करना समाप्त होता है (निरंतर में एक अपेक्षाकृत छोटा अंतर)।
दोनों फॉर्म , दोनों ही (पैमाने का अनुमान) की तरह दिखता है , और बहुत 1 के करीब है (इष्टतम बैंडविड्थ के अनुमान में विशिष्ट अनिश्चितता के सापेक्ष) )।cAn−1/5Ac
[बिनवादिथ का अनुमान है कि आमतौर पर स्कॉट के साथ जुड़ा हुआ प्रतीत होता है, वह 1979 के अपने पेपर [1] ( ) में से एक है - जैसे कि विकिपीडिया देखें - थोड़ा नीचे स्क्रॉल करें - या R's ।]3.49sn−1/3nclass.scott
1.059 जिस कोड को "स्कॉट अनुमान" कहता है वह सिल्वरमैन द्वारा (पूर्व) बुक में है (अपने लिंक पर सिल्वरमैन संदर्भ का p45 देखें - स्कॉट की व्युत्पत्ति उस पुस्तक के p130-131 पर है जिसे वे संदर्भित करते हैं)। यह एक सामान्य-सिद्धांत अनुमान से आता है।
इष्टतम बैंडविड्थ (एकीकृत माध्य वर्ग त्रुटि की स्थिति में) एकीकृत स्क्वेरेड दूसरी व्युत्पन्न का एक कार्य है, और एक सामान्य के लिए उस गणना से बाहर आता है, लेकिन कई मामलों में यह एक अच्छा सौदा है जो अन्य वितरणों के लिए इष्टतम है। ।1.059σ
अवधि का अनुमान है (, एक तरीका है कि प्रवृत्ति को कम कर देता में यह बहुत बड़ी अगर वहाँ बाहरी कारकों के कारण / तिरछापन / भारी पूंछ रहे हैं होने के लिए एक robustified अनुमान की तरह)। P47 पर eq 3.30 देखें, p46-7 पर उचित।Aσ
मेरे द्वारा सुझाए गए समान कारणों के लिए, सिल्वरमैन 1.059 को कम करने का सुझाव देता है (वास्तव में वह वास्तव में 1.06 का उपयोग करता है, 1.059 नहीं - जैसा कि उसकी पुस्तक में स्कॉट करता है)। वह एक कम मूल्य चुनता है जो सामान्य पर IMSE पर 10% से अधिक दक्षता नहीं खोता है, जो कि 0.9 से आता है।
तो वे दोनों द्वैध सामान्य पर IMSE- इष्टतम द्वंद्वयुद्ध पर आधारित हैं, एक सही पर इष्टतम, दूसरा (लगभग 15% छोटे, सामान्य में इष्टतम की दक्षता के 90% के भीतर पाने के लिए)। [मैं उन दोनों को "सिल्वरमैन" अनुमान लगाता हूं। मुझे नहीं पता कि वे स्कॉट के लिए 1.059 का नाम क्यों देते हैं।]
मेरी राय में, दोनों बहुत बड़े हैं। घनत्व के IMSE- इष्टतम अनुमान प्राप्त करने के लिए मैं हिस्टोग्राम का उपयोग नहीं करता। यदि वह (IMSE अर्थ में इष्टतम हैं कि घनत्व का अनुमान प्राप्त करना) वह था जो मैं करना चाहता था, तो मैं उस उद्देश्य के लिए हिस्टोग्राम का उपयोग नहीं करना चाहता।
हिस्टोग्राम को नोइज़ियर की तरफ से गुज़रना चाहिए (आँख को आवश्यक चौरसाई करने दें)। मैं लगभग हमेशा (या अधिक) इस प्रकार के नियमों को देने वाली डिफ़ॉल्ट संख्या को दोगुना करता हूं। इसलिए मैं 1.06 या 0.9 का उपयोग नहीं करूंगा, मैं 0.5 के आसपास कुछ का उपयोग करना चाहूंगा, शायद वास्तव में बड़े नमूना आकार में कम।
उनके बीच चयन करने के लिए वास्तव में बहुत कम है, क्योंकि वे दोनों बहुत कम डिब्बे देते हैं यह जानने के लिए कि डेटा में क्या चल रहा है (जिस पर, कम से कम छोटे आकार के नमूने हैं, यहां देखें) ।
[१]: स्कॉट, डीडब्ल्यू (१ ९, ९), "इष्टतम और डेटा-आधारित हिस्टोग्राम पर," बायोमेट्रिक , 66 , 605-610।