कर्नेल बैंडविड्थ: स्कॉट बनाम सिल्वरमैन के नियम


14

क्या कोई सादे अंग्रेजी में समझा सकता है कि बैंडविड्थ चयन के लिए स्कॉट और सिल्वरमैन के अंगूठे के नियमों में क्या अंतर है? विशेष रूप से, एक दूसरे से बेहतर कब है? क्या यह अंतर्निहित वितरण से संबंधित है? नमूनों की संख्या?

PS मैं SciPy में कोड की बात कर रहा हूं ।


1
मैं अजगर को जानना नहीं चाहता। मैं केवल यह समझने में मदद करना चाहता हूं कि किस नियम का उपयोग करना है, और क्यों।
xrfang

जवाबों:


11

कोड में टिप्पणियों को अनिवार्य रूप से दो को अनिवार्य रूप से परिभाषित करना समाप्त होता है (निरंतर में एक अपेक्षाकृत छोटा अंतर)।

दोनों फॉर्म , दोनों ही (पैमाने का अनुमान) की तरह दिखता है , और बहुत 1 के करीब है (इष्टतम बैंडविड्थ के अनुमान में विशिष्ट अनिश्चितता के सापेक्ष) )।cAn1/5Ac

[बिनवादिथ का अनुमान है कि आमतौर पर स्कॉट के साथ जुड़ा हुआ प्रतीत होता है, वह 1979 के अपने पेपर [1] ( ) में से एक है - जैसे कि विकिपीडिया देखें - थोड़ा नीचे स्क्रॉल करें - या R's ।]3.49sn1/3nclass.scott

1.059 जिस कोड को "स्कॉट अनुमान" कहता है वह सिल्वरमैन द्वारा (पूर्व) बुक में है (अपने लिंक पर सिल्वरमैन संदर्भ का p45 देखें - स्कॉट की व्युत्पत्ति उस पुस्तक के p130-131 पर है जिसे वे संदर्भित करते हैं)। यह एक सामान्य-सिद्धांत अनुमान से आता है।

इष्टतम बैंडविड्थ (एकीकृत माध्य वर्ग त्रुटि की स्थिति में) एकीकृत स्क्वेरेड दूसरी व्युत्पन्न का एक कार्य है, और एक सामान्य के लिए उस गणना से बाहर आता है, लेकिन कई मामलों में यह एक अच्छा सौदा है जो अन्य वितरणों के लिए इष्टतम है। ।1.059σ

अवधि का अनुमान है (, एक तरीका है कि प्रवृत्ति को कम कर देता में यह बहुत बड़ी अगर वहाँ बाहरी कारकों के कारण / तिरछापन / भारी पूंछ रहे हैं होने के लिए एक robustified अनुमान की तरह)। P47 पर eq 3.30 देखें, p46-7 पर उचित।Aσ

मेरे द्वारा सुझाए गए समान कारणों के लिए, सिल्वरमैन 1.059 को कम करने का सुझाव देता है (वास्तव में वह वास्तव में 1.06 का उपयोग करता है, 1.059 नहीं - जैसा कि उसकी पुस्तक में स्कॉट करता है)। वह एक कम मूल्य चुनता है जो सामान्य पर IMSE पर 10% से अधिक दक्षता नहीं खोता है, जो कि 0.9 से आता है।

तो वे दोनों द्वैध सामान्य पर IMSE- इष्टतम द्वंद्वयुद्ध पर आधारित हैं, एक सही पर इष्टतम, दूसरा (लगभग 15% छोटे, सामान्य में इष्टतम की दक्षता के 90% के भीतर पाने के लिए)। [मैं उन दोनों को "सिल्वरमैन" अनुमान लगाता हूं। मुझे नहीं पता कि वे स्कॉट के लिए 1.059 का नाम क्यों देते हैं।]

मेरी राय में, दोनों बहुत बड़े हैं। घनत्व के IMSE- इष्टतम अनुमान प्राप्त करने के लिए मैं हिस्टोग्राम का उपयोग नहीं करता। यदि वह (IMSE अर्थ में इष्टतम हैं कि घनत्व का अनुमान प्राप्त करना) वह था जो मैं करना चाहता था, तो मैं उस उद्देश्य के लिए हिस्टोग्राम का उपयोग नहीं करना चाहता।

हिस्टोग्राम को नोइज़ियर की तरफ से गुज़रना चाहिए (आँख को आवश्यक चौरसाई करने दें)। मैं लगभग हमेशा (या अधिक) इस प्रकार के नियमों को देने वाली डिफ़ॉल्ट संख्या को दोगुना करता हूं। इसलिए मैं 1.06 या 0.9 का उपयोग नहीं करूंगा, मैं 0.5 के आसपास कुछ का उपयोग करना चाहूंगा, शायद वास्तव में बड़े नमूना आकार में कम।

उनके बीच चयन करने के लिए वास्तव में बहुत कम है, क्योंकि वे दोनों बहुत कम डिब्बे देते हैं यह जानने के लिए कि डेटा में क्या चल रहा है (जिस पर, कम से कम छोटे आकार के नमूने हैं, यहां देखें)

[१]: स्कॉट, डीडब्ल्यू (१ ९, ९), "इष्टतम और डेटा-आधारित हिस्टोग्राम पर," बायोमेट्रिक , 66 , 605-610।


SciPy दस्तावेज़ के अनुसार यहाँ , स्कॉट नियम है: n ** (- 1./(d+4))। कोड को देखकर, मैंने पाया कि मैंने नियम को "scotts_factor" के समान समझा। आप सही हैं कि बैंडविड्थ बहुत बड़ा है। मैं संख्यात्मक बैंडविड्थ चयन के बारे में एक नया प्रश्न खोलूंगा। धन्यवाद।
xrfang 6

जब आप एकतरफा डेटा ( ) कर रहे हैं , तो उपरोक्त सूत्र में भाग है। लेकिन यह डेटा में परिवर्तनशीलता को ध्यान में नहीं रखता है (जैसा कि ऊपर द्वारा मापा गया है), और न ही वितरण के लिए एक शब्द जिसे आप पास करने की कोशिश कर रहे हैं (जिसे मैंने ऊपर कहा है, जैसे 1.059 कारक)। यह सिर्फ यह है कि बैंडविड्थ को नमूना आकार के साथ कैसे बदलना चाहिए, न कि स्थिरांक द्वारा इसे गुणा किया जाना चाहिए। n - 1 / 5सीd=1n1/5Ac
Glen_b -Reinstate मोनिका

@ Glen_b-ReinstateMonica क्या आप यहाँ पोस्ट किए गए प्रश्न पर एक नज़र डाल सकते हैं ? मैं दिखाता हूं कि सिल्वरमैन का नियम तब लागू हो सकता है जब एक बड़े नमूने के आकार का उपयोग किया जाता है। क्या आप इसका जवाब दे सकते हैं कि क्या चल रहा है?
user269666
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.