एक और दृष्टिकोण (अधिक शब्द, कम कोड) जो मदद कर सकता है:
स्थानीय अधिकतम और मिनिमा के स्थान भी पहले व्युत्पन्न के शून्य क्रॉसिंग के स्थान हैं। आम तौर पर स्थानीय क्रॉसिमा और मिनीमा को खोजने की तुलना में शून्य क्रॉसिंग को ढूंढना बहुत आसान है।
दुर्भाग्य से, पहला व्युत्पन्न शोर को "बढ़ाना" देता है, इसलिए जब मूल डेटा में महत्वपूर्ण शोर मौजूद होता है, तो मूल डेटा के लागू होने के कुछ समय बाद ही मूल व्युत्पत्ति का सबसे अच्छा उपयोग किया जाता है।
चूँकि स्मूथिंग, सबसे सरल अर्थों में, एक कम पास फिल्टर है, एक कनवल्शन कर्नेल का उपयोग करके स्मूदी अक्सर सबसे अच्छा (अच्छी तरह से, सबसे आसानी से) किया जाता है, और "आकार" जो कर्नेल सुविधा-संरक्षण / संवर्द्धन क्षमता की एक आश्चर्यजनक मात्रा प्रदान कर सकता है। । एक इष्टतम कर्नेल खोजने की प्रक्रिया को विभिन्न प्रकार के साधनों का उपयोग करके स्वचालित किया जा सकता है, लेकिन सबसे अच्छा सरल जानवर बल हो सकता है (छोटे कर्नेल को खोजने के लिए बहुत तेज़)। एक अच्छा कर्नेल मूल डेटा को बड़े पैमाने पर विकृत कर देगा, लेकिन यह चोटियों / घाटियों के स्थान को प्रभावित नहीं करेगा।
सौभाग्य से, अक्सर एक उपयुक्त कर्नेल को एक साधारण SWAG ("शिक्षित अनुमान") के माध्यम से बनाया जा सकता है। चौरसाई कर्नेल की चौड़ाई मूल डेटा में व्यापक "अपेक्षित" चोटी की तुलना में थोड़ी चौड़ी होनी चाहिए, और इसका आकार उस चोटी (एकल-स्केल वाली तरंगिका) जैसा होगा। मीन-प्रोटेक्टिंग कर्नेल के लिए (क्या कोई अच्छा स्मूथिंग फ़िल्टर होना चाहिए) कर्नेल तत्वों का योग ठीक 1.00 के बराबर होना चाहिए, और कर्नेल को इसके केंद्र के बारे में सममित होना चाहिए (जिसका अर्थ है कि इसमें विषम संख्या में तत्व होंगे।
एक इष्टतम चौरसाई कर्नेल (या अलग-अलग डेटा सामग्री के लिए अनुकूलित गुठली की एक छोटी संख्या) को देखते हुए, चौरसाई कारक ("लाभ") की सजा कर्नेल के लिए स्केलिंग कारक बन जाता है।
चौरसाई (दृढ़ संकल्प कर्नेल लाभ) की "सही" (इष्टतम) डिग्री का निर्धारण भी स्वचालित किया जा सकता है: स्मूथ डेटा के मानक विचलन के साथ पहले व्युत्पन्न डेटा के मानक विचलन की तुलना करें। चौरसाई कैम की डिग्री में परिवर्तन के साथ दो मानक विचलन का अनुपात कैसे प्रभावी चौरसाई मूल्यों की भविष्यवाणी करने के लिए उपयोग किया जाता है। कुछ मैनुअल डेटा चलता है (जो वास्तव में प्रतिनिधि हैं) सभी की आवश्यकता होनी चाहिए।
उपरोक्त पोस्ट किए गए सभी पूर्व समाधान पहले व्युत्पन्न की गणना करते हैं, लेकिन वे इसे एक सांख्यिकीय उपाय के रूप में नहीं मानते हैं, और न ही उपरोक्त समाधान सुविधा के संरक्षण / चौरसाई को बढ़ाने के लिए (सूक्ष्म चोटियों "शोर से ऊपर" छलांग में मदद करने के लिए) का प्रयास करते हैं।
अंत में, बुरी खबर: "असली" चोटियों को ढूंढना एक शाही दर्द बन जाता है जब शोर में ऐसी विशेषताएं भी होती हैं जो वास्तविक चोटियों (ओवरलोडिंग बैंडविड्थ) की तरह दिखती हैं। अगला अधिक-जटिल समाधान आम तौर पर एक लंबी सजा कर्नेल (एक "व्यापक कर्नेल एपर्चर") का उपयोग करने के लिए है जो आसन्न "वास्तविक" चोटियों (जैसे शिखर घटना के लिए न्यूनतम या अधिकतम दर), या कई का उपयोग करने के बीच संबंध को ध्यान में रखता है। कन्वेक्शन अलग-अलग चौड़ाई वाली गुठली का उपयोग करके गुजरता है (लेकिन केवल अगर यह तेज है: यह एक मौलिक गणितीय सत्य है कि अनुक्रम में किए गए रैखिक संकेंद्रण हमेशा एक एकल संकेतन में एक साथ दोषी ठहराए जा सकते हैं)। लेकिन अक्सर उपयोगी गुठली (अलग-अलग चौड़ाई के) का एक क्रम ढूंढना आसान होता है और उन्हें एक साथ जोड़कर इसे हल करना होता है, सीधे एक ही चरण में अंतिम कर्नेल को खोजने के लिए।
उम्मीद है कि यह Google (और शायद एक अच्छा आँकड़े पाठ) को अंतराल में भरने के लिए पर्याप्त जानकारी प्रदान करता है। मैं वास्तव में कामना करता हूं कि मेरे पास काम करने के लिए एक उदाहरण या एक लिंक उपलब्ध कराने का समय है। अगर किसी को एक ऑनलाइन भर आता है, तो कृपया इसे यहाँ पोस्ट करें