मैं शोध करने की कोशिश कर रहा हूं और यह पता लगाऊंगा कि इस समस्या पर हमला करने के लिए कितना अच्छा है। यह संगीत प्रसंस्करण, छवि प्रसंस्करण और सिग्नल प्रोसेसिंग को बढ़ाता है, और इसलिए इसे देखने के असंख्य तरीके हैं। मैं इसे प्राप्त करने के सर्वोत्तम तरीकों के रूप में पूछताछ करना चाहता था क्योंकि जो लोग शुद्ध सिग-प्रोक डोमेन में जटिल लग सकते हैं वे छवि या संगीत प्रसंस्करण करने वाले लोगों द्वारा सरल (और पहले से हल किए गए) हो सकते हैं। वैसे भी, समस्या इस प्रकार है:
यदि आप समस्या के मेरे हाथ को माफ करते हैं, तो हम निम्नलिखित देख सकते हैं:
उपरोक्त आंकड़े से, मेरे पास संकेतों के 3 अलग-अलग 'प्रकार' हैं। पहले एक एक नाड़ी है कि 'कदम' आवृत्ति में से की तरह करने के लिए च 4 , और फिर दोहराता है। इसकी एक विशिष्ट नाड़ी अवधि है, और एक विशिष्ट नाड़ी-पुनरावृत्ति समय है।
दूसरा वाला केवल पर मौजूद है , लेकिन इसमें नाड़ी की लंबाई कम है और तेजी से नाड़ी पुनरावृत्ति आवृत्ति है।
अंत में तीसरा एक केवल पर एक टोन है ।
समस्या यह है कि मैं किस तरह से इस समस्या से संपर्क करता हूं, जैसे कि मैं एक क्लासिफायर लिख सकता हूं जो सिग्नल -1, सिग्नल -2 और सिग्नल -3 के बीच भेदभाव कर सकता है। यही है, यदि आप इसे संकेतों में से एक को खिलाते हैं, तो यह आपको यह बताने में सक्षम होना चाहिए कि यह संकेत ऐसा है। सबसे अच्छा क्लासिफायर मुझे एक विकर्ण भ्रम मैट्रिक्स देगा?
कुछ अतिरिक्त संदर्भ और जो मैं इस प्रकार से सोच रहा हूं:
जैसा कि मैंने कहा कि यह कई क्षेत्रों में फैला है। मैं इस बात की जाँच करना चाहता था कि मेरे बैठने से पहले क्या कार्यप्रणाली मौजूद हो सकती है और इसके साथ युद्ध करना है। मैं अनजाने में पहिया का फिर से आविष्कार नहीं करना चाहता। यहाँ कुछ विचार हैं जिन्हें मैंने अलग-अलग दृष्टिकोणों से देखा है।
सिग्नल-प्रोसेसिंग स्टैंडपॉइंट: एक चीज़ जो मैंने देखी है , वह एक सेप्स्ट्रल एनालिसिस कर रही थी , और फिर संभवतः सिग्नल -3 को अन्य 2 से अलग करने में सेस्ट्रस्ट्रम के गैबोर बैंडविड्थ का उपयोग कर रही थी , और फिर सिग्नल को भेद करते हुए सेफस्ट्रम के उच्चतम शिखर को माप रही थी- सिग्नल -2 से 1 यह मेरा वर्तमान सिग्नल-प्रोसेसिंग कार्य समाधान है।
इमेज-प्रोसेसिंग स्टैंडपॉइंट: यहां मैं सोच रहा हूं क्योंकि मैं वास्तव में छवियों को स्पेक्ट्रोग्राम बना सकता हूं, शायद मैं उस क्षेत्र से कुछ लाभ उठा सकता हूं? मैं इस भाग से गहन रूप से परिचित नहीं हूं, लेकिन Hough Transform का उपयोग करके 'लाइन' का पता लगाने के बारे में क्या है , और फिर किसी तरह लाइनों की 'गिनती' (क्या होगा अगर वे लाइनें नहीं हैं और हालांकि बूँदें?) और वहां से जा रहे हैं। निश्चित रूप से किसी भी समय जब मैं एक स्पेक्ट्रोग्राम लेता हूं, तो आप देख सकते हैं कि आपको समय अक्ष के साथ स्थानांतरित किया जा सकता है, तो क्या यह मामला होगा? निश्चित नहीं...
म्यूज़िक-प्रोसेसिंग स्टैंडपॉइंट: सिग्नल प्रोसेसिंग का एक सबसेट सुनिश्चित करने के लिए, लेकिन यह मेरे साथ होता है कि सिग्नल -1 में एक निश्चित, शायद दोहराव (संगीत) की गुणवत्ता होती है, जो म्यूज़िक-प्रोक में लोग हर समय देखते हैं और पहले ही हल कर चुके होते हैं? शायद भेदभाव करने वाले यंत्र? यकीन नहीं हो रहा था, लेकिन मेरे साथ ऐसा हुआ। शायद यह स्टैंड पॉइंट, इसे देखने का सबसे अच्छा तरीका है, टाइम डोमेन का एक हिस्सा लेना और उन स्टेप-रेट्स को छेड़ना? फिर से, यह मेरा क्षेत्र नहीं है, लेकिन मुझे बहुत संदेह है कि यह कुछ ऐसा है जो पहले देखा गया है ... क्या हम सभी 3 संकेतों को विभिन्न प्रकार के संगीत वाद्ययंत्रों के रूप में देख सकते हैं?
मुझे यह भी जोड़ना चाहिए कि मेरे पास प्रशिक्षण डेटा की एक अच्छी मात्रा है, इसलिए शायद उन तरीकों में से कुछ का उपयोग करने से मुझे कुछ सुविधा निष्कर्षण करने की अनुमति मिल सकती है, जिसके साथ मैं के-नियस्ट पड़ोसी का उपयोग कर सकता हूं , लेकिन यह सिर्फ एक विचार है।
वैसे भी यह वह जगह है जहाँ मैं अभी खड़ा हूँ, किसी भी मदद की सराहना की है।
धन्यवाद!
टिप्पणियाँ पर आधारित कड़ियाँ:
पल्स पुनरावृत्ति दर और संकेतों के सभी तीन वर्गों की नाड़ी लंबाई भी सभी पहले से ज्ञात हैं। (फिर से कुछ विचरण लेकिन बहुत कम)। हालांकि कुछ कैविटीज़, नाड़ी पुनरावृत्ति दर और संकेतों 1 और 2 की लंबाई लंबाई हमेशा ज्ञात होती है, लेकिन वे एक सीमा होती हैं। सौभाग्य से, हालांकि, उन सीमाओं को ओवरलैप नहीं है।
इनपुट वास्तविक समय में आने वाली एक निरंतर समय श्रृंखला है, लेकिन हम यह मान सकते हैं कि संकेत 1, 2 और 3 परस्पर अनन्य हैं, उनमें से केवल एक ही समय में किसी भी बिंदु पर मौजूद है। समय के किसी भी बिंदु पर प्रक्रिया करने के लिए आप कितना समय लेते हैं, इस बारे में हमारे पास बहुत अधिक लचीलापन है।