सबसे पहले, मैं माफी माँगता हूँ क्योंकि मैं एक सॉफ्टवेयर डेवलपर हूँ और यह एक बहुत लंबा समय है जब मैंने शुद्ध गणित में गोता नहीं लगाया है, इसलिए मेरा प्रश्न गूंगा लग सकता है। मुझे आशा नहीं है।
संदर्भ संगीत में पिच की मान्यता है।
यदि आप एक संगीत नोट लेते हैं, और उसके लिए एक फूरियर ट्रांसफॉर्म लागू करते हैं, तो आपके पास दिए गए आवृत्तियों के लिए आयामों के अनंत योग होंगे। उदाहरण के लिए, अगर मैं एक नोट खेलता हूं जिसका मौलिक है, किसी भी उपकरण पर, फूरियर रूपांतरण के बाद, मेरे पास हार्मोनिक्स होगा । हर आवृत्ति में एक दिया गया आयाम होगा जो उपकरण के समय को परिभाषित करता है (पियानो, आवाज, तुरही, ... सभी इस लूप का अनुसरण करते हैं, लेकिन आपके पास हर हार्मोनिक के लिए अलग-अलग आयाम होंगे)
अब मैं जो करना चाहता हूं वह एक दिए गए ऑडियो सिग्नल से है, खोजें । बस कि। यह अधिक जटिल है क्योंकि ऐसा लगता है कि आप हमेशा पृष्ठभूमि शोर और इतने पर होंगे ... आगे और अधिक, उच्चतम आयाम के साथ आवृत्तियों की आवश्यकता नहीं है!
तो खोजने के लिए मेरा विचार एक डीएफटी लागू करना है (अच्छी तरह से वास्तव में गति के लिए एक एफएफटी) और एक उन्मादीता ढूंढें , ताकि एफएफटी आउटपुट में अधिकतम है।
क्या आपको लगता है कि यह संभव है? क्या आपको लगता है कि यह बहुत कम समय में संभव है (मान लीजिए <5 मिलीसेकंड)?