असतत फूरियर रूपांतरण - मौलिक जल्दी से खोज रहे हैं?


9

सबसे पहले, मैं माफी माँगता हूँ क्योंकि मैं एक सॉफ्टवेयर डेवलपर हूँ और यह एक बहुत लंबा समय है जब मैंने शुद्ध गणित में गोता नहीं लगाया है, इसलिए मेरा प्रश्न गूंगा लग सकता है। मुझे आशा नहीं है।

संदर्भ संगीत में पिच की मान्यता है।

यदि आप एक संगीत नोट लेते हैं, और उसके लिए एक फूरियर ट्रांसफॉर्म लागू करते हैं, तो आपके पास दिए गए आवृत्तियों के लिए आयामों के अनंत योग होंगे। उदाहरण के लिए, अगर मैं एक नोट खेलता हूं जिसका मौलिक हैएफ, किसी भी उपकरण पर, फूरियर रूपांतरण के बाद, मेरे पास हार्मोनिक्स होगा एफ,2एफ,3एफ,...,nएफ। हर आवृत्ति में एक दिया गया आयाम होगा जो उपकरण के समय को परिभाषित करता है (पियानो, आवाज, तुरही, ... सभी इस लूप का अनुसरण करते हैं, लेकिन आपके पास हर हार्मोनिक के लिए अलग-अलग आयाम होंगे)

अब मैं जो करना चाहता हूं वह एक दिए गए ऑडियो सिग्नल से है, खोजें एफ। बस कि। यह अधिक जटिल है क्योंकि ऐसा लगता है कि आप हमेशा पृष्ठभूमि शोर और इतने पर होंगे ... आगे और अधिक,एफ उच्चतम आयाम के साथ आवृत्तियों की आवश्यकता नहीं है!

तो खोजने के लिए मेरा विचार एफ एक डीएफटी लागू करना है (अच्छी तरह से वास्तव में गति के लिए एक एफएफटी) और एक उन्मादीता ढूंढें एफ, ताकि एफ+2एफ+3एफ+...+nएफ एफएफटी आउटपुट में अधिकतम है।

क्या आपको लगता है कि यह संभव है? क्या आपको लगता है कि यह बहुत कम समय में संभव है (मान लीजिए <5 मिलीसेकंड)?


संभवतः यह एक उत्तर हो सकता है: edaboard.com/thread197897.html

ठीक है, हाँ, लेकिन यह एक अलग तरीका है? IMHO, यह आसान है, लेकिन बहुत कम विश्वसनीय है क्योंकि यह हार्मोनिक और
इनहेरोनिक

प्रासंगिक dsp.stackexchange.com/a/2524/29
endolith

जवाबों:


6

आप जो वर्णन कर रहे हैं, वह पिच आकलन के हार्मोनिक उत्पाद स्पेक्ट्रम विधि के समान है, जैसा कि इस स्टैनफोर्ड सीसीआरएमए पेपर में सूचीबद्ध है ।

एक एफएफटी आपको "आयामों का अनंत योग" नहीं देता है, लेकिन एफएफटी की लंबाई के आधार पर परिणाम डिब्बे की एक सीमित संख्या होती है।

5 mS 200 Hz नोट की केवल 1 अवधि है, और 200 Hz से कम की अवधि का केवल एक अंश है। संगीतमय पिच की पहचान के लिए आमतौर पर पीड्ड साउंड की आवधिकता के कई समय की सुनवाई या विश्लेषण की आवश्यकता होती है। और बहुत सारे संगीत G2 के नीचे नोट्स का उपयोग करते हैं। यदि आपके पास डेटा की पर्याप्त लंबाई है, तो उस डेटा से एक पिच अनुमान की गणना करना केवल एक आधुनिक पीसी या मोबाइल डिवाइस पर मिलीसेकंड के बजाय माइक्रोसेकंड के आदेश पर हो सकता है।


अच्छी बात। हालाँकि यदि आपके पास पहले से ही 2F और 3F है, तो आपको वास्तव में F की आवश्यकता नहीं है, क्या आपको? आपके उदाहरण में, 2F = 400 हर्ट्ज और 3 एफ = 600 हर्ट्ज, तो आप शायद यह पता लगा सकते हैं कि एफ 5 था, यहां तक ​​कि 5 एमएस की अवधि के लिए पर्याप्त ध्वनि सुनने के बिना भी, क्या आप नहीं कर सकते? इसके अलावा मैंने तरंगिका परिवर्तन के बारे में सुना। क्या आपको लगता है कि यह ऐसा करने का एक बेहतर तरीका है?
दिनाज

@ डिनीज़: पिचेड साउंड के स्रोत पर निर्भर करता है, और ओवरटोन फ़्रीक्वेंसी के वे टुकड़े वास्तव में स्थिर होते हैं या नहीं। तरंगिका एक पूरी तरह से अलग प्रश्न है।
hotpaw2

तो यह विधि "लगभग वास्तविक समय" में f0 खोजने के लिए उपयुक्त नहीं है। कला की वर्तमान स्थिति में, क्या यह संभव है कि किसी भी उपकरण के साथ, कुछ मिलीसेकंड से कम में, f0 को खोजने के लिए, या यह एक खो कारण है और मुझे अपनी खोज छोड़ देनी चाहिए? : डी
डिनीज़
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.