मैं यथासंभव सटीक रूप से संगीत का विश्लेषण करने की कोशिश कर रहा हूं। बेशक मैंने एफएफटी की कोशिश की, लेकिन कुछ समस्याएं आईं।
मैंने पाया कि कम आवृत्तियों के पास मानव सुनवाई की तुलना में बहुत कम रिज़ॉल्यूशन है। मैंने इस समस्या को हल करने के लिए बहुत समय तक एफएफटी की कोशिश की, लेकिन 44100Hz नमूना दर (समय संकल्प की कमी का मतलब) में 8192 नमूनों / एस के साथ विश्लेषण करते हुए, मुझे कम आवृत्तियों पर पर्याप्त संकल्प नहीं मिला।
मैंने पाया कि कुछ उपाय हैं।
सबसे पहले, एफएफटी डिब्बे पर एक द्विघात प्रक्षेप।
लेकिन यह एक सही तरीका नहीं है। इस पद्धति की समस्याएं हैं:
1. 'अगर मैं फ्रीक डिब्बे के बीच फ्रीक निर्धारित करना चाहता हूं, तो मुझे कौन से तीन डिब्बे इंटरपोल करने का चयन करना चाहिए?'
2. 'यहां तक कि मैं ऐसा करता हूं, परिणाम पर कोई वास्तविक अतिरिक्त चेतावनी नहीं है। मुझे पता है कि प्रक्षेप एक तरह की मुश्किल विधि है। '
दूसरे, प्रत्येक फ्रीक डिब्बे को वांछित आवृत्ति के साथ निकालना, इसलिए मैं डिब्बे को लघुगणक रूप से निकाल सकता हूं।
लेकिन एक महत्वपूर्ण कम्प्यूटेशनल लागत समस्या है: (शायद खत्म) एन ^ 2।
तीसरा, एलएफटी (लॉगरिदमिक फूरियर ट्रांसफॉर्म)।
यह जरूरी है कि लॉगरिदमिक-स्पेल्ड सैंपल और मुझे वास्तव में तेज गति के साथ जो मैं देख रहा हूं उसका परिणाम देता है; /programming/1120422/is-there-an-fft-that-uses-a-logarithmic-division-of-frequency
लेकिन मुझे उस एल्गोरिथ्म का कोई पता नहीं है। मैंने कागज को समझने और उसे लागू करने की कोशिश की, लेकिन यह मेरी अंग्रेजी और गणितीय कौशल की कमी के कारण असंभव था।
इसलिए, मुझे LFT के कार्यान्वयन में मदद की आवश्यकता है।