फूरियर को बदलने आमतौर पर लगता है की आवृत्ति विश्लेषण के लिए प्रयोग किया जाता है। हालांकि, जब ध्वनि की मानवीय धारणा का विश्लेषण करने की बात आती है, तो इसके कुछ नुकसान हैं। उदाहरण के लिए, इसकी आवृत्ति के डिब्बे रैखिक होते हैं, जबकि मानव कान आवृत्ति पर प्रतिक्रिया करता है, रैखिक रूप से नहीं ।
फूरियर ट्रांसफॉर्म के विपरीत वेवलेट ट्रांसफॉर्म विभिन्न आवृत्ति रेंज के लिए रिज़ॉल्यूशन को संशोधित कर सकते हैं । परिणत तरंगिका के गुण , जबकि उच्च आवृत्तियों के लिए कम अस्थायी चौड़ाई को बनाए रखने के कम आवृत्तियों के लिए बड़े अस्थायी समर्थन करता है अनुमति देते हैं।
मोर्लेट तरंगिका बारीकी से सुनवाई के मानव धारणा से संबंधित है। यह संगीत प्रतिलेखन पर लागू किया जा सकता है और बहुत सटीक परिणाम पैदा करता है जो फूरियर रूपांतरण तकनीकों का उपयोग करना संभव नहीं है। यह प्रत्येक नोट के लिए स्पष्ट शुरुआत और समाप्ति समय के साथ दोहराए जाने वाले संगीत नोटों के छोटे फटने और बारी-बारी से कैप्चर करने में सक्षम है।
निरंतर-क्यू को बदलने (बारीकी मोर्लेट से संबंधित परिणत तरंगिका) भी है अच्छी तरह से संगीत डेटा के लिए अनुकूल । जैसा कि परिवर्तन की आउटपुट लॉग आवृत्ति के खिलाफ प्रभावी रूप से आयाम / चरण है, किसी वर्णक्रमीय सीमा को प्रभावी ढंग से कवर करने के लिए कम वर्णक्रमीय डिब्बे की आवश्यकता होती है, और यह तब उपयोगी साबित होता है जब आवृत्तियों में कई ओक्टेव्स होते हैं।
परिवर्तन उच्च आवृत्ति डिब्बे के साथ आवृत्ति संकल्प में कमी प्रदर्शित करता है, जो श्रवण अनुप्रयोगों के लिए वांछनीय है। यह मानव श्रवण प्रणाली को प्रतिबिंबित करता है, जिससे कम-आवृत्तियों पर वर्णक्रमीय रिज़ॉल्यूशन बेहतर होता है, जबकि उच्चतर आवृत्तियों पर टेम्पोरल रिज़ॉल्यूशन में सुधार होता है।
मेरा प्रश्न यह है: क्या अन्य परिवर्तन हैं जो मानव श्रवण प्रणाली की निकटता की नकल करते हैं? क्या किसी ने एक ऐसे रूपांतर को डिजाइन करने का प्रयास किया है जो शारीरिक / न्यूरोलॉजिकल रूप से मानव श्रवण प्रणाली से यथासंभव निकटता से मेल खाता हो?
उदाहरण के लिए, यह ज्ञात है कि मानव कानों में ध्वनि की तीव्रता के लिए एक लघुगणकीय प्रतिक्रिया होती है । यह भी जाना जाता है कि समान-ज़ोर वाले कंट्रोस न केवल तीव्रता के साथ, बल्कि वर्णक्रमीय घटकों की आवृत्ति में अंतर के साथ भिन्न होते हैं । कई महत्वपूर्ण बैंडों में वर्णक्रमीय घटकों वाले ध्वनियों को लाउड के रूप में माना जाता है, भले ही कुल ध्वनि दबाव स्थिर रहता हो।
अंत में, मानव कान में आवृत्ति-निर्भर सीमित अस्थायी संकल्प होता है । शायद यह भी ध्यान में रखा जा सकता है।