अब, मैं बताना चाहूंगा कि भाषण में कितनी आवृत्ति होती है। हालांकि, मुझे यकीन नहीं है कि ऐसा करने का सबसे अच्छा तरीका क्या होगा। ऐसा लगता है कि कभी-कभी कोई फूरियर रूपांतरण के निरपेक्ष मूल्य की गणना करता है, और कभी-कभी पावर स्पेक्ट्रल घनत्व।
यदि आप अपने विश्लेषण में भौतिक अर्थ संलग्न करना चाहते हैं, तो पावर स्पेक्ट्रल घनत्व, (पीएसडी) के साथ जाएं। ऐसा इसलिए है क्योंकि यह आपको प्रत्येक आवृत्ति बैंड में बस अपने सिग्नल की शक्ति देगा। दूसरी ओर यदि आप भौतिक अर्थ के बारे में नहीं चाहते / परवाह करते हैं, लेकिन यह जानना चाहते हैं कि प्रत्येक बैंड के फूरियर आयाम एक-दूसरे के सापेक्ष कैसे भिन्न होते हैं, तो आप पूर्ण परिमाण से चिपक सकते हैं।
व्यवहार में, आप PSD को फूरियर रूपांतरण के पूर्ण परिमाण के रूप में गणना कर सकते हैं। उदाहरण के लिए, यदि आपका संकेत , और इसका DFT , तो DFT का पूर्ण परिमाण, जबकि PSD है ।x[n]X(f)|X(f)||X(f)|2
अगर मैं सही ढंग से समझूं, तो बाद वाला काम करता है ताकि मैं अपने सिग्नल को भागों में बाँटूँ, एफएफटी को पार्ट-बाय-पार्ट करूँ और किसी तरह इनको योग करूँ। विंडो फ़ंक्शंस किसी भी तरह शामिल हैं। क्या आप मेरे लिए इसे थोड़ा स्पष्ट कर सकते हैं? मैं डीएसपी के लिए नया हूं।
नहीं, यह सच नहीं है। आप यहां जिस बारे में बात कर रहे हैं, वह शॉर्ट टाइम फूरियर ट्रांसफॉर्म (STFT) को संदर्भित करता है । यह बस आपके समय डोमेन सिग्नल को काट रहा है, इसे चौड़ा कर रहा है, और फिर फूरियर ट्रासफॉर्म ले रहा है। हालांकि दिन के अंत में, आपके पास अभी भी एक जटिल मैट्रिक्स होगा। यदि आप इसका पूर्ण परिमाण लेना चुनते हैं, तो आपके पास पूर्ण परिमाण फूरियर रूपांतरण मैट्रिक्स होगा। यदि आप इसका पूर्ण परिमाण चुकता करते हैं, तो आपके पास एक पावर स्पेक्ट्रल घनत्व मैट्रिक्स होगा।