हम क्यों कहते हैं कि "शून्य-पेडिंग वास्तव में आवृत्ति संकल्प नहीं बढ़ाता है"


12

यहां आवृत्ति का एक साइनसोइड है f = 236.4 Hz(यह 10 मिलीसेकंड लंबा है; इसमें N=441नमूने दर पर अंक हैं fs=44100Hz) और इसका डीएफटी, शून्य-गद्दी के बिना :

यहाँ छवि विवरण दर्ज करें

डीएफटी को देखकर हम केवल एक ही निष्कर्ष दे सकते हैं: "आवृत्ति लगभग 200 हर्ट्ज है"।

यहां एक बड़ा शून्य-गद्दी के साथ संकेत और इसका डीएफटी है :

यहाँ छवि विवरण दर्ज करें

अब हम अधिक सटीक निष्कर्ष दे सकते हैं : "स्पेक्ट्रम की अधिकतम मात्रा को ध्यान से देखकर, मैं आवृत्ति 236 हर्ट्ज का अनुमान लगा सकता हूं" (मैंने ज़ूम किया और पाया कि अधिकतम 236 के पास है)।

मेरा सवाल है: हम यह क्यों कहते हैं कि "शून्य-गद्दी संकल्प नहीं बढ़ाती है" ? (मैंने इस वाक्य को बहुत बार देखा है, फिर वे कहते हैं "यह केवल प्रक्षेप कहता है")

=> मेरे उदाहरण के साथ, शून्य-पैडिंग ने मुझे अधिक सटीक रिज़ॉल्यूशन के साथ सही आवृत्ति खोजने में मदद की!


1
इस बहुत पुराने प्रश्न के बारे में सोचने का एक और तरीका: यदि आपके पास टाइम-सीरीज़ प्लॉट बिल्कुल नहीं था, लेकिन केवल 'कम-रिज़ॉल्यूशन' फफ्ट - आप इसे टाइम-सीरीज़, जीरो-पैड, और री में बदल सकते हैं -236Hz बाहर निकलने के लिए। तो, 'कम-रिज़ॉल्यूशन' फ़ॉफ़्ट में चिकनी की समान जानकारी शामिल होनी चाहिए
जोशुआ आर।

जवाबों:


19

इस संदर्भ में संकल्प की एक बहुत विशिष्ट परिभाषा है। यह पास की आवृत्तियों पर दो अलग-अलग टोन को हल करने की आपकी क्षमता को संदर्भित करता है । आपने अपने स्पेक्ट्रम अनुमान की नमूना दर में वृद्धि की है, लेकिन आपने दो टन के बीच भेदभाव करने की कोई क्षमता प्राप्त नहीं की है, उदाहरण के लिए, 236 हर्ट्ज और 237 हर्ट्ज। इसके बजाय, वे एक ही बूँद में "एक साथ पिघलेंगे", चाहे आप कितना भी शून्य-पैडिंग क्यों न करें।

बढ़ते हुए रिज़ॉल्यूशन का समाधान लंबी अवधि के लिए सिग्नल का निरीक्षण करना है, फिर एक बड़े डीएफटी का उपयोग करें। इसके परिणामस्वरूप मुख्य लॉब होंगे जिनकी चौड़ाई डीएफटी के आकार के विपरीत आनुपातिक होती है, इसलिए यदि आप लंबे समय तक निरीक्षण करते हैं, तो आप वास्तव में कई टोन की आवृत्तियों को हल कर सकते हैं जो एक दूसरे के पास हैं।

-

यह देखने के लिए कि यह कैसे चलता है, यहां दो संकेतों के जोड़ के ज़ूम-इन एफएफटी का एक प्लॉट है: आपका मूल साइनसॉइड, और एक वह जो आवृत्ति से भिन्न होता है 0 से 100 हर्ट्ज तक।

यह केवल प्लॉट (बाएं हाथ की ओर) के 100Hz अंतर के अंत की ओर है जो आप दोनों को अलग कर सकते हैं (हल कर सकते हैं)।

नीचे दिए गए कथानक को बनाने के लिए सिलेब कोड।

यहाँ छवि विवरण दर्ज करें

f = 236.4;
d = 10;
N=441;
fs=44100;
extra_padding = 10000; 

t=[0:1/fs:(d/1000-1/fs)]
ff = [0:(N+extra_padding-1)]*fs/(N+extra_padding);

x = sin(2*%pi*f*t);

XX = [];

for delta_f = [0:100];
    y = sin(2*%pi*(f+delta_f)*t);
    FFTX = abs(fft([x+y zeros(1,extra_padding)]));
    XX = [XX; FFTX];
end

mtlb_axis([0 1300 0 500])

figure(1);
clf
[XXX,YYY] = meshgrid(ff,0:100);
mesh(XXX(1:100,[50:90]),YYY(1:100,[50:90]),XX(1:100,[50:90]))

धन्यवाद ! ठीक है तो शून्य-गद्दी पास की आवृत्तियों पर दो अलग-अलग टोन को हल करने में मदद नहीं करेगी ; हालाँकि, मेरे उदाहरण में, स्पेक्ट्रम के शिखर को खोजने के लिए यह उपयोगी हो सकता है, और इस प्रकार एक स्वर की
फ़ॉन्डामेंटल

मुझे लगा कि "जीरो पैडिंग से रिज़ॉल्यूशन नहीं बढ़ता है" का मतलब होगा "आप जीरो-पेडिंग की मदद से सटीक पिच ट्रैकिंग नहीं कर सकते" (यह यहाँ सच नहीं है, उदाहरण से पता चलता है कि कुछ पिच का सटीक पता लगाना संभव है)
बसज

मुझे लगता है कि आप सही तरीके से समझते हैं। शून्य-गद्दी के अपने उपयोग हैं, जैसे कि मोटे स्पेक्ट्रम से शिखर स्थान का ठीक अनुमान। यह सिर्फ चांदी की गोली नहीं है।
जेसन आर

1
मैंने सिर्फ जीरो-पेडिंग के अलावा कुछ और कोशिश की, लेकिन संबंधित। इसके बजाय बनाने का x(n)(के साथ लंबे समय तक 0अंत में), मैं रखने x(n)लंबाई एन की, लेकिन परिवर्तन यहाँ है: के बजाय DFT(k) = \sum x(n) exp(-2*i*pi*n*k/N)के लिए k=0,1,...,N-1, मैं DFT2(k) = \sum x(n) exp(-2*i*pi*n*k/(10*N))के लिए k=0,1,...,10*N-1... यह अधिक डिब्बे (जोड़ने की तरह है 10 Nके बजाय डिब्बे Nआवृत्ति डिब्बे), लेकिन एक ही रखने x(n)लंबाई की N। अब डिब्बे 10 हर्ट्ज, 20 हर्ट्ज, ..., 100 हर्ट्ज, 110 हर्ट्ज, 120 हर्ट्ज, ..... => क्या यह शून्य-गद्दी से समान है: कोई वास्तविक अतिरिक्त रिज़ॉल्यूशन नहीं है, लेकिन केवल प्रक्षेप है?
बसज

क्या अधिक डिब्बे जोड़ना (एन के बजाय 10 एन): के DFT2(k) = \sum x(n) exp(-2*i*pi*n*k/(10*N))लिए k=0,1,...,10*N-1और समान x(n)लंबाई रखने Nसे शून्य-गद्दी की तुलना में एक ही परिणाम मिलता है: वास्तव में अधिक संकल्प नहीं, लेकिन केवल प्रक्षेप?
बसज

13

शब्द "रिज़ॉल्यूशन" के कई अर्थ हैं, जो दो अलग-अलग अर्थों का उपयोग करते समय संवाद करने की कोशिश कर रहे लोगों को भ्रमित कर सकते हैं।

ऑप्टिकल अर्थ में, एक धुँधली बूँद के बजाय पास के स्पष्ट रूप से अलग-अलग दो (या स्पेक्ट्रम में दो आसन्न चोटियों) को हल करने में सक्षम होने के कारण, शून्य-गद्दी मदद नहीं करेगी। यह सबसे अधिक संभावना है कि शून्य-पैडिंग के संकल्प का उपयोग नहीं करते हुए इसका उपयोग किया जा रहा है।

यदि संकल्प के लिए किसी की आवश्यकता के लिए वर्णक्रमीय चोटियों के बीच एक डुबकी (उदाहरण के लिए न्यूनतम 3 डीबी कम) की आवश्यकता होती है, तो संकल्प एफएफटी बिन रिक्ति की तुलना में भी कम होगा, उदाहरण के लिए एफएस / एन भी नहीं, लेकिन 2X से 3X कि, या अधिक। इस्तेमाल की गई खिड़की के आधार पर। रिज़ॉल्यूशन के लिए एक कमजोर आवश्यकता डीएफटी के ऑर्थोगोनल आधार वैक्टर, जैसे एफएस / एन की आवृत्ति रिक्ति हो सकती है।

प्लॉटिंग पॉइंट्स के संदर्भ में, हां, जीरो-पेडिंग आपको प्लॉट के अधिक अंक देगा, जैसा कि डीपीआई (प्लॉट पॉइंट्स प्रति इंच) रिज़ॉल्यूशन। इससे नेत्रगोलक द्वारा एक्स्ट्रामा को निकालना आसान हो सकता है। हालांकि वे वही बिंदु हैं जो आपको बिना किसी शून्य-पैडिंग के बहुत उच्च गुणवत्ता वाले प्लॉट इंटरपोलेशन (सिनक इंटरपोलेशन) द्वारा प्राप्त होंगे, इसलिए वे वास्तव में कोई भी जानकारी नहीं जोड़ते हैं जो कि शून्य-पैडिंग के बिना अन्यथा गणना नहीं की जा सकती थी।

पिच ट्रैकिंग के संदर्भ में, एक खिड़की वाले गैर-शून्य-गद्देदार एफएफटी परिणाम के परवलयिक या सिनक इंटरपोलेशन (एफएफटी परिणाम डिब्बे के बीच का अंतर) आपको अधिक कम्प्यूटेशनल रूप से गहन शून्य-गद्देदार एफएफटी भूखंड के रूप में अच्छा परिणाम दे सकता है। इस प्रकार शून्य-पैडिंग आपको गैर-शून्य-गद्देदार और गैर-प्रक्षेपित शिखर पिकिंग की तुलना में "बेहतर" पिच ट्रैकिंग परिणाम देता है, लेकिन अक्सर केवल प्रक्षेप का उपयोग करने की तुलना में बहुत कम कुशलता से।

यदि आप अपने उदाहरण में शोर जोड़ते हैं, लेकिन संकेत की तुलना में थोड़ा कम है, तो आप पाएंगे कि शून्य-गद्देदार शिखर गैर-शून्य गद्देदार शिखर के समान ही गलत हो सकता है। इसलिए, अधिक सामान्य मामले में, आपको पहले की तुलना में अधिक सटीकता के साथ "सही" आवृत्ति नहीं मिली होगी। शून्य-गद्दी केवल शोर के कारण गलत परिणाम को प्रक्षेपित करती है, जो एक और कारण है कि इसे संकल्प में वृद्धि नहीं करने के लिए कहा जाता है।


बस याद करने के लिए: क्या होता है अगर मेरे पास समान साइनसॉइड केवल f=236.4 hzउसी दौरान होता है, 10msलेकिन 44.1khz के बजाय fs = 192khz के साथ: क्या सच्ची आवृत्ति संकल्प तब अधिक होगा?
बसज

नमूना दर बढ़ाने से आपको अधिक उच्च आवृत्ति डिब्बे मिलेंगे, लेकिन ब्याज की किसी भी कम आवृत्ति के पास एक ही DFT बिन रिक्ति,
hotpaw2

1
क्या नमूना दर में वृद्धि से sincडीएफटी संकरा में समान वक्र बनेगा या नहीं? यदि नहीं, तो इसका तात्पर्य यह है कि नमूना दर में वृद्धि करने से रिज़ॉल्यूशन नहीं जोड़ा जाएगा ( आवृत्तियों को हल करने की क्षमता में )
बसंती

1/टीटी

आवृत्ति में Sinc की चौड़ाई समय में डेटा विंडो की चौड़ाई से संबंधित है, जीरो पैडिंग या नमूना दर को बदलना वास्तव में इसे प्रभावित नहीं करता है (अन्य जो कि नमूनाकरण या परिमाणीकरण मुद्दे हैं)।
हॉटपावर 2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.