रिकॉर्डिंग में सिग्नल क्लिपिंग का पता लगाने के अच्छे तरीके क्या हैं?


32

एक रिकॉर्डिंग को देखते हुए मुझे यह पता लगाने की आवश्यकता है कि क्या कोई क्लिपिंग हुई है।

क्या मैं सुरक्षित रूप से यह निष्कर्ष निकाल सकता हूं कि यदि कोई (एक) नमूना अधिकतम नमूना मूल्य तक पहुँचता है तो क्लिपिंग थी, या मुझे अधिकतम स्तर पर बाद के नमूनों की एक श्रृंखला की तलाश करनी चाहिए?

रिकॉर्डिंग 16 या 24-बिट ए / डी कन्वर्टर्स से ली जा सकती है, और फ़्लोटिंग पॉइंट वैल्यू से बदलकर । यदि यह रूपांतरण या से एक विभाजन का रूप लेता है , तो संभवतः नकारात्मक चोटियां -1 से कुछ कम हो सकती हैं, और मूल्य -1 के नमूने कतरन नहीं हैं?1...121512231

जाहिर है कि कोई व्यक्ति विशेष रूप से कतरन पहचान एल्गोरिथ्म को हराने के लिए विशेष रूप से एक संकेत बना सकता है, लेकिन मैं भाषण, संगीत, साइन तरंगों या गुलाबी / सफेद शोर की रिकॉर्डिंग देख रहा हूं।


8
ध्यान रखें कि क्लिपिंग स्तर हमेशा डिजिटल अधिकतम नहीं होता है। यदि एनालॉग सर्किटरी (या यहां तक ​​कि एडीसी के एनालॉग पक्ष) में डिजिटल अधिकतम की तुलना में थोड़ा कम कतरन स्तर है, तो यह जल्दी से क्लिप करेगा। यदि यह एनालॉग में क्लिप करता है और फिर कुछ फ़िल्टरिंग से गुजरता है, तो यह एक सीधी रेखा भी नहीं होगी। आपको किन परिदृश्यों का पता लगाने की आवश्यकता है?
एंडोलिथ

1
रिकॉर्डिंग एक पीसी साउंडदेविस (आमतौर पर यूएसबी के माध्यम से जुड़े) के साथ बनाई जाती है। ज्यादातर वे एक स्वीप या एमएलएस उत्तेजना के जवाब होते हैं और एक कमरे की आवेग प्रतिक्रिया की गणना करने के लिए उपयोग किया जाता है। मैं हार्डवेयर को नियंत्रित नहीं करता हूं, इसलिए उत्तेजना आउटपुट पर क्लिपिंग भी हो सकती है। पहले ऐसा नहीं सोचा था, लेकिन मुझे खुशी है कि आपने इसके बारे में सोचा।
हान

जवाबों:


30

मैं एक उत्तर टाइप करने के बीच में था, बिल्कुल योदा की तरह । वह शायद सबसे विश्वसनीय है लेकिन, मैंने एक अलग समाधान प्रस्तावित किया है ताकि आपके पास कुछ विकल्प हों।


यदि आप अपने सिग्नल का हिस्टोग्राम लेते हैं, तो आप सिग्नल प्रकार के आधार पर आकार की तरह घंटी या त्रिकोण की संभावना से अधिक होंगे। स्वच्छ संकेत इस पैटर्न का पालन करेंगे। कई रिकॉर्डिंग स्टूडियो एक "लाउडनेस" प्रभाव जोड़ते हैं जो शीर्ष के पास थोड़ा टक्कर का कारण बनता है, लेकिन यह अभी भी कुछ हद तक चिकनी दिख रहा है। यहाँ एक प्रमुख संगीतकार के वास्तविक गीत का एक उदाहरण दिया गया है:

हिस्टोग्राम

यहाँ संकेत का हिस्टोग्राम है जो योडा अपने उत्तर में देता है:

बिना क्लिपिंग वाला हिस्टोग्राम

और अब उनके कतरन होने का मामला:

कतरन के साथ हिस्टोग्राम

इस पद्धति को कई बार मूर्ख बनाया जा सकता है, लेकिन आपके टूल बैग में ऐसी स्थितियों के लिए फेंकना कम से कम कुछ है जो एफएफटी विधि आपके लिए काम नहीं करती है या आपके पर्यावरण के लिए बहुत अधिक संगणना है।


2
यह एक पागल भयानक प्रभाव है। बहुत ही रोचक।
Kortuk

मुझे खुशी है कि आपने यह तरीका सुझाया। मुझे इसे स्वयं शामिल करना चाहिए था ...
PearsonArtPhoto

मैं कहता हूं कि विशेष रूप से क्योंकि यह सबसे अधिक लागू करने वाला तरीका है। यह दिए गए अन्य विकल्पों में से एक अनुप्रयुक्त रूप है, लेकिन ऐसा लगता है कि "त्रुटि" संकेत बहुत अधिक स्पष्ट है।
कोर्तुक

1
हो सकता है कि पहले संकेत का निरपेक्ष मान लिया जाए और एक चिकनी एकतरफा हिस्टोग्राम प्राप्त किया जाए
Endolith

मेरी उंगलियों को अपने संकेतों पर इसे आज़माने में खुजली होती है। धन्यवाद।
हान

20

यदि आप छोटी रिकॉर्डिंग के साथ काम कर रहे हैं तो इसका सबसे सरल उत्तर यह है कि आप इसे सुनें और प्लेबैक में "पॉप" (शॉर्ट स्पाइक्ड साउंड) का पता लगाएं। हालांकि, रिकॉर्डिंग का आवृत्ति स्पेक्ट्रम का विश्लेषण करने के लिए एक अधिक मजबूत समाधान है।

याद रखें कि जब कोई सिग्नल किसी थ्रेसहोल्ड पर चढ़ जाता है, तो यह स्थानीय रूप से क्लिप्ड क्षेत्रों में एक स्क्वायर वेव जैसा दिखता है। यह आवृत्ति स्पेक्ट्रम में उच्च हार्मोनिक्स का परिचय देता है जो मूल रूप से नहीं होता। यदि आपका सिग्नल बैंडलीडेड है (अधिकांश वास्तविक विश्व सिग्नल हैं) और आप Nyquist दर के ऊपर अच्छी तरह से नमूना ले रहे हैं, तो यह दिन के रूप में काफी स्पष्ट है।

यहां MATLAB में एक छोटा उदाहरण यह प्रदर्शित करता है। यहां, मैं 1s अवधि का एक बैंडलेड सिग्नल बनाता हूं, जिसे 1000Hz पर सैंपल किया गया है, और फिर इसे बीच में क्लिप करें ±0.8(नीचे आकृति में शीर्ष प्लॉट देखें)

time = 0:0.001:1;
cleanSignal = sin(2*pi*75*time).*chirp(time,50,1,200);
clippedSignal = min(abs(cleanSignal),0.8).*sign(cleanSignal);

यहाँ छवि विवरण दर्ज करें

आप स्पष्ट रूप से देख सकते हैं कि मूल, आवृत्तिहीन तरंग की आवृत्ति स्पेक्ट्रम साफ है और बैंडविड्थ (नीचे बाएं) के बाहर शून्य पर जाती है, जबकि क्लिप्ड सिग्नल में स्पेक्ट्रम का एक सामान्य मामूली विरूपण होता है (उम्मीद की जाती है कि क्लिप किया गया है) और सबसे महत्वपूर्ण रूप से, सिग्नल के बैंडविड्थ के बाहर स्पेक्ट्रम में उच्च हार्मोनिक्स / स्पाइक्स / गैर-शून्य योगदान (नीचे दाएं)।

यह आम तौर पर एक बेहतर दृष्टिकोण हो सकता है, क्योंकि मूल्यों को देखकर कतरन का पता लगाना आम तौर पर सटीक नहीं होता है जब तक कि आप उपकरण को स्वयं डिज़ाइन नहीं करते हैं और सटीक रूप से सीमा का मूल्य जानते हैं।


1
मेरे कुछ संकेत (विशेष रूप से एमएलएस) सही न्युकिस्ट आवृत्ति तक जाते हैं। इसलिए यह विधि मेरे लिए हमेशा लागू नहीं होती है।
हान

@yoda हाथ में तमाशा के साथ, फिर कैसे कोई बताता है कि एक स्पेक्ट्रम 'गंदा' है जैसा आपने संकेत दिया है? क्या परीक्षण एक प्रदर्शन कर सकता है?
स्पेसी

9

इसका थोड़ा सा रिकॉर्ड की विधि पर निर्भर करता है। ऐसा लगता है कि आप केवल 1 कनवर्टर का उपयोग कर रहे हैं, जो कुछ हद तक चीजों को सरल करता है।

आपको कुछ सीमा के ऊपर और विशेष रूप से एक दूसरे के बगल में एक से अधिक बिंदु के लिए कुछ भी देखना चाहिए। आमतौर पर, ए / डी कन्वर्टर्स वास्तव में उनके अधिकतम मूल्य तक नहीं पढ़ते हैं जब तक कि आप इसे बहुत सटीक रूप से परीक्षण नहीं करते हैं, इसलिए यह महसूस करें कि अधिकतम मूल्य संभव से कम हो सकता है।

आपके मापदंडों को देखते हुए, मैं .98 या नीचे -.98 से ऊपर के लगातार संकेतों की तलाश करूँगा, यह निर्धारित करने के लिए कि क्या इष्टतम सीमा होनी चाहिए (मैं इसे नीचे नहीं लाऊंगा। 9)। यह अधिकतम पर एक का पता लगाने के लिए बुद्धिमान हो सकता है, और कुछ की तरह एक और करीब से ।8।

1 विशिष्ट माप को नजरअंदाज करने का कारण यह है कि स्पाइक्स का होना आम है जिसका संकेत से कोई लेना-देना नहीं है। यह उस स्थिति में कम हो जाएगा जब आप एक ज्ञात अच्छे ए / डी कनवर्टर का उपयोग कर रहे हैं। यह संभावना है कि यदि आप डिटेक्टरों की एक सरणी का उपयोग कर रहे हैं, या एक छवि, कि डिटेक्टरों में से कुछ खराब होगा, संभवतः अक्सर क्लिपिंग।


बहुत व्यावहारिक सलाह यहाँ। @ कालेनजब के दृष्टिकोण के साथ मिलकर मुझे इस पर अमल करने के लिए पर्याप्त देना चाहिए।
हान

3

एमएलएस (अधिकतम लंबाई अनुक्रम) विशेष रूप से कतरन के लिए विश्लेषण करने के लिए मुश्किल हैं। उनका क्रेस्ट फैक्टर (= पीक / आरएमएस) 1 के बहुत करीब है, जो साइन लहर की तुलना में तीन डीबी छोटा है। कई डी / ए कन्वर्टर्स को सबसे खराब स्थिति के रूप में साइन लहर लेने के लिए डिज़ाइन किया गया है और पूर्ण आयाम पर खेला जाने वाला एमएलएस आसानी से डी / ए के आउटपुट इंटरपोलेशन सर्किट को क्लिप कर सकता है।

अगली समस्या यह है कि एक क्लिप्ड एमएलएस एक गैर-क्लिप्ड के लगभग समान दिखता है क्योंकि एम्पलीट्यूड लगभग सभी + -पेक पहले स्थान पर हैं। साथ ही पीडीएफ विश्लेषण काम नहीं करता है क्योंकि एक एमएलएस का पीडीएफ किनारों पर बस दो बड़ी चोटियां हैं।

एक विशिष्ट कमरे में प्रतिसाद प्रतिक्रिया माप में, सबसे अधिक संभावना कतरन बिंदु वास्तव में डी / ए, amp, या स्पीकर है। एक बार जब यह कमरे के माध्यम से मिल गया तो यह एमएलएस की तरह बहुत कम दिखता है और इसके बाद ऊपर वर्णित विधियों के साथ कतरन का आकलन करना आसान है।

लगभग सभी ध्वनिक मापों में शोर तल माइक्रोफोन या पृष्ठभूमि शोर के आत्म शोर द्वारा निर्धारित किया जाता है न कि ए / डी। इसलिए ए / डी में इनपुट लाभ का अनुकूलन करना बहुत महत्वपूर्ण नहीं है और क्लिपिंग (10 डीबी या तो) से पहले पर्याप्त हेड रूम को छोड़ना पूरी तरह से ठीक है।

आमतौर पर विभिन्न उत्तेजना स्तरों की संख्या के साथ माप करना और माप के एसएनआर को देखना एक अच्छा विचार है। निम्न स्तरों पर ध्वनिक पृष्ठभूमि का शोर हावी होता है और उच्च स्तर पर कुछ सीमित, संपीड़ित या क्लिप होता है। एक अच्छा माप बनाने की चाल बीच में एक अच्छा स्थान खोजने के लिए है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.