हम नमूनाकरण दर रिकॉर्ड करने के रूप में 44.1 kHz क्यों चुनते हैं?


21

लोगों के कान ध्वनि सुन सकते हैं जिनकी आवृत्तियों 20 हर्ट्ज से 20 किलोहर्ट्ज़ तक होती हैं। Nyquist प्रमेय के आधार पर, रिकॉर्डिंग दर कम से कम 40 kHz होनी चाहिए। क्या यह 44.1 kHz चुनने का कारण है?


4
इसे वीडियो फ्रेम दरों के साथ संगतता के लिए चुना गया था। En.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F
endolith

लगभग 12-15k से ऊपर की आवृत्तियों को कम या कोई मान नहीं दिया जाता है। 40 से अधिक लोगों की उस स्तर से ऊपर की उपयोगिता बहुत कम होगी।
क्रिस हीथ

जवाबों:


32

यह सच है कि, किसी भी सम्मेलन की तरह, 44.1 kHz की पसंद एक ऐतिहासिक दुर्घटना की तरह है। कुछ अन्य ऐतिहासिक कारण हैं।

यदि आप 20 kHz की बैंडविड्थ के साथ उच्च गुणवत्ता वाले ऑडियो चाहते हैं, तो निश्चित रूप से, नमूना दर 40 kHz से अधिक होनी चाहिए।

इसे 48.0 किलोहर्ट्ज़ बनाने की चर्चा थी (यह 24 फ्रेम / दूसरी फिल्मों और नॉर्थ अमेरिकन टीवी में ओस्टेंसिबल 30 फ्रेम / सेकंड के साथ अच्छी तरह से बधाई थी), लेकिन 120 मिमी के भौतिक आकार को देखते हुए, कितने डेटा की सीमा थी CD धारण कर सकता है और यह देखते हुए कि एक त्रुटि का पता लगाने और सुधार योजना की आवश्यकता थी और इसके लिए डेटा में कुछ अतिरेक की आवश्यकता होती है , सीडी जितना तार्किक डेटा संग्रहीत कर सकता है (लगभग 700 एमबी) भौतिक डेटा की मात्रा का लगभग आधा है। इन सभी को देखते हुए, 48 kHz की दर से, हमें बताया गया था कि यह बीथोवेन के सभी 9 वें को नहीं पकड़ सकता है, लेकिन यह थोड़ा धीमा दर पर पूरे 9 वें को एक डिस्क पर पकड़ सकता है । तो 48 kHz बाहर है।

फिर भी, ४४.१ और ४४.० या ४५.० kHz या कुछ अच्छा गोल संख्या क्यों नहीं?

उस समय, 1970 के दशक के उत्तरार्ध में सोनी एफ 1 नामक एक उत्पाद मौजूद था, जिसे आसानी से उपलब्ध वीडियो टेप (बेटमैक्स, वीएचएस नहीं) पर डिजिटल ऑडियो रिकॉर्ड करने के लिए डिज़ाइन किया गया था। वह 44.1 kHz (या अधिक सटीक 44.056 kHz) पर था। तो यह एफ 1 से सीडी या अन्य दिशा में, पुन: नमूनाकरण और प्रक्षेप के बिना रिकॉर्डिंग को स्थानांतरित करना आसान बना देगा।

मेरी समझ यह है कि कैसे वहाँ हो जाता है कि NTSC टीवी की क्षैतिज स्कैन दर 15.750 kHz थी और 44.1 kHz बिल्कुल 2.8 गुना है। मुझे पूरी तरह यकीन नहीं है, लेकिन मेरा मानना ​​है कि इसका मतलब यह है कि आपके पास क्षैतिज रेखा प्रति तीन स्टीरियो नमूना जोड़े हो सकते हैं, और हर 5 लाइनों के लिए, जहां आपके पास सामान्य रूप से 15 नमूने होंगे, कुछ के लिए 14 नमूने और एक अतिरिक्त नमूना हैं एफ 1 में समता की जाँच या अतिरेक। 5 लाइनों के लिए 14 नमूने क्षैतिज रेखा के अनुसार 2.8 नमूने और प्रति सेकंड 15,750 लाइनों के साथ समान हैं, जो प्रति सेकंड 44,100 नमूने हैं।

अब, चूंकि रंगीन टीवी पेश किया गया था, इसलिए उन्हें क्षैतिज रेखा की दर से 15734 लाइनों प्रति सेकंड से थोड़ा नीचे जाना पड़ा। यह समायोजन Sony F1 में प्रति सेकंड 44,056 नमूनों की ओर जाता है।


8

उदाहरण के लिए http://www1.cs.columbia.edu/~hgs/audio/44.1.html देखें । एंटी-अलियासिंग फिल्टर के कारण आपको नमूना दर 40 kHz से अधिक होना चाहिए। फिल्टर के रिपीशन ढलान के कारण सिग्नल विरूपण को रोकने के लिए आपके पास आवृत्ति में कुछ आरक्षित होना चाहिए। सोनी कॉर्प द्वारा 44.1 kHz के वास्तविक मूल्य का सुझाव दिया गया था जब 1979 में ऑडियो रिकॉर्डिंग मानक चर्चा में था। उन्होंने इस दर का व्यापक रूप से उपयोग किया।

तो यह आम तौर पर ऐतिहासिक कारण है।


6

डिजिटल प्रारूपों के लिए संक्रमण में, ऑडियो को एक छद्म वीडियो तरंग में संग्रहीत किया गया था जिसे या तो काले या सफेद (बाइनरी प्रारूप का प्रतिनिधित्व करते हुए) के रूप में देखा जा सकता है।

टेलीविजन मानक द्वारा उपयोग की जाने वाली फ़ील्ड दर और संरचना 60 हर्ट्ज वीडियो के लिए निम्नानुसार है: प्रति फ़ील्ड 245 लाइनें (पहले 35 रिक्त लाइनों को छोड़कर)। प्रति लाइन तीन नमूनों के साथ जो 60 x 245 x 3 = 44100 = 44.1 KHz बनाता है।

इस कन्वेंशन को बाद में सीडी प्रारूप के लिए उपयोग किया गया था, उपकरण संगतता चिंताओं के कारण (सीडी प्रतिकृति के लिए उपयोग किए जाने वाले सीडी स्वामी का उत्पादन करने के लिए उपयोग किए जाने वाले पहले उपकरण वीडियो आधारित थे)।

स्रोत: द आर्ट ऑफ़ साउंड रिप्रोडक्शन, पी। 228


अगर वह एफ 1 करता है, तो मुझे कहना होगा कि "मैं सही खड़ा हूं"। मुझे लगता है कि F1 खाली लाइनों का उपयोग कर रहा था।
रॉबर्ट ब्रिस्टो-जॉनसन

नमस्ते, मैंने अभी यहां पढ़ा है कि "NTSC M एन्कोडिंग का उपयोग सिस्टम M टेलीविज़न सिग्नल के साथ किया जाता है, जिसमें प्रति सेकंड 30 / 1.001 (लगभग 29.97) वीडियो के इंटरेक्टेड फ़्रेम होते हैं। प्रत्येक फ़्रेम दो फ़ील्ड्स से बना होता है, प्रत्येक में 262.5 शामिल होता है। कुल 525 स्कैन लाइनों के लिए स्कैन लाइनें, 483 स्कैन लाइनें दृश्य रेखापुंज बनाती हैं। शेष (ऊर्ध्वाधर रिक्त अंतराल) ऊर्ध्वाधर तुल्यकालन और पुनरावृत्ति के लिए अनुमति देता है। "
तो भी 490 पंक्तियों में से कुछ (मूल NTSC) रिक्त लाइनों का उपयोग करते हैं।
रॉबर्ट ब्रिस्टो-जॉनसन

0

ऐसा लगता है कि मनुष्यों के लिए सुरीली सीमा 20kHz से बहुत अधिक हो सकती है, अगर इसे विशिष्ट स्थिर साइनसोइडल तरंगों के बजाय "गतिशील" समय संकल्प परिप्रेक्ष्य से देखा जाए। पुनर्निर्माण फ़िल्टरिंग के लिए 20kHz और 22 kHz के बीच मार्जिन के बारे में भी दिलचस्प टिप्पणियां। वास्तव में समय-डोमेन अनुकूलित फ़िल्टरिंग पर पीटर क्रेवन से क्वि दिलचस्प काम हुआ है जो हाई-फाई प्लेबैक के लिए कम से कम 96kHz के लिए तर्क देता है।

पावेल


खैर, यह पता लगाने का एक तरीका है। इसे ब्लाइंड एबी टेस्टिंग कहा जाता है । डबल-ब्लाइंड नहीं होना चाहिए (लेकिन सामान्य रूप से)। और AB परीक्षण मेरे विचार से ABX परीक्षण से बेहतर है।
रॉबर्ट ब्रिस्टो-जॉनसन

0

https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Nyquist-Shannon का नमूना प्रमेय कहता है कि नमूना आवृत्ति पुन: उत्पन्न करने की अधिकतम आवृत्ति से दोगुनी से अधिक आवृत्ति होनी चाहिए। चूंकि मानव श्रवण सीमा लगभग 20 हर्ट्ज से 20,000 हर्ट्ज तक है, इसलिए नमूने की दर 40 kHz से अधिक होनी चाहिए।

इसके अलावा, संकेतों को एलियासिंग से बचने के लिए नमूना लेने से पहले कम-पास फ़िल्टर किया जाना चाहिए। जबकि एक आदर्श कम-पास फ़िल्टर पूरी तरह से 20 kHz से नीचे आवृत्तियों को पारित करेगा (उन्हें ध्यान दिए बिना) और 20 kHz से ऊपर की आवृत्तियों को पूरी तरह से काट देगा, ऐसा आदर्श फ़िल्टर सैद्धांतिक रूप से असंभव है (यह गैर-कारण है), इसलिए व्यवहार में एक संक्रमण बैंड आवश्यक है, जहाँ आवृत्तियों को आंशिक रूप से देखा जाता है। यह संक्रमण बैंड जितना व्यापक है, एंटी-अलियासिंग फिल्टर बनाना उतना ही आसान और अधिक किफायती है। 44.1 kHz नमूनाकरण आवृत्ति 2.05 kHz संक्रमण बैंड के लिए अनुमति देती है।

इसके अलावा, 44,100 पहले चार अभाज्य संख्याओं (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) के वर्गों का उत्पाद है और इसलिए कई उपयोगी छोटे कारक हैं।


इसलिए अगर हम अपनी यूनिट का समय दूसरे से "farg" में बदलते हैं , जो कि 1.001 सेकंड है, तो 44100 और इसके कई उपयोगी छोटे कारकों का क्या करता है?
रॉबर्ट ब्रिस्टो-जॉनसन

-2

विवरण के लिए [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone देखें । .A प्रमेय को न्यक्विस्ट सैंपलिंग प्रमेय कहा जाता है कि गुणवत्ता के महत्वपूर्ण नुकसान के बिना एक्स हर्ट्ज के एक संकेत का नमूना करने के लिए, आपको 2X आवृत्ति पर नमूना करने की आवश्यकता है। मानव सुनवाई की सीमा लगभग 20kHz है, इसलिए इसके लिए लगभग 40Khz की एक नमूना दर की आवश्यकता होती है। यही कारण है कि सीडी को 44 khz पर नमूना लिया जाता है। यानी सीडी में रिकॉर्डिंग के प्रत्येक सेकंड में रिकॉर्डिंग में निहित उच्चतम संभव आवृत्ति के 44,000 माप शामिल हैं।


खैर, वास्तव में इसकी वजह से नहीं ...
jojek

यह आंशिक रूप से इसकी वजह है। मनुष्य के लिए 20k से ऊपर सुनना दुर्लभ है, इसलिए एक श्रवण सीमा 40kHz से थोड़ा अधिक है, अर्थात 42, 43, 44. यदि आप 22k पर विशाल साइन लहरों के साथ किसी को विस्फोट करते हैं, तो केवल एक बच्चे को सुनने का मौका मिलता है। चमगादड़ 115kHz हैं और कुछ डॉल्फ़िन 150kHz पर हैं, सिवाय इसके कि पानी में, जो स्पष्ट लगता है। रिकॉर्डिंग के साथ ऑनलाइन अपनी उच्च आवृत्ति धारणा का परीक्षण करें ... यानी यहाँ audiocheck.net/audiotests_frequencycheckhigh.php
com.prehensible
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.