लोगों के कान ध्वनि सुन सकते हैं जिनकी आवृत्तियों 20 हर्ट्ज से 20 किलोहर्ट्ज़ तक होती हैं। Nyquist प्रमेय के आधार पर, रिकॉर्डिंग दर कम से कम 40 kHz होनी चाहिए। क्या यह 44.1 kHz चुनने का कारण है?
लोगों के कान ध्वनि सुन सकते हैं जिनकी आवृत्तियों 20 हर्ट्ज से 20 किलोहर्ट्ज़ तक होती हैं। Nyquist प्रमेय के आधार पर, रिकॉर्डिंग दर कम से कम 40 kHz होनी चाहिए। क्या यह 44.1 kHz चुनने का कारण है?
जवाबों:
यह सच है कि, किसी भी सम्मेलन की तरह, 44.1 kHz की पसंद एक ऐतिहासिक दुर्घटना की तरह है। कुछ अन्य ऐतिहासिक कारण हैं।
यदि आप 20 kHz की बैंडविड्थ के साथ उच्च गुणवत्ता वाले ऑडियो चाहते हैं, तो निश्चित रूप से, नमूना दर 40 kHz से अधिक होनी चाहिए।
इसे 48.0 किलोहर्ट्ज़ बनाने की चर्चा थी (यह 24 फ्रेम / दूसरी फिल्मों और नॉर्थ अमेरिकन टीवी में ओस्टेंसिबल 30 फ्रेम / सेकंड के साथ अच्छी तरह से बधाई थी), लेकिन 120 मिमी के भौतिक आकार को देखते हुए, कितने डेटा की सीमा थी CD धारण कर सकता है और यह देखते हुए कि एक त्रुटि का पता लगाने और सुधार योजना की आवश्यकता थी और इसके लिए डेटा में कुछ अतिरेक की आवश्यकता होती है , सीडी जितना तार्किक डेटा संग्रहीत कर सकता है (लगभग 700 एमबी) भौतिक डेटा की मात्रा का लगभग आधा है। इन सभी को देखते हुए, 48 kHz की दर से, हमें बताया गया था कि यह बीथोवेन के सभी 9 वें को नहीं पकड़ सकता है, लेकिन यह थोड़ा धीमा दर पर पूरे 9 वें को एक डिस्क पर पकड़ सकता है । तो 48 kHz बाहर है।
फिर भी, ४४.१ और ४४.० या ४५.० kHz या कुछ अच्छा गोल संख्या क्यों नहीं?
उस समय, 1970 के दशक के उत्तरार्ध में सोनी एफ 1 नामक एक उत्पाद मौजूद था, जिसे आसानी से उपलब्ध वीडियो टेप (बेटमैक्स, वीएचएस नहीं) पर डिजिटल ऑडियो रिकॉर्ड करने के लिए डिज़ाइन किया गया था। वह 44.1 kHz (या अधिक सटीक 44.056 kHz) पर था। तो यह एफ 1 से सीडी या अन्य दिशा में, पुन: नमूनाकरण और प्रक्षेप के बिना रिकॉर्डिंग को स्थानांतरित करना आसान बना देगा।
मेरी समझ यह है कि कैसे वहाँ हो जाता है कि NTSC टीवी की क्षैतिज स्कैन दर 15.750 kHz थी और 44.1 kHz बिल्कुल 2.8 गुना है। मुझे पूरी तरह यकीन नहीं है, लेकिन मेरा मानना है कि इसका मतलब यह है कि आपके पास क्षैतिज रेखा प्रति तीन स्टीरियो नमूना जोड़े हो सकते हैं, और हर 5 लाइनों के लिए, जहां आपके पास सामान्य रूप से 15 नमूने होंगे, कुछ के लिए 14 नमूने और एक अतिरिक्त नमूना हैं एफ 1 में समता की जाँच या अतिरेक। 5 लाइनों के लिए 14 नमूने क्षैतिज रेखा के अनुसार 2.8 नमूने और प्रति सेकंड 15,750 लाइनों के साथ समान हैं, जो प्रति सेकंड 44,100 नमूने हैं।
अब, चूंकि रंगीन टीवी पेश किया गया था, इसलिए उन्हें क्षैतिज रेखा की दर से 15734 लाइनों प्रति सेकंड से थोड़ा नीचे जाना पड़ा। यह समायोजन Sony F1 में प्रति सेकंड 44,056 नमूनों की ओर जाता है।
उदाहरण के लिए http://www1.cs.columbia.edu/~hgs/audio/44.1.html देखें । एंटी-अलियासिंग फिल्टर के कारण आपको नमूना दर 40 kHz से अधिक होना चाहिए। फिल्टर के रिपीशन ढलान के कारण सिग्नल विरूपण को रोकने के लिए आपके पास आवृत्ति में कुछ आरक्षित होना चाहिए। सोनी कॉर्प द्वारा 44.1 kHz के वास्तविक मूल्य का सुझाव दिया गया था जब 1979 में ऑडियो रिकॉर्डिंग मानक चर्चा में था। उन्होंने इस दर का व्यापक रूप से उपयोग किया।
तो यह आम तौर पर ऐतिहासिक कारण है।
डिजिटल प्रारूपों के लिए संक्रमण में, ऑडियो को एक छद्म वीडियो तरंग में संग्रहीत किया गया था जिसे या तो काले या सफेद (बाइनरी प्रारूप का प्रतिनिधित्व करते हुए) के रूप में देखा जा सकता है।
टेलीविजन मानक द्वारा उपयोग की जाने वाली फ़ील्ड दर और संरचना 60 हर्ट्ज वीडियो के लिए निम्नानुसार है: प्रति फ़ील्ड 245 लाइनें (पहले 35 रिक्त लाइनों को छोड़कर)। प्रति लाइन तीन नमूनों के साथ जो 60 x 245 x 3 = 44100 = 44.1 KHz बनाता है।
इस कन्वेंशन को बाद में सीडी प्रारूप के लिए उपयोग किया गया था, उपकरण संगतता चिंताओं के कारण (सीडी प्रतिकृति के लिए उपयोग किए जाने वाले सीडी स्वामी का उत्पादन करने के लिए उपयोग किए जाने वाले पहले उपकरण वीडियो आधारित थे)।
ऐसा लगता है कि मनुष्यों के लिए सुरीली सीमा 20kHz से बहुत अधिक हो सकती है, अगर इसे विशिष्ट स्थिर साइनसोइडल तरंगों के बजाय "गतिशील" समय संकल्प परिप्रेक्ष्य से देखा जाए। पुनर्निर्माण फ़िल्टरिंग के लिए 20kHz और 22 kHz के बीच मार्जिन के बारे में भी दिलचस्प टिप्पणियां। वास्तव में समय-डोमेन अनुकूलित फ़िल्टरिंग पर पीटर क्रेवन से क्वि दिलचस्प काम हुआ है जो हाई-फाई प्लेबैक के लिए कम से कम 96kHz के लिए तर्क देता है।
पावेल
https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Nyquist-Shannon का नमूना प्रमेय कहता है कि नमूना आवृत्ति पुन: उत्पन्न करने की अधिकतम आवृत्ति से दोगुनी से अधिक आवृत्ति होनी चाहिए। चूंकि मानव श्रवण सीमा लगभग 20 हर्ट्ज से 20,000 हर्ट्ज तक है, इसलिए नमूने की दर 40 kHz से अधिक होनी चाहिए।
इसके अलावा, संकेतों को एलियासिंग से बचने के लिए नमूना लेने से पहले कम-पास फ़िल्टर किया जाना चाहिए। जबकि एक आदर्श कम-पास फ़िल्टर पूरी तरह से 20 kHz से नीचे आवृत्तियों को पारित करेगा (उन्हें ध्यान दिए बिना) और 20 kHz से ऊपर की आवृत्तियों को पूरी तरह से काट देगा, ऐसा आदर्श फ़िल्टर सैद्धांतिक रूप से असंभव है (यह गैर-कारण है), इसलिए व्यवहार में एक संक्रमण बैंड आवश्यक है, जहाँ आवृत्तियों को आंशिक रूप से देखा जाता है। यह संक्रमण बैंड जितना व्यापक है, एंटी-अलियासिंग फिल्टर बनाना उतना ही आसान और अधिक किफायती है। 44.1 kHz नमूनाकरण आवृत्ति 2.05 kHz संक्रमण बैंड के लिए अनुमति देती है।
इसके अलावा, 44,100 पहले चार अभाज्य संख्याओं (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) के वर्गों का उत्पाद है और इसलिए कई उपयोगी छोटे कारक हैं।
विवरण के लिए [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone देखें । .A प्रमेय को न्यक्विस्ट सैंपलिंग प्रमेय कहा जाता है कि गुणवत्ता के महत्वपूर्ण नुकसान के बिना एक्स हर्ट्ज के एक संकेत का नमूना करने के लिए, आपको 2X आवृत्ति पर नमूना करने की आवश्यकता है। मानव सुनवाई की सीमा लगभग 20kHz है, इसलिए इसके लिए लगभग 40Khz की एक नमूना दर की आवश्यकता होती है। यही कारण है कि सीडी को 44 khz पर नमूना लिया जाता है। यानी सीडी में रिकॉर्डिंग के प्रत्येक सेकंड में रिकॉर्डिंग में निहित उच्चतम संभव आवृत्ति के 44,000 माप शामिल हैं।